summaryrefslogtreecommitdiff
path: root/ggml/src/vulkan-shaders
ModeNameSize
-rw-r--r--CMakeLists.txt1156logplain
-rw-r--r--acc.comp946logplain
-rw-r--r--add.comp826logplain
-rw-r--r--argmax.comp1290logplain
-rw-r--r--argsort.comp2011logplain
-rw-r--r--clamp.comp427logplain
-rw-r--r--concat.comp1496logplain
-rw-r--r--contig_copy.comp1515logplain
-rw-r--r--conv2d_dw.comp3172logplain
-rw-r--r--conv_transpose_1d.comp3060logplain
-rw-r--r--copy.comp619logplain
-rw-r--r--copy_from_quant.comp1380logplain
-rw-r--r--copy_to_quant.comp8054logplain
-rw-r--r--cos.comp374logplain
-rw-r--r--count_equal.comp796logplain
-rw-r--r--dequant_f32.comp442logplain
-rw-r--r--dequant_funcs.comp18617logplain
-rw-r--r--dequant_funcs_cm2.comp23374logplain
-rw-r--r--dequant_head.comp249logplain
-rw-r--r--dequant_iq1_m.comp1531logplain
-rw-r--r--dequant_iq1_s.comp1176logplain
-rw-r--r--dequant_iq2_s.comp1916logplain
-rw-r--r--dequant_iq2_xs.comp1889logplain
-rw-r--r--dequant_iq2_xxs.comp2018logplain
-rw-r--r--dequant_iq3_s.comp1497logplain
-rw-r--r--dequant_iq3_xxs.comp2045logplain
-rw-r--r--dequant_iq4_nl.comp909logplain
-rw-r--r--dequant_iq4_xs.comp1123logplain
-rw-r--r--dequant_q2_k.comp1477logplain
-rw-r--r--dequant_q3_k.comp1717logplain
-rw-r--r--dequant_q4_0.comp861logplain
-rw-r--r--dequant_q4_1.comp892logplain
-rw-r--r--dequant_q4_k.comp2677logplain
-rw-r--r--dequant_q5_0.comp1041logplain
-rw-r--r--dequant_q5_1.comp1040logplain
-rw-r--r--dequant_q5_k.comp3133logplain
-rw-r--r--dequant_q6_k.comp1425logplain
-rw-r--r--dequant_q8_0.comp839logplain
-rw-r--r--diag_mask_inf.comp799logplain
-rw-r--r--div.comp776logplain
-rw-r--r--flash_attn.comp11698logplain
-rw-r--r--flash_attn_base.comp5043logplain
-rw-r--r--flash_attn_cm1.comp13916logplain
-rw-r--r--flash_attn_cm2.comp11295logplain
-rw-r--r--flash_attn_split_k_reduce.comp2489logplain
-rw-r--r--fused_mul_gelu.comp868logplain
-rw-r--r--fused_mul_relu.comp604logplain
-rw-r--r--fused_mul_silu.comp668logplain
-rw-r--r--fused_rms_norm.comp1669logplain
-rw-r--r--geglu.comp327logplain
-rw-r--r--geglu_erf.comp882logplain
-rw-r--r--geglu_quick.comp200logplain
-rw-r--r--gelu.comp767logplain
-rw-r--r--gelu_erf.comp1345logplain
-rw-r--r--gelu_quick.comp631logplain
-rw-r--r--generic_binary_head.comp2352logplain
-rw-r--r--generic_head.comp160logplain
-rw-r--r--generic_unary_head.comp3098logplain
-rw-r--r--get_rows.comp946logplain
-rw-r--r--get_rows_quant.comp1222logplain
-rw-r--r--glu_head.comp402logplain
-rw-r--r--glu_main.comp859logplain
-rw-r--r--group_norm.comp1736logplain
-rw-r--r--im2col.comp2703logplain
-rw-r--r--l2_norm.comp1226logplain
-rw-r--r--leaky_relu.comp586logplain
-rw-r--r--mul.comp776logplain
-rw-r--r--mul_mat_split_k_reduce.comp1296logplain
-rw-r--r--mul_mat_vec.comp5469logplain
-rw-r--r--mul_mat_vec_base.comp3185logplain
-rw-r--r--mul_mat_vec_iq1_m.comp3296logplain
-rw-r--r--mul_mat_vec_iq1_s.comp3056logplain
-rw-r--r--mul_mat_vec_iq2_s.comp3949logplain
-rw-r--r--mul_mat_vec_iq2_xs.comp3699logplain
-rw-r--r--mul_mat_vec_iq2_xxs.comp3808logplain
-rw-r--r--mul_mat_vec_iq3_s.comp3933logplain
-rw-r--r--mul_mat_vec_iq3_xxs.comp3918logplain
-rw-r--r--mul_mat_vec_nc.comp3531logplain
-rw-r--r--mul_mat_vec_p021.comp4580logplain
-rw-r--r--mul_mat_vec_q2_k.comp6450logplain
-rw-r--r--mul_mat_vec_q3_k.comp6560logplain
-rw-r--r--mul_mat_vec_q4_k.comp6588logplain
-rw-r--r--mul_mat_vec_q5_k.comp7939logplain
-rw-r--r--mul_mat_vec_q6_k.comp5756logplain
-rw-r--r--mul_mm.comp42887logplain
-rw-r--r--mul_mm_cm2.comp18744logplain
-rw-r--r--mul_mmq.comp15666logplain
-rw-r--r--mul_mmq_funcs.comp3660logplain
-rw-r--r--multi_add.comp876logplain
-rw-r--r--norm.comp1281logplain
-rw-r--r--opt_step_adamw.comp1200logplain
-rw-r--r--pad.comp971logplain
-rw-r--r--pool2d.comp1785logplain
-rw-r--r--quantize_q8_1.comp1989logplain
-rw-r--r--reglu.comp126logplain
-rw-r--r--relu.comp528logplain
-rw-r--r--repeat.comp809logplain
-rw-r--r--repeat_back.comp1215logplain
-rw-r--r--rms_norm.comp2057logplain
-rw-r--r--rms_norm_back.comp1864logplain
-rw-r--r--roll.comp1462logplain
-rw-r--r--rope_head.comp1827logplain
-rw-r--r--rope_multi.comp1791logplain
-rw-r--r--rope_neox.comp1091logplain
-rw-r--r--rope_norm.comp1032logplain
-rw-r--r--rope_vision.comp1369logplain
-rw-r--r--scale.comp625logplain
-rw-r--r--sigmoid.comp541logplain
-rw-r--r--silu.comp565logplain
-rw-r--r--silu_back.comp761logplain
-rw-r--r--sin.comp374logplain
-rw-r--r--soft_max.comp5098logplain
-rw-r--r--soft_max_back.comp1521logplain
-rw-r--r--square.comp375logplain
-rw-r--r--sub.comp826logplain
-rw-r--r--sum_rows.comp940logplain
-rw-r--r--swiglu.comp134logplain
-rw-r--r--tanh.comp544logplain
-rw-r--r--test_bfloat16_support.comp68logplain
-rw-r--r--test_coopmat2_support.comp78logplain
-rw-r--r--test_coopmat_support.comp78logplain
-rw-r--r--test_integer_dot_support.comp79logplain
-rw-r--r--timestep_embedding.comp1029logplain
-rw-r--r--types.comp94094logplain
-rw-r--r--upscale.comp3144logplain
-rw-r--r--vulkan-shaders-gen.cpp39752logplain
-rw-r--r--wkv6.comp2720logplain
-rw-r--r--wkv7.comp2984logplain