ik_llama.cpp.git - Unnamed repository; edit this file 'description' to name the repository.

Age	Commit message (Expand)	Author
2025-02-13	MLA: allow Q8_0 K-cache for MLA (#206)	Kawrakow
2025-02-13	Faster MLA prompt processing (#205)	Kawrakow
2025-02-11	DeepSeek FA support (CPU only) (#200)	Kawrakow
2025-02-10	Load all MoE experts during warmup and make warmup 1 token (#198)	saood06
2025-02-09	Add optional MLA (#188)	Kawrakow
2025-02-07	cuda: non-contiguous rms norm (#190)	Kawrakow
2025-02-06	Rename q4_0_r4, q8_0_r4 and iq4_xs_r4 to _r8 (#189)	Kawrakow
2025-02-06	IQ1_M_R4: better 1.75 bpw quants (#187)	Kawrakow
2025-02-05	IQ1_S_R4: better 1.5 bpw quants (#185)	Kawrakow
2025-01-30	Deepseek-Lite (#184)	Kawrakow
2025-01-27	Minor performance improvements (#179)	Kawrakow
2025-01-27	Interleave 8 rows (Q8_0, IQ4_XS) (#178)	Kawrakow
2025-01-24	Update chat templates (#177)	Kawrakow
2025-01-23	Deepseek V3 support added (#176)	saood06
2025-01-23	Add Deepseek-R1-Distill pre-tokenizer	Iwan Kawrakow
2025-01-10	Be able to re-quantize MS BitNet I2_S models (#169)	Kawrakow
2025-01-10	Falcon3 changes (#168)	Kawrakow
2024-12-23	IQ3_S_R4 (#162)	Kawrakow
2024-12-21	IQ2_S_R4 (#156)	Kawrakow
2024-12-21	IQ2_XS_R4 (#155)	Kawrakow
2024-12-20	IQ2_XXS_R4 (#154)	Kawrakow
2024-12-20	IQ3_XXS_R4 (#153)	Kawrakow
2024-12-18	IQ4_KS_R4 (#150)	Kawrakow
2024-12-18	IQ5_K_R4 (#149)	Kawrakow
2024-12-17	Be able to repack tensors at run time (#147)	Kawrakow
2024-12-17	IQ2_K_R4 (#146)	Kawrakow
2024-12-17	IQ3_K_R4 (#145)	Kawrakow
2024-12-15	BF16_R16 - 16 interleaved bf16 rows (#142)	Kawrakow
2024-12-14	Q8_K_R8: Fastest quantized matrix multiplications (#141)	Kawrakow
2024-12-12	IQ4_K_R4 (#138)	Kawrakow
2024-12-11	Q2_K_R4 (#136)	Kawrakow
2024-12-11	Q3_K_R4 (#134)	Kawrakow
2024-12-10	Q5_K_R4 (#132)	Kawrakow
2024-12-10	Q6_K_R4 (#130)	Kawrakow
2024-12-09	Q4_K_R4 (#129)	Kawrakow
2024-12-08	Rename iq4_nl_x4 to iq4_nl_r4 (#126)	Kawrakow
2024-12-08	R4 improvements on ARM_NEON (#125)	Kawrakow
2024-12-06	iq2_bn_r4: fastest Bitnet CPU implementation on the planet (#124)	Kawrakow
2024-12-04	IQ4_XS_R4 (#123)	Kawrakow
2024-12-03	Q6_0_R4 (#122)	Kawrakow
2024-12-03	Q5_0_R4 (#121)	Kawrakow
2024-12-03	Q8_0_R4 (#120)	Kawrakow
2024-12-02	Q4_0_R4 (#119)	Kawrakow
2024-12-02	IQ4_NL_X4 (#118)	Kawrakow
2024-11-21	Use Q6_0 instead of Q5_1 for tensors incompatible with IQ5_K/Q5_K (#116)	Nexes the Elder
2024-10-31	Faster MoE inference (#112)	Kawrakow
2024-10-26	Use fused mul - unary op also for MoE models (#111)	Kawrakow
2024-10-26	Bitnet: use the fused mul-silu in the FFN network (#110)	Kawrakow
2024-10-25	Bitnet changes (#106)	Kawrakow
2024-10-22	Add support for Granite and GraniteMoE models (#102)	Kawrakow