ik_llama.cpp.git - Unnamed repository; edit this file 'description' to name the repository.

Age	Commit message (Expand)	Author
2024-10-01	iqk_mul_mat: better iq4_nl implementation on Zen4/AVX2 (#72)	Kawrakow
2024-09-28	Adding SWIGLU unary op (#65)	Kawrakow
2024-09-27	Adding ability to have meta data per tensor row (#61)	Kawrakow
2024-09-14	Improve Q5_0 performance (#55)	Kawrakow
2024-09-14	Improve Q4_0 and Q8_0 performance on AVX2/Zen4 (#54)	Kawrakow
2024-09-09	Adding IQ1_TN - 1.6875 bpw for TriLM ternary models (#44)	Kawrakow
2024-09-08	Adding fused rms_norm (#42)	Kawrakow
2024-09-04	Zen4 Flash Attnetion 2 (#36)	Kawrakow
2024-09-02	Fix Zen4 Flash Attention (#35)	Kawrakow
2024-09-01	Zen4 Flash Attention (#32)	Kawrakow
2024-08-27	Faster Gemma2 (#27)	Kawrakow
2024-08-21	softcap: minor improvement (#24)	Kawrakow
2024-08-20	Fused soft cap and SIMD-ified GeLU (#9)	Kawrakow
2024-08-14	Skip barriers of noops (#19)	Kawrakow
2024-08-12	Merge mainline - Aug 12 2024 (#17)	Kawrakow
2024-08-09	iq6_k: WIP (nothing works)	Iwan Kawrakow
2024-08-07	Adding IQ2_TN for use with ternary models (#13)	Kawrakow
2024-08-01	iq3_k: Basics	Iwan Kawrakow
2024-08-01	iq5_k: Basics	Iwan Kawrakow
2024-08-01	iq2_k: Basics	Iwan Kawrakow
2024-07-28	IQ4_K: SOTA 4-bit quantization (#6)	Kawrakow
2024-07-27	Simdify and multi-thread tanh (#4)	Kawrakow
2024-07-27	Merge mainline llama.cpp (#3)	Kawrakow