iq1_bn(NEON): works now, but very slow

Basically 2X slower tan q4_0.
author: Iwan Kawrakow <iwan.kawrakow@gmail.com> 2024-06-17 13:04:24 +0200
committer: Iwan Kawrakow <iwan.kawrakow@gmail.com> 2024-06-22 12:02:51 +0300
commit: 8222c9f3d1e91096ab554f62ffbc384535b1963e (patch)
tree: 3b0fcc76e5e69aec93541101b43d15b045a81369
parent: 2f403d4c9377c5eedd754dc8481414ce727f33d4 (diff)
1 files changed, 1 insertions, 1 deletions
diff --git a/iqk_mul_mat.cpp b/iqk_mul_mat.cpp
index 9f4224cc..09189fa7 100644
--- a/iqk_mul_mat.cpp
+++ b/iqk_mul_mat.cpp
@@ -4088,7 +4088,7 @@ static void mul_mat_iq1bn_q8_K64(int n, const void * vx, size_t bx, const DataIn
                 int32x4_t sumi = vdupq_n_s32(0);
                 for (int j = 0; j < 4; ++j) {
                     auto tmp = vmulq_s8(q.val[j], vreinterpretq_s8_u8(signs.val[j]));
-                    tmp = vmulq_s8(q.val[j], v.val[j]);
+                    tmp = vmulq_s8(tmp, v.val[j]);
                     sumi = ggml_vdotq_s32(sumi, m1, tmp);
                 }
                 accd[iy] = vfmaq_f32(accd[iy], vdupq_n_f32(q8.scale(iy, i)), vcvtq_f32_s32(sumi));
author	Iwan Kawrakow <iwan.kawrakow@gmail.com>	2024-06-17 13:04:24 +0200
committer	Iwan Kawrakow <iwan.kawrakow@gmail.com>	2024-06-22 12:02:51 +0300
commit	8222c9f3d1e91096ab554f62ffbc384535b1963e (patch)
tree	3b0fcc76e5e69aec93541101b43d15b045a81369
parent	2f403d4c9377c5eedd754dc8481414ce727f33d4 (diff)