From 65cdf34bdc469fa86248e667a5880992684ef114 Mon Sep 17 00:00:00 2001
From: Rand Xie <randxiexyy29@gmail.com>
Date: Fri, 28 Jul 2023 01:42:53 -0700
Subject: llama : use n_embd_gqa instead of n_embd to handle llama-2 70B
 (#2433)

---
 examples/save-load-state/save-load-state.cpp | 1 +
 1 file changed, 1 insertion(+)

(limited to 'examples/save-load-state/save-load-state.cpp')

diff --git a/examples/save-load-state/save-load-state.cpp b/examples/save-load-state/save-load-state.cpp
index 4c868850..61c71c35 100644
--- a/examples/save-load-state/save-load-state.cpp
+++ b/examples/save-load-state/save-load-state.cpp
@@ -26,6 +26,7 @@ int main(int argc, char ** argv) {
     auto lparams = llama_context_default_params();
 
     lparams.n_ctx     = params.n_ctx;
+    lparams.n_gqa     = params.n_gqa;
     lparams.seed      = params.seed;
     lparams.f16_kv    = params.memory_f16;
     lparams.use_mmap  = params.use_mmap;
-- 
cgit v1.2.3