convert : update phi-2 to latest HF repo (#4903)

* convert : update phi-2 to latest HF repo ggml-ci * py : try to fix flake stuff
author: Georgi Gerganov <ggerganov@gmail.com> 2024-01-13 13:44:37 +0200
committer: GitHub <noreply@github.com> 2024-01-13 13:44:37 +0200
commit: 15ebe59210e7fd9817ff67f51fa1a5ee2d004294 (patch)
tree: 5646557d2c34cf845de1ec86d645d0126117ee6f /gguf-py
parent: de473f5f8e19ba5e659cdf5af65fb9251dce16c5 (diff)
2 files changed, 5 insertions, 0 deletions
diff --git a/gguf-py/gguf/constants.py b/gguf-py/gguf/constants.py
index f0a1c51f..972b4e9a 100644
--- a/gguf-py/gguf/constants.py
+++ b/gguf-py/gguf/constants.py
@@ -389,6 +389,9 @@ MODEL_TENSORS: dict[MODEL_ARCH, list[MODEL_TENSOR]] = {
         MODEL_TENSOR.OUTPUT,
         MODEL_TENSOR.ATTN_NORM,
         MODEL_TENSOR.ATTN_QKV,
+        MODEL_TENSOR.ATTN_Q,
+        MODEL_TENSOR.ATTN_K,
+        MODEL_TENSOR.ATTN_V,
         MODEL_TENSOR.ATTN_OUT,
         MODEL_TENSOR.FFN_NORM,
         MODEL_TENSOR.FFN_DOWN,
diff --git a/gguf-py/gguf/tensor_mapping.py b/gguf-py/gguf/tensor_mapping.py
index 24a08903..e5b14610 100644
--- a/gguf-py/gguf/tensor_mapping.py
+++ b/gguf-py/gguf/tensor_mapping.py
@@ -191,6 +191,7 @@ class TensorNameMap:
             "transformer.h.{bid}.mlp.w1",                             # qwen
             "h.{bid}.mlp.c_fc",                                       # gpt2
             "transformer.h.{bid}.mlp.fc1",                            # phi2
+            "model.layers.{bid}.mlp.fc1",                             # phi2
             "model.layers.layers.{bid}.mlp.up_proj",                  # plamo
         ),
 
@@ -232,6 +233,7 @@ class TensorNameMap:
             "model.layers.{bid}.mlp.dense_4h_to_h",                   # persimmon
             "h.{bid}.mlp.c_proj",                                     # gpt2
             "transformer.h.{bid}.mlp.fc2",                            # phi2
+            "model.layers.{bid}.mlp.fc2",                             # phi2
             "model.layers.layers.{bid}.mlp.down_proj",                # plamo
         ),
author	Georgi Gerganov <ggerganov@gmail.com>	2024-01-13 13:44:37 +0200
committer	GitHub <noreply@github.com>	2024-01-13 13:44:37 +0200
commit	15ebe59210e7fd9817ff67f51fa1a5ee2d004294 (patch)
tree	5646557d2c34cf845de1ec86d645d0126117ee6f /gguf-py
parent	de473f5f8e19ba5e659cdf5af65fb9251dce16c5 (diff)