Remove Q4_3 which is no better than Q5 (#1218)

author: Stephan Walter <stephan@walter.name> 2023-04-28 23:10:43 +0000
committer: GitHub <noreply@github.com> 2023-04-28 23:10:43 +0000
commit: 36d19a603b221d1bd7897fcb10e823e2103b052d (patch)
tree: 14e8caf8b61f8fa0fa72f5d7cc137b1ff9330b2f /llama.cpp
parent: 7f15c5c477d9933689a9d1c40794483e350c2f19 (diff)
1 files changed, 0 insertions, 4 deletions
diff --git a/llama.cpp b/llama.cpp
index dca017db..45f0d44a 100644
--- a/llama.cpp
+++ b/llama.cpp
@@ -483,7 +483,6 @@ struct llama_file_loader {
                 case GGML_TYPE_Q4_0:
                 case GGML_TYPE_Q4_1:
                 case GGML_TYPE_Q4_2:
-                case GGML_TYPE_Q4_3:
                 case GGML_TYPE_Q5_0:
                 case GGML_TYPE_Q5_1:
                 case GGML_TYPE_Q8_0:
@@ -560,7 +559,6 @@ struct llama_file_saver {
             case GGML_TYPE_Q4_0:
             case GGML_TYPE_Q4_1:
             case GGML_TYPE_Q4_2:
-            case GGML_TYPE_Q4_3:
             case GGML_TYPE_Q5_0:
             case GGML_TYPE_Q5_1:
             case GGML_TYPE_Q8_0:
@@ -853,7 +851,6 @@ static const char *llama_ftype_name(enum llama_ftype ftype) {
         case LLAMA_FTYPE_MOSTLY_Q4_1_SOME_F16:
                                       return "mostly Q4_1, some F16";
         case LLAMA_FTYPE_MOSTLY_Q4_2: return "mostly Q4_2";
-        case LLAMA_FTYPE_MOSTLY_Q4_3: return "mostly Q4_3";
         case LLAMA_FTYPE_MOSTLY_Q5_0: return "mostly Q5_0";
         case LLAMA_FTYPE_MOSTLY_Q5_1: return "mostly Q5_1";
         case LLAMA_FTYPE_MOSTLY_Q8_0: return "mostly Q8_0";
@@ -1593,7 +1590,6 @@ static void llama_model_quantize_internal(const std::string & fname_inp, const s
         case LLAMA_FTYPE_MOSTLY_Q4_0: quantized_type = GGML_TYPE_Q4_0; break;
         case LLAMA_FTYPE_MOSTLY_Q4_1: quantized_type = GGML_TYPE_Q4_1; break;
         case LLAMA_FTYPE_MOSTLY_Q4_2: quantized_type = GGML_TYPE_Q4_2; break;
-        case LLAMA_FTYPE_MOSTLY_Q4_3: quantized_type = GGML_TYPE_Q4_3; break;
         case LLAMA_FTYPE_MOSTLY_Q5_0: quantized_type = GGML_TYPE_Q5_0; break;
         case LLAMA_FTYPE_MOSTLY_Q5_1: quantized_type = GGML_TYPE_Q5_1; break;
         case LLAMA_FTYPE_MOSTLY_Q8_0: quantized_type = GGML_TYPE_Q8_0; break;
author	Stephan Walter <stephan@walter.name>	2023-04-28 23:10:43 +0000
committer	GitHub <noreply@github.com>	2023-04-28 23:10:43 +0000
commit	36d19a603b221d1bd7897fcb10e823e2103b052d (patch)
tree	14e8caf8b61f8fa0fa72f5d7cc137b1ff9330b2f /llama.cpp
parent	7f15c5c477d9933689a9d1c40794483e350c2f19 (diff)