Helper function to load sharded safetensors files (#1481)

* Fix the quantized mistral example. * Add a helper function to load sharded safetensors weights. * Use the sharded loader.
2025-06-16 10:38:54 +00:00 · 2023-12-25 21:49:21 +01:00
parent eae3a20d43
commit 37c539f2b7
7 changed files with 40 additions and 67 deletions
--- a/candle-examples/examples/mixtral/main.rs
+++ b/candle-examples/examples/mixtral/main.rs
@ -209,29 +209,7 @@ fn main() -> Result<()> {
            .split(',')
            .map(std::path::PathBuf::from)
            .collect::<Vec<_>>(),
-        None => {
-            vec![
-                repo.get("model-00001-of-00019.safetensors")?,
-                repo.get("model-00002-of-00019.safetensors")?,
-                repo.get("model-00003-of-00019.safetensors")?,
-                repo.get("model-00004-of-00019.safetensors")?,
-                repo.get("model-00005-of-00019.safetensors")?,
-                repo.get("model-00006-of-00019.safetensors")?,
-                repo.get("model-00007-of-00019.safetensors")?,
-                repo.get("model-00008-of-00019.safetensors")?,
-                repo.get("model-00009-of-00019.safetensors")?,
-                repo.get("model-00010-of-00019.safetensors")?,
-                repo.get("model-00011-of-00019.safetensors")?,
-                repo.get("model-00012-of-00019.safetensors")?,
-                repo.get("model-00013-of-00019.safetensors")?,
-                repo.get("model-00014-of-00019.safetensors")?,
-                repo.get("model-00015-of-00019.safetensors")?,
-                repo.get("model-00016-of-00019.safetensors")?,
-                repo.get("model-00017-of-00019.safetensors")?,
-                repo.get("model-00018-of-00019.safetensors")?,
-                repo.get("model-00019-of-00019.safetensors")?,
-            ]
-        }
+        None => candle_examples::hub_load_safetensors(&repo, "model.safetensors.index.json")?,
    };
    println!("retrieved the files in {:?}", start.elapsed());
    let tokenizer = Tokenizer::from_file(tokenizer_filename).map_err(E::msg)?;