Llama more training (#297)

* Rework the var-builder to handle initializations. * Add some helper functions for layer creation. * Improve the layer initializations. * Get initialized variables. * Precompute the rot embeddings when training lamas.
2025-06-19 19:58:35 +00:00 · 2023-08-01 19:53:41 +01:00
parent a27239f3d9
commit ff876c2103
10 changed files with 238 additions and 163 deletions
--- a/candle-nn/src/lib.rs
+++ b/candle-nn/src/lib.rs
@ -15,9 +15,9 @@ pub mod vision;

 pub use activation::Activation;
 pub use conv::{Conv1d, Conv1dConfig};
-pub use embedding::Embedding;
+pub use embedding::{embedding, Embedding};
 pub use init::Init;
-pub use layer_norm::LayerNorm;
-pub use linear::Linear;
+pub use layer_norm::{layer_norm, LayerNorm};
+pub use linear::{linear, linear_no_bias, Linear};
 pub use optim::SGD;
-pub use var_builder::VarBuilder;
+pub use var_builder::{VarBuilder, VarMap};