Quantized version of the metavoice model. (#1824)

* Quantized version of the metavoice model. * Integrate the quantized version of metavoice.
2025-06-21 20:22:49 +00:00 · 2024-03-09 11:06:04 +01:00
parent 936f6a4840
commit dd00482ea3
5 changed files with 277 additions and 12 deletions
--- a/candle-transformers/src/models/metavoice.rs
+++ b/candle-transformers/src/models/metavoice.rs
@ -2,7 +2,7 @@ use candle::{DType, Device, Error as E, IndexOp, Module, Result, Tensor, D};
 use candle_nn::{embedding, linear_b, rms_norm, Embedding, Linear, RmsNorm, VarBuilder};

 // Equivalent to torch.repeat_interleave
-fn repeat_interleave(img: &Tensor, repeats: usize, dim: usize) -> Result<Tensor> {
+pub(crate) fn repeat_interleave(img: &Tensor, repeats: usize, dim: usize) -> Result<Tensor> {
    let img = img.unsqueeze(dim + 1)?;
    let mut dims = img.dims().to_vec();
    dims[dim + 1] = repeats;
@ -664,15 +664,15 @@ pub mod transformer {
            }
        }

-        fn n_local_heads(&self) -> usize {
+        pub(crate) fn n_local_heads(&self) -> usize {
            self.n_local_heads.unwrap_or(self.n_head)
        }

-        fn head_dim(&self) -> usize {
+        pub(crate) fn head_dim(&self) -> usize {
            self.dim / self.n_head
        }

-        fn intermediate_size(&self) -> usize {
+        pub(crate) fn intermediate_size(&self) -> usize {
            match self.intermediate_size {
                Some(intermediate_size) => intermediate_size,
                None => {