Release the mmdit model earlier to reduce memory usage. (#2581)

* Stable diffusion 3.5 support. * Clippy fixes. * CFG fix. * Remove some unnecessary clones. * Avoid duplicating some of the code. * Release the mmdit model earlier to reduce memory usage.
2025-06-16 10:38:54 +00:00 · 2024-10-28 16:06:53 +01:00
parent 0e2c8c17fb
commit 498bc2cdc9
1 changed files with 17 additions and 16 deletions
--- a/candle-examples/examples/stable-diffusion-3/main.rs
+++ b/candle-examples/examples/stable-diffusion-3/main.rs
@ -183,26 +183,27 @@ fn main() -> Result<()> {
    let context = Tensor::cat(&[context, context_uncond], 0)?;
    let y = Tensor::cat(&[y, y_uncond], 0)?;
    let mmdit = MMDiT::new(
        &mmdit_config,
        use_flash_attn,
        vb.pp("model.diffusion_model"),
    )?;
    if let Some(seed) = seed {
        device.set_seed(seed)?;
    }
    let start_time = std::time::Instant::now();
-    let x = sampling::euler_sample(
+    let x = {
-        &mmdit,
+        let mmdit = MMDiT::new(
-        &y,
+            &mmdit_config,
-        &context,
+            use_flash_attn,
-        num_inference_steps,
+            vb.pp("model.diffusion_model"),
-        cfg_scale,
+        )?;
-        time_shift,
+        sampling::euler_sample(
-        height,
+            &mmdit,
-        width,
+            &y,
-    )?;
+            &context,
            num_inference_steps,
            cfg_scale,
            time_shift,
            height,
            width,
        )?
    };
    let dt = start_time.elapsed().as_secs_f32();
    println!(
        "Sampling done. {num_inference_steps} steps. {:.2}s. Average rate: {:.2} iter/s",