when loading models on CPU, convert tensors from bfloat16 to float

2026-03-12 04:05:30 +00:00 · 2025-11-02 07:58:56 -08:00 · 2025-11-02 07:58:56 -08:00 · d1ac0b2d07
commit d1ac0b2d07
parent cf587acb1a 5bfcd31b73
1 changed files with 6 additions and 0 deletions
--- a/nanochat/checkpoint_manager.py
+++ b/nanochat/checkpoint_manager.py
@ -65,6 +65,12 @@ def build_model(checkpoint_dir, step, device, phase):
    """
    assert phase in ["train", "eval"], f"Invalid phase: {phase}"
    model_data, optimizer_data, meta_data = load_checkpoint(checkpoint_dir, step, device, load_optimizer=False)
+    if device.type == "cpu":
+        # Convert bfloat16 tensors to float for CPU inference
+        model_data = {
+            k: v.float() if v.dtype == torch.bfloat16 else v
+            for k, v in model_data.items()
+        }
    # Hack: fix torch compile issue, which prepends all keys with _orig_mod.
    model_data = {k.lstrip("_orig_mod."): v for k, v in model_data.items()}
    model_config_kwargs = meta_data["model_config"]