refactor part 2

2026-01-21 02:44:13 +00:00 · 2025-12-30 11:12:37 +01:00 · 2025-12-30 11:12:37 +01:00 · fc565d7294
commit fc565d7294
parent 35ec43822c
1 changed files with 0 additions and 3 deletions
--- a/scripts/chat_sft.py
+++ b/scripts/chat_sft.py
@ -225,9 +225,6 @@ for step in range(num_iterations):
        train_loss = loss.detach() # for logging
        loss = loss / grad_accum_steps # each .backward() is a grad sum => normalize loss here
        loss.backward() # accumulate the gradient
-        num_tokens += (train_targets >= 0).sum()
-    if ddp:
-        dist.all_reduce(num_tokens, op=dist.ReduceOp.SUM) # sum over ranks

    # learning rate scheduler
    lrm = get_lr_multiplier(step)