Merge 02b22a5a13 into 63bb5831e2

2026-06-19 20:49:09 +00:00 · 2026-01-19 10:20:13 +00:00 · 2026-01-19 10:20:13 +00:00 · 096233f3a1
commit 096233f3a1
parent 63bb5831e2 02b22a5a13
1 changed files with 4 additions and 4 deletions
--- a/scripts/tok_eval.py
+++ b/scripts/tok_eval.py
@ -212,9 +212,9 @@ def print_comparison(baseline_name, baseline_results, ours_results, all_text):
        baseline_data = baseline_results[name]
        ours_data = ours_results[name]

-        # Calculate relative difference (positive means ours is better, negative means worse)
-        # Using tokens: fewer tokens is better, so we calculate (baseline_tokens - ours_tokens) / baseline_tokens
-        relative_diff = ((baseline_data['tokens'] - ours_data['tokens']) / baseline_data['tokens']) * 100
+        # Calculate relative difference in total tokens (negative means ours is better, positive means worse)
+        # We calculate (ours_tokens - baseline_tokens) / baseline_tokens
+        relative_diff = ((ours_data['tokens'] - baseline_data['tokens']) / baseline_data['tokens']) * 100

        # Determine which has better compression (higher ratio = better)
        if baseline_data['ratio'] > ours_data['ratio']:
@ -256,7 +256,7 @@ for baseline_name in ["GPT-2", "GPT-4"]:
    for name, text in all_text:
        baseline_data = baseline_results[name]
        ours_data = ours_results[name]
-        relative_diff = ((baseline_data['tokens'] - ours_data['tokens']) / baseline_data['tokens']) * 100
+        relative_diff = ((ours_data['tokens'] - baseline_data['tokens']) / baseline_data['tokens']) * 100
        lines.append(f"| {name} | {baseline_data['bytes']} | {baseline_data['tokens']} | {baseline_data['ratio']:.2f} | {ours_data['tokens']} | {ours_data['ratio']:.2f} | {relative_diff:+.1f}% |")
    lines.append("")
 report_markdown = "\n".join(lines)