Scaling Coding-Agent RL to 32x H100s. 160% Improvement on Stanford's TBench

Heykuki News

2 points

8 months ago

1 comment

Threaded

Loading comments...

Scaling Coding-Agent RL to 32x H100s. 160% Improvement on Stanford's TBench | Heykuki News