Distilling Step-by-Step Outperforming Larger Language Models with Less Training

Heykuki News

153 points

3 years ago

34 comments

Threaded

Loading comments...

Distilling Step-by-Step Outperforming Larger Language Models with Less Training | Heykuki News