Medusa: Framework for Accelerating LLM Generation with Multiple Decoding Heads

Heykuki News

5 points

2 years ago

No comments

Threaded

Loading comments...

Medusa: Framework for Accelerating LLM Generation with Multiple Decoding Heads | Heykuki News