TPI-LLM: Serving 70B-Scale LLMs Efficiently on Low-Resource Edge Devices

Heykuki News

2 points

2 years ago

No comments

Threaded

Loading comments...

TPI-LLM: Serving 70B-Scale LLMs Efficiently on Low-Resource Edge Devices | Heykuki News