RIS-Kernel: Running 64k context LLMs on CPU via sparse attention | Heykuki News

HK

Heykuki News

Top New Best Ask Show Jobs

Top New Best Ask Show Jobs

RIS-Kernel: Running 64k context LLMs on CPU via sparse attention | Heykuki News

RIS-Kernel: Running 64k context LLMs on CPU via sparse attention

github.com/santosardr

2 points

22 days ago

No comments

Threaded

Loading comments...