Show HN: Turboquant.cpp – Quantize embeddings to 1-4 bits, no training (400 LoC)

Heykuki News

2 points

7 days ago

No comments

Threaded

Loading comments...

Show HN: Turboquant.cpp – Quantize embeddings to 1-4 bits, no training (400 LoC) | Heykuki News