Evals: a framework for evaluating OpenAI models and a registry of benchmarks

Heykuki News

123 points

3 years ago

16 comments

Threaded

Loading comments...

Evals: a framework for evaluating OpenAI models and a registry of benchmarks | Heykuki News