Search: runrl.com | Heykuki News

HK

Heykuki News

Top New Best Ask Show Jobs

Top New Best Ask Show Jobs

1.

Launch HN: RunRL (YC X25) – Reinforcement learning as a service

9 months ago

71 points

2.

Training Qwen to answer briefly yet intelligently using feedback control

9 months ago

4 points

3.

Why Run RL? How specialized models can outperform the biggest LLMs

a year ago

4 points

4.

Scaling pretraining affects RL sample efficiency

8 months ago

1 points

5.

Generating the Funniest Joke with RL

a year ago

1 points