Search: github.com/policy-gradient | Heykuki News

HK

Heykuki News

Top New Best Ask Show Jobs

Top New Best Ask Show Jobs

1.

Implementing DeepSeek R1's GRPO algorithm from scratch

github.com/policy-gradient

a year ago

192 points

2.

A minimal hackable implementation of policy gradients (GRPO, PPO, REINFORCE)

github.com/zafstojano

5 months ago

1 points

3.

Experimenting with policy gradient methods in Jax

github.com/elliotvilhelm

a year ago

2 points

4.

OpenAi Gym: Policy Gradient

github.com/Mortiniera

7 years ago

2 points

5.

Multi-Agent Deep Deterministic Policy Gradient

github.com/openai

8 years ago

2 points

6.

Controlling a unicycle with Policy Gradients

github.com/pauli-space

8 years ago

1 points

7.

10 months ago

3 points

8.

Show HN: Qantify – GPU-Accelerated Trading Library with Advanced Math and AutoML

github.com/Alradyin

7 months ago

1 points