Edit Models filters

Inference status

Misc

Inference Endpoints

AutoTrain Compatible

text-generation-inference

reinforcement-learning

Misc with no match

4-bit precision

text-embeddings-inference

8-bit precision

Carbon Emissions

Mixture of Experts

Models

47,362

Full-text search

Active filters: reinforcement-learning

Vivek-huggingface/Reinforce-Pixelcopter-v2

Reinforcement Learning • Updated about 11 hours ago

kalmi901/a2c-PandaPickAndPlace-v3

Reinforcement Learning • Updated about 14 hours ago

Stevenson15/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated about 14 hours ago

Stevenson15/Qtable_taxi

Reinforcement Learning • Updated about 14 hours ago

tomervazana/ppo-LunarLander-v2

Reinforcement Learning • Updated about 14 hours ago

martomor/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated about 13 hours ago

crystaltine/drl-u4-Reinforce

Reinforcement Learning • Updated about 13 hours ago

apple9855/poca-SoccerTwos

Reinforcement Learning • Updated about 13 hours ago

svetaU/poca-SoccerTwos

Reinforcement Learning • Updated about 12 hours ago

SpyrosMitsis/a2c-PandaReachDense-v3

Reinforcement Learning • Updated about 11 hours ago

pupiloco/atari

Reinforcement Learning • Updated about 11 hours ago

zjor/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated about 11 hours ago

zjor/q-taxi-v3

Reinforcement Learning • Updated about 11 hours ago

pupiloco/LunarLanding

Reinforcement Learning • Updated about 10 hours ago

svetaU/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated 37 minutes ago

Vivek-huggingface/Reinforce-Pixelcopter-v3

Reinforcement Learning • Updated about 10 hours ago

pupiloco/pole

Reinforcement Learning • Updated about 6 hours ago

svetaU/LunarLander-v1

Reinforcement Learning • Updated about 6 hours ago

junruzhang/ppo-LunarLander-v2

Reinforcement Learning • Updated about 4 hours ago

pakelley/ppo-LunarLander-v2

Reinforcement Learning • Updated about 4 hours ago

astrollin/ppo-LunarLander-v2

Reinforcement Learning • Updated about 2 hours ago

wasssabi365/ppo-Huggy

Reinforcement Learning • Updated 23 minutes ago