ermiaazarkhalili
/

Qwen2-0.5B-GRPO-test

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Qwen2-0.5B-GRPO-test

Commit History

Training in progress, step 10

dc4ebf9
verified

ermiaazarkhalili commited on Aug 3

initial commit

82ca664
verified

ermiaazarkhalili commited on Aug 3