GOVINDFROM
/

MindGamesCodeNames

Reinforcement Learning

graph-neural-networks

preference-learning

llm-distillation

Model card Files Files and versions

MindGamesCodeNames

Commit History

Update README.md

5c80055
verified

GOVINDFROM commited on Dec 30, 2025

Update README.md

e6db4f9
verified

GOVINDFROM commited on Dec 29, 2025

Upload model card

2890d84
verified

GOVINDFROM commited on Dec 29, 2025

Upload battleground_eval.json

e91ffab
verified

GOVINDFROM commited on Dec 29, 2025

Upload master_config.json

1f81885
verified

GOVINDFROM commited on Dec 29, 2025

Upload SFT model

43b7674
verified

GOVINDFROM commited on Dec 29, 2025

Upload policy_after_ppo.pt

f0ef1c3
verified

GOVINDFROM commited on Dec 29, 2025

Upload policy_after_distill.pt

cd470a3
verified

GOVINDFROM commited on Dec 29, 2025

Upload policy_final.pt

edb9110
verified

GOVINDFROM commited on Dec 29, 2025

initial commit

12f043b
verified

GOVINDFROM commited on Dec 29, 2025