Arvind Rajasekaran's picture

Arvind Rajasekaran

arvindcr4

·

AI & ML interests

None yet

Recent Activity

updated a Space about 23 hours ago

arvindcr4/tinkerrl-bench-demo

published a Space about 23 hours ago

arvindcr4/tinkerrl-bench-demo

updated a model 6 days ago

arvindcr4/tinker-rl-w1_deepseek-v31-base-deepseek-v3.1-base-s42

View all activity

Organizations

None yet

arvindcr4 's models 42

arvindcr4/tinker-rl-w1_deepseek-v31-base-deepseek-v3.1-base-s42

Updated 6 days ago

arvindcr4/tinker-rl-frontier_gsm8k_nemotron-120b-nemotron-120b

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-frontier_gsm8k_deepseek-v3.1-deepseek-v3.1

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-arch_gsm8k_kimi-k2-kimi-k2

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-w2_qwen3-8b_g4-qwen3-8b-s42

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-w2_qwen3-8b_g32-qwen3-8b-s42

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-w2_qwen3-8b_g2-qwen3-8b-s42

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-w2_qwen3-8b_g16-qwen3-8b-s42

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-w1_qwen3-8b-base-qwen3-8b-base-s42-run1

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-w1_qwen3-8b-base-qwen3-8b-base-s42-run2

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-w1_llama31-8b-base-llama-3.1-8b-s42

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-scale_gsm8k_qwen3.5-4b-qwen3.5-4b

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-scale_gsm8k_qwen3-8b-qwen3-8b

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-scale_gsm8k_llama-8b-inst-llama-8b-inst

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-distillation_off_trajectory-qwen3-8b-base

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-cross_tool_qwen3-32b-qwen3-32b

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-cross_tool_llama-8b-inst-llama-8b-inst

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-atropos_notebook-qwen3-8b-base

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-arithmetic_trajectory-llama-3.2-1b

Reinforcement Learning • Updated 6 days ago

arvindcr4/tinker-rl-arch_gsm8k_gpt-oss-20b-gpt-oss-20b

Reinforcement Learning • Updated 6 days ago

arvindcr4/trl_qwen3_8b-grpo-gsm8k

Updated 7 days ago

arvindcr4/trl_llama32_3b-grpo-gsm8k

Updated 7 days ago

arvindcr4/trl_llama32_1b-grpo-gsm8k

Updated 7 days ago

arvindcr4/tinker-rl-bench-arch_gsm8k_kimi-k2

Reinforcement Learning • Updated 7 days ago

arvindcr4/tinker-rl-bench-arch_gsm8k_gpt-oss-20b

Reinforcement Learning • Updated 7 days ago

arvindcr4/tinker-rl-bench-scale_gsm8k_llama-8b-inst

Reinforcement Learning • Updated 7 days ago

arvindcr4/tinker-rl-bench-cross_tool_qwen3-32b

Reinforcement Learning • Updated 7 days ago

arvindcr4/tinker-rl-bench-scale_gsm8k_qwen3.5-4b

Reinforcement Learning • Updated 7 days ago

arvindcr4/tinker-rl-bench-frontier_gsm8k_nemotron-120b

Reinforcement Learning • Updated 7 days ago

arvindcr4/tinker-rl-bench-ppo_gsm8k_Qwen3-8B_s42

Text Generation • Updated 7 days ago • 26