Renjie's picture

Renjie

Renjie-Ranger

·

https://renjie-ranger.github.io/

AI & ML interests

LLM Post-Training

Recent Activity

upvoted a paper 7 days ago

Flow-DPPO: Divergence Proximal Policy Optimization for Flow Matching Models

upvoted a paper 7 days ago

Rethinking the Divergence Regularization in LLM RL

updated a dataset about 1 month ago

Renjie-Ranger/FCP_big_math_pro_SFT

View all activity

Organizations

None yet

upvoted 2 papers 7 days ago

Flow-DPPO: Divergence Proximal Policy Optimization for Flow Matching Models

Paper • 2606.11025 • Published 8 days ago • 41

Rethinking the Divergence Regularization in LLM RL

Paper • 2606.09821 • Published 9 days ago • 33

updated a dataset about 1 month ago

Renjie-Ranger/FCP_big_math_pro_SFT

Viewer • Updated May 6 • 384k • 114 • 1

New activity in Renjie-Ranger/FCP_big_math_pro_SFT about 1 month ago

Improve dataset card: Add paper/code links, task categories, abstract, and sample usage

#2 opened 9 months ago by

upvoted 2 papers about 2 months ago

Length Value Model: Scalable Value Pretraining for Token-Level Length Modeling

Paper • 2604.27039 • Published Apr 29 • 26

ClawMark: A Living-World Benchmark for Multi-Turn, Multi-Day, Multimodal Coworker Agents

Paper • 2604.23781 • Published Apr 26 • 33

updated a model 3 months ago

Renjie-Ranger/paper-step_general_reasoner_summary_CFT

8B • Updated Mar 30 • 1

published a model 3 months ago

Renjie-Ranger/paper-step_general_reasoner_summary_CFT

8B • Updated Mar 30 • 1

updated a model 3 months ago

Renjie-Ranger/paper-step_big_math_pairs_summary_FCP

8B • Updated Mar 30 • 1

published a model 3 months ago

Renjie-Ranger/paper-step_big_math_pairs_summary_FCP

8B • Updated Mar 30 • 1

updated a model 3 months ago

Renjie-Ranger/paper-step_big_math_pairs_summary_CFT_rerun

8B • Updated Mar 30 • 1

published a model 3 months ago

Renjie-Ranger/paper-step_big_math_pairs_summary_CFT_rerun

8B • Updated Mar 30 • 1

updated a model 3 months ago

Renjie-Ranger/paper-step_big_math_pairs_summary_CFT

8B • Updated Mar 30 • 1

published a model 3 months ago

Renjie-Ranger/paper-step_big_math_pairs_summary_CFT

8B • Updated Mar 30 • 1

updated a model 3 months ago

Renjie-Ranger/math_good_bad-step_test_no_extra_space

8B • Updated Mar 30 • 1

published a model 3 months ago

Renjie-Ranger/math_good_bad-step_test_no_extra_space

8B • Updated Mar 30 • 1

updated a model 3 months ago

Renjie-Ranger/math_good_bad-step_all_pairs_summary_qwen25_7b

8B • Updated Mar 30 • 1

published a model 3 months ago

Renjie-Ranger/math_good_bad-step_all_pairs_summary_qwen25_7b

8B • Updated Mar 30 • 1

updated a model 3 months ago

Renjie-Ranger/math_good_bad-step_all_pairs_summary

4B • Updated Mar 30 • 1

published a model 3 months ago

Renjie-Ranger/math_good_bad-step_all_pairs_summary

4B • Updated Mar 30 • 1