2 23 1

Jiarui Yao

FlippyDora

AI & ML interests

None yet

Recent Activity

upvoted a paper about 18 hours ago

RAGEN-2: Reasoning Collapse in Agentic RL

upvoted a paper 8 days ago

HippoCamp: Benchmarking Contextual Agents on Personal Computers

upvoted a paper 8 days ago

PerceptionComp: A Video Benchmark for Complex Perception-Centric Reasoning

View all activity

Organizations

upvoted a paper about 18 hours ago

RAGEN-2: Reasoning Collapse in Agentic RL

Paper • 2604.06268 • Published 3 days ago • 42

upvoted 2 papers 8 days ago

HippoCamp: Benchmarking Contextual Agents on Personal Computers

Paper • 2604.01221 • Published 8 days ago • 27

PerceptionComp: A Video Benchmark for Complex Perception-Centric Reasoning

Paper • 2603.26653 • Published 13 days ago • 18

updated a model 23 days ago

rb-dev/v-rubrics_opd-grpo_qwen3-vl-8b-instruct_g5-step260

9B • Updated 23 days ago • 157

published a model 23 days ago

rb-dev/v-rubrics_opd-grpo_qwen3-vl-8b-instruct_g5-step260

9B • Updated 23 days ago • 157

updated a model 23 days ago

rb-dev/v-rubrics_opd-grpo_qwen3-vl-8b-instruct_g5-step240

9B • Updated 23 days ago • 11

published a model 23 days ago

rb-dev/v-rubrics_opd-grpo_qwen3-vl-8b-instruct_g5-step240

9B • Updated 23 days ago • 11

updated a model 23 days ago

rb-dev/v-rubrics_opd-grpo_qwen3-vl-8b-instruct_g5-step160

9B • Updated 23 days ago • 11

published a model 23 days ago

rb-dev/v-rubrics_opd-grpo_qwen3-vl-8b-instruct_g5-step160

9B • Updated 23 days ago • 11

updated a model 23 days ago

rb-dev/v-rubrics_opd-grpo_qwen3-vl-8b-instruct_g5-step80

9B • Updated 23 days ago • 10

published a model 23 days ago

rb-dev/v-rubrics_opd-grpo_qwen3-vl-8b-instruct_g5-step80

9B • Updated 23 days ago • 10

updated a dataset 23 days ago

rb-dev/rubrics_train_data

Viewer • Updated 23 days ago • 101k • 13

upvoted a paper 24 days ago

Supervised Fine-Tuning versus Reinforcement Learning: A Study of Post-Training Methods for Large Language Models

Paper • 2603.13985 • Published 26 days ago • 10

submitted a paper to Daily Papers 24 days ago

Supervised Fine-Tuning versus Reinforcement Learning: A Study of Post-Training Methods for Large Language Models

Paper • 2603.13985 • Published 26 days ago • 10

updated a model about 1 month ago

rb-dev/Qwen3-VL-8B-Instruct-sft-epoch-3

9B • Updated Mar 9

published a model about 1 month ago

rb-dev/Qwen3-VL-8B-Instruct-sft-epoch-3

9B • Updated Mar 9

updated a model about 1 month ago

rb-dev/Qwen3-VL-8B-Instruct-sft-epoch-2

9B • Updated Mar 9

published a model about 1 month ago

rb-dev/Qwen3-VL-8B-Instruct-sft-epoch-2

9B • Updated Mar 9

updated a model about 1 month ago

rb-dev/Qwen3-VL-8B-Instruct-sft-epoch-1

9B • Updated Mar 9

published a model about 1 month ago

rb-dev/Qwen3-VL-8B-Instruct-sft-epoch-1

9B • Updated Mar 9

Jiarui Yao

AI & ML interests

Recent Activity

Organizations

FlippyDora's activity