1 3 5

SeanWang0027 PRO

SeanWang0027

https://haojinw0027.github.io/

AI & ML interests

Continual Learning

Recent Activity

published a dataset 3 days ago

CL-From-Nothing/rlve_teacher

updated a dataset 3 days ago

CL-From-Nothing/rlve_teacher

published a dataset 3 days ago

SeanWang0027/rlve_mixed_20envs_stitch_full

View all activity

Organizations

Collections 3

View 3 collections

Papers 2

arxiv:2602.01058

arxiv:2505.16964

models 36

SeanWang0027/mixed_sdft_solution_sudoku_qwen3_4b_thinking_1_epoch_8192_32_batch_2e-5_lr_qwen3_1_7b

Updated 19 days ago • 2

SeanWang0027/dolci-wildchat-think-singleturn

Updated 20 days ago

SeanWang0027/student_prefix_kukurasu_20K_nemotron8b_continual_Q_nemotron-cascade-8b_cutoff2048_epoch_3_mask

8B • Updated 20 days ago • 19

SeanWang0027/student_prefix_kukurasu_20K_nemotron8b_continual_Q_nemotron-cascade-8b_cutoff1024_epoch_3_mask

Updated 21 days ago

SeanWang0027/student_prefix_kukurasu_20K_nemotron8b_continual_Q_nemotron-cascade-8b_cutoff512_epoch_3_mask

8B • Updated 21 days ago • 18

SeanWang0027/sdft_sudoku_minesweeper_kukurasu_Qwen3-1.7B_1_epoch_8192_32_batch_2e-5_lr

2B • Updated 22 days ago • 18

SeanWang0027/student_prefix_kukurasu_20K_qwen3_1-7b_continual_Q_qwen3-1.7b_cutoff2048_epoch_3_mask

2B • Updated 23 days ago • 7

SeanWang0027/student_prefix_kukurasu_20K_qwen3_1-7b_continual_Q_qwen3-1.7b_cutoff1024_epoch_3_mask

2B • Updated 23 days ago • 15

SeanWang0027/student_prefix_kukurasu_20K_qwen3_1-7b_continual_Q_qwen3-1.7b_cutoff512_epoch_3_mask

2B • Updated 23 days ago • 10

SeanWang0027/sdft_minesweeper_kukurasu_Qwen3-1.7B_1_epoch_8192_32_batch_2e-5_lr

2B • Updated Mar 22 • 4

View 36 models

datasets 29

SeanWang0027/teacher_prefix_sudoku_10K_sequential_qwen3_4b_thinking_continual_nemotron-cascade-8b

Updated 7 days ago • 38

SeanWang0027/student_prefix_sequential

Viewer • Updated 10 days ago • 3k • 64 • 1

SeanWang0027/RAGEN

Updated 12 days ago • 909

SeanWang0027/mixed_sdft_solution_sequential_minesweeper_kukurasu_qwen3_4b_thinking

Updated 14 days ago • 41

SeanWang0027/teacher_prefix_sudoku_10K_qwen3_4b_thinking_continual_qwen3-1-7b-parquet_qwen3-1.7b_epoch_3

Updated 15 days ago • 30

SeanWang0027/mixed_sdft_solution_kukurasu_qwen3_4b_thinking_1_epoch_8192_32_batch_2e-5_lr_qwen3_1_7b

Updated 18 days ago • 42

SeanWang0027/mixed_sdft_solution_minesweeper_qwen3_4b_thinking_1_epoch_8192_32_batch_2e-5_lr_qwen3_1_7b

Updated 18 days ago • 43

View 29 datasets

SeanWang0027 PRO

AI & ML interests

Recent Activity

Organizations

Collections 3

SeanWang0027/olmo-7b-synlogic-sudoku-easy-grpo

SeanWang0027/olmo-7b-synlogic-sudoku-easy-hard-grpo

SeanWang0027/olmo-7b-synlogic-survo-sft

SeanWang0027/olmo-7b-synlogic-survo-space_reasoning-sft

SeanWang0027/olmo-7b-synlogic-survo-space_reasoning-math_path-sft

SeanWang0027/sci-10k-olmo-7b-synlogic-survo-space_reasoning-math_path-sft

SeanWang0027/olmo-7b-synlogic-sudoku-easy-grpo

SeanWang0027/olmo-7b-synlogic-sudoku-easy-hard-grpo

SeanWang0027/olmo-7b-synlogic-survo-sft

SeanWang0027/olmo-7b-synlogic-survo-space_reasoning-sft

SeanWang0027/olmo-7b-synlogic-survo-space_reasoning-math_path-sft

SeanWang0027/sci-10k-olmo-7b-synlogic-survo-space_reasoning-math_path-sft

Papers 2

models 36

SeanWang0027/mixed_sdft_solution_sudoku_qwen3_4b_thinking_1_epoch_8192_32_batch_2e-5_lr_qwen3_1_7b

SeanWang0027/dolci-wildchat-think-singleturn

SeanWang0027/student_prefix_kukurasu_20K_nemotron8b_continual_Q_nemotron-cascade-8b_cutoff2048_epoch_3_mask

SeanWang0027/student_prefix_kukurasu_20K_nemotron8b_continual_Q_nemotron-cascade-8b_cutoff1024_epoch_3_mask

SeanWang0027/student_prefix_kukurasu_20K_nemotron8b_continual_Q_nemotron-cascade-8b_cutoff512_epoch_3_mask

SeanWang0027/sdft_sudoku_minesweeper_kukurasu_Qwen3-1.7B_1_epoch_8192_32_batch_2e-5_lr

SeanWang0027/student_prefix_kukurasu_20K_qwen3_1-7b_continual_Q_qwen3-1.7b_cutoff2048_epoch_3_mask

SeanWang0027/student_prefix_kukurasu_20K_qwen3_1-7b_continual_Q_qwen3-1.7b_cutoff1024_epoch_3_mask

SeanWang0027/student_prefix_kukurasu_20K_qwen3_1-7b_continual_Q_qwen3-1.7b_cutoff512_epoch_3_mask

SeanWang0027/sdft_minesweeper_kukurasu_Qwen3-1.7B_1_epoch_8192_32_batch_2e-5_lr

datasets 29

SeanWang0027/rlve_mixed_20envs_stitch_full

SeanWang0027/verl_mask_training

SeanWang0027/rlve_30b_qwen_1.7b_mixed_20envs_10

SeanWang0027/teacher_prefix_sudoku_10K_sequential_qwen3_4b_thinking_continual_nemotron-cascade-8b

SeanWang0027/student_prefix_sequential

SeanWang0027/RAGEN

SeanWang0027/mixed_sdft_solution_sequential_minesweeper_kukurasu_qwen3_4b_thinking

SeanWang0027/teacher_prefix_sudoku_10K_qwen3_4b_thinking_continual_qwen3-1-7b-parquet_qwen3-1.7b_epoch_3

SeanWang0027/mixed_sdft_solution_kukurasu_qwen3_4b_thinking_1_epoch_8192_32_batch_2e-5_lr_qwen3_1_7b

SeanWang0027/mixed_sdft_solution_minesweeper_qwen3_4b_thinking_1_epoch_8192_32_batch_2e-5_lr_qwen3_1_7b

SeanWang0027 PRO

AI & ML interests

Recent Activity

Organizations

Collections 3

Papers 2

models 36 Sort: Recently updated

datasets 29 Sort: Recently updated

models 36

datasets 29