Minwu Kim's picture

3 8

Minwu Kim

guactastesgood

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 14 days ago

InT: Self-Proposed Interventions Enable Credit Assignment in LLM Reasoning

updated a collection 16 days ago

Failure-Prefix Conditioning

updated a collection 16 days ago

Failure-Prefix Conditioning

View all activity

Organizations

upvoted a paper 14 days ago

InT: Self-Proposed Interventions Enable Credit Assignment in LLM Reasoning

Paper • 2601.14209 • Published Jan 20 • 6

updated a collection 16 days ago

Failure-Prefix Conditioning

Collection for the paper: Training Reasoning Models on Saturated Problems via Failure-Prefix Conditioning • 5 items • Updated 16 days ago

updated a dataset 16 days ago

guactastesgood/failure-prefix-conditioned-dataset-iteration-2

Viewer • Updated 16 days ago • 1.12k • 20

published a dataset 16 days ago

guactastesgood/failure-prefix-conditioned-dataset-iteration-2

Viewer • Updated 16 days ago • 1.12k • 20

updated a dataset 16 days ago

guactastesgood/failure-prefix-conditioned-dataset-iteration-1

Viewer • Updated 16 days ago • 1k • 17

updated a collection 16 days ago

Failure-Prefix Conditioning

Collection for the paper: Training Reasoning Models on Saturated Problems via Failure-Prefix Conditioning • 5 items • Updated 16 days ago

updated a model 16 days ago

guactastesgood/DeepSeek-R1-Distill-Qwen-1.5B-failure-prefix-conditioning-iteration2

Text Generation • 2B • Updated 16 days ago • 22

published a model 16 days ago

guactastesgood/DeepSeek-R1-Distill-Qwen-1.5B-failure-prefix-conditioning-iteration2

Text Generation • 2B • Updated 16 days ago • 22

updated a collection 16 days ago

Failure-Prefix Conditioning

Collection for the paper: Training Reasoning Models on Saturated Problems via Failure-Prefix Conditioning • 5 items • Updated 16 days ago

updated a model 16 days ago

guactastesgood/DeepSeek-R1-Distill-Qwen-1.5B-failure-prefix-conditioning-iteration1

2B • Updated 16 days ago • 28

authored a paper 18 days ago

On the Limits of Layer Pruning for Generative Reasoning in LLMs

Paper • 2602.01997 • Published 18 days ago • 4

upvoted a paper 18 days ago

On the Limits of Layer Pruning for Generative Reasoning in LLMs

Paper • 2602.01997 • Published 18 days ago • 4

authored a paper 18 days ago

Training Reasoning Models on Saturated Problems via Failure-Prefix Conditioning

Paper • 2601.20829 • Published 23 days ago • 6

published a model 18 days ago

guactastesgood/DeepSeek-R1-Distill-Qwen-1.5B-failure-prefix-conditioning-iteration1

2B • Updated 16 days ago • 28

updated a collection 18 days ago

Failure-Prefix Conditioning

Collection for the paper: Training Reasoning Models on Saturated Problems via Failure-Prefix Conditioning • 5 items • Updated 16 days ago

upvoted a paper 22 days ago

Training Reasoning Models on Saturated Problems via Failure-Prefix Conditioning

Paper • 2601.20829 • Published 23 days ago • 6

submitted a paper to Daily Papers 22 days ago

Training Reasoning Models on Saturated Problems via Failure-Prefix Conditioning

Paper • 2601.20829 • Published 23 days ago • 6

published a dataset 23 days ago

guactastesgood/failure-prefix-conditioned-dataset-iteration-1

Viewer • Updated 16 days ago • 1k • 17

authored a paper 9 months ago

Reinforcement Learning vs. Distillation: Understanding Accuracy and Capability in LLM Reasoning

Paper • 2505.14216 • Published May 20, 2025 • 2