12 5

XuQixin

Racktic

Racktic

AI & ML interests

NLP, mutimodel

Recent Activity

upvoted a paper about 13 hours ago

Harness-1: Reinforcement Learning for Search Agents with State-Externalizing Harnesses

upvoted a paper about 17 hours ago

Masking Stale Observations Helps Search Agents -- Until It Doesn't: A Regime Map and Its Mechanism

published a dataset 15 days ago

Racktic/DeepSearch-Attn

View all activity

Organizations

upvoted a paper about 13 hours ago

Harness-1: Reinforcement Learning for Search Agents with State-Externalizing Harnesses

Paper • 2606.02373 • Published 2 days ago • 34

upvoted a paper about 17 hours ago

Masking Stale Observations Helps Search Agents -- Until It Doesn't: A Regime Map and Its Mechanism

Paper • 2606.00408 • Published 5 days ago • 46

upvoted a paper 21 days ago

MLS-Bench: A Holistic and Rigorous Assessment of AI Systems on Building Better AI

Paper • 2605.08678 • Published 25 days ago • 9

upvoted a paper 26 days ago

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

Paper • 2605.05242 • Published May 3 • 120

upvoted a paper 2 months ago

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis

Paper • 2603.20278 • Published Mar 17 • 98

upvoted 2 papers 8 months ago

BrowserAgent: Building Web Agents with Human-Inspired Web Browsing Actions

Paper • 2510.10666 • Published Oct 12, 2025 • 28

UniVideo: Unified Understanding, Generation, and Editing for Videos

Paper • 2510.08377 • Published Oct 9, 2025 • 81

upvoted 2 papers 9 months ago

Emergent Hierarchical Reasoning in LLMs through Reinforcement Learning

Paper • 2509.03646 • Published Sep 3, 2025 • 33

Reverse-Engineered Reasoning for Open-Ended Generation

Paper • 2509.06160 • Published Sep 7, 2025 • 151

upvoted a paper 11 months ago

RLPR: Extrapolating RLVR to General Domains without Verifiers

Paper • 2506.18254 • Published Jun 23, 2025 • 35

upvoted a paper about 1 year ago

The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

Paper • 2505.22617 • Published May 28, 2025 • 132

upvoted a paper over 1 year ago

Process Reinforcement through Implicit Rewards

Paper • 2502.01456 • Published Feb 3, 2025 • 62

XuQixin

AI & ML interests

Recent Activity

Organizations

Racktic's activity