16 16

森優奈

sebbaker

AI & ML interests

None yet

Recent Activity

liked a dataset about 11 hours ago

uonlp/CulturaX

upvoted a paper about 13 hours ago

OpenComputer: Verifiable Software Worlds for Computer-Use Agents

liked a model 3 days ago

tencent/Hy-MT2-1.8B

View all activity

Organizations

None yet

upvoted a paper about 13 hours ago

OpenComputer: Verifiable Software Worlds for Computer-Use Agents

Paper • 2605.19769 • Published 10 days ago • 81

upvoted a paper 7 days ago

Video2GUI: Synthesizing Large-Scale Interaction Trajectories for Generalized GUI Agent Pretraining

Paper • 2605.14747 • Published 15 days ago • 144

upvoted a paper 8 days ago

Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information

Paper • 2605.11609 • Published 17 days ago • 193

upvoted a paper 17 days ago

HiL-Bench (Human-in-Loop Benchmark): Do Agents Know When to Ask for Help?

Paper • 2604.09408 • Published 30 days ago • 5

upvoted a paper 21 days ago

Parameter-Efficient Multi-View Proficiency Estimation: From Discriminative Classification to Generative Feedback

Paper • 2605.03848 • Published 24 days ago • 6

upvoted a paper 27 days ago

Heterogeneous Scientific Foundation Model Collaboration

Paper • 2604.27351 • Published 29 days ago • 217

upvoted 2 papers about 1 month ago

LLaDA2.0-Uni: Unifying Multimodal Understanding and Generation with Diffusion Large Language Model

Paper • 2604.20796 • Published Apr 22 • 242

GameWorld: Towards Standardized and Verifiable Evaluation of Multimodal Game Agents

Paper • 2604.07429 • Published Apr 8 • 121

upvoted 5 papers about 2 months ago

Adam's Law: Textual Frequency Law on Large Language Models

Paper • 2604.02176 • Published Apr 2 • 504

ClawBench: Can AI Agents Complete Everyday Online Tasks?

Paper • 2604.08523 • Published Apr 9 • 263

MegaStyle: Constructing Diverse and Scalable Style Dataset via Consistent Text-to-Image Style Mapping

Paper • 2604.08364 • Published Apr 9 • 101

GrandCode: Achieving Grandmaster Level in Competitive Programming via Agentic Reinforcement Learning

Paper • 2604.02721 • Published Apr 3 • 630

QiMeng-PRepair: Precise Code Repair via Edit-Aware Reward Optimization

Paper • 2604.05963 • Published Apr 7 • 8

upvoted 2 papers 2 months ago

Efficient Reasoning with Balanced Thinking

Paper • 2603.12372 • Published Mar 12 • 150

Demystifing Video Reasoning

Paper • 2603.16870 • Published Mar 17 • 372

upvoted a paper 3 months ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

Paper • 2602.08354 • Published Feb 9 • 266

森 優奈

AI & ML interests

Recent Activity

Organizations

sebbaker's activity

森優奈