5 13 12

LIU Shih-yang

sliuau

AI & ML interests

None yet

Recent Activity

authored a paper 1 day ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

upvoted a paper 1 day ago

TiDAR: Think in Diffusion, Talk in Autoregression

upvoted a paper 1 day ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

View all activity

Organizations

upvoted 2 papers 1 day ago

TiDAR: Think in Diffusion, Talk in Autoregression

Paper • 2511.08923 • Published Nov 12, 2025 • 121

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published 2 days ago • 115

upvoted a paper 19 days ago

4D-RGPT: Toward Region-level 4D Understanding via Perceptual Distillation

Paper • 2512.17012 • Published 23 days ago • 42

upvoted 2 papers about 1 month ago

ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration

Paper • 2511.21689 • Published Nov 26, 2025 • 114

Nemotron-Flash: Towards Latency-Optimal Hybrid Small Language Models

Paper • 2511.18890 • Published Nov 24, 2025 • 33

upvoted a paper 2 months ago

DLER: Doing Length pEnalty Right - Incentivizing More Intelligence per Token via Reinforcement Learning

Paper • 2510.15110 • Published Oct 16, 2025 • 15

upvoted a collection 5 months ago

Reasoning Efficiency Research

Collection

Ultra-efficient reasoning model! SOTA Accuracy / CoT Length trade-offs • 3 items • Updated 18 days ago • 11

upvoted an article 9 months ago

Article

Open R1: Update #3

Mar 11, 2025

•

296

upvoted 2 articles 11 months ago

Article

Open R1: Update #2

Feb 10, 2025

•

218

Article

Open-R1: a fully open reproduction of DeepSeek-R1

Jan 28, 2025

•

887

upvoted a paper about 1 year ago

EoRA: Training-free Compensation for Compressed LLM with Eigenspace Low-Rank Approximation

Paper • 2410.21271 • Published Oct 28, 2024 • 7

upvoted an article over 1 year ago

Article

Building DoRA Support for Embedding Layers in PEFT

Aug 23, 2024

•

upvoted a paper about 2 years ago

LLM-FP4: 4-Bit Floating-Point Quantized Transformers

Paper • 2310.16836 • Published Oct 25, 2023 • 14

LIU Shih-yang

AI & ML interests

Recent Activity

Organizations

sliuau's activity

Open R1: Update #3

Open R1: Update #2

Open-R1: a fully open reproduction of DeepSeek-R1

Building DoRA Support for Embedding Layers in PEFT