OpenMOSS

Team

university

http://openmoss.sii.edu.cn/

OpenMOSS

Activity Feed Request to join this org

AI & ML interests

LLM

Recent Activity

CCCCyx new activity 4 days ago

OpenMOSS-Team/MOSS-VL-Instruct-0408:Update modeling_moss_vl.py

CCCCyx updated a model 6 days ago

OpenMOSS-Team/MOSS-VL-Base-0408

CCCCyx updated a model 7 days ago

OpenMOSS-Team/MOSS-VL-Instruct-0408

View all activity

Papers

MOSS-TTS Technical Report

AI Can Learn Scientific Taste

View all Papers

OpenMOSS-Team 's collections 21

MOSS-Audio

An open-source audio understanding model supporting speech recognition, environmental sound analysis, music understanding, time-aware QA, and complex

Running on Zero

Agents

14

MOSS Audio 8B Thinking

🐢

14

Generate answers to audio or video prompts
OpenMOSS-Team/MOSS-Audio-4B-Instruct

Audio-Text-to-Text • 5B • Updated 15 days ago • 883 • 38
OpenMOSS-Team/MOSS-Audio-4B-Thinking

Audio-Text-to-Text • 5B • Updated 15 days ago • 459 • 24
OpenMOSS-Team/MOSS-Audio-8B-Instruct

Audio-Text-to-Text • 9B • Updated 15 days ago • 635 • 34

MOSS-VL

OpenMOSS-Team/MOSS-VL-Instruct-0408

Video-Text-to-Text • 11B • Updated 7 days ago • 658 • 92
OpenMOSS-Team/MOSS-VL-Base-0408

Video-Text-to-Text • 11B • Updated 6 days ago • 302 • 59

AI Can Learn Scientific Taste

AI Can Learn Scientific Taste

Paper • 2603.14473 • Published Mar 15 • 426
OpenMOSS-Team/SciJudgeBench

Preview • Updated Mar 17 • 178 • 8
OpenMOSS-Team/SciJudge-4B

Text Generation • 4B • Updated Mar 17 • 114 • • 6
OpenMOSS-Team/SciJudge-30B

Text Generation • 31B • Updated Mar 17 • 392 • 12

MOVA

OpenMOSS-Team/MOVA-360p

Image-to-Video • Updated Feb 15 • 66.9k • 213
OpenMOSS-Team/MOVA-720p

Any-to-Any • Updated Feb 11 • 630 • 130
MOVA: Towards Scalable and Synchronized Video-Audio Generation

Paper • 2602.08794 • Published Feb 9 • 159

MOSS Transcribe Diarize

A unified multimodal large language model for end-to-end speaker-attributed, time-stamped transcription.

MOSS Transcribe Diarize: Accurate Transcription with Speaker Diarization

Paper • 2601.01554 • Published Jan 4 • 60
Running

Agents

Featured

58

MOSS Transcribe Diarize

🏢

58

Transcribe audio/video with speaker diarization

ABC-Bench

Evaluating Agentic Backend Coding Capabilities in Real-World Development Scenarios

ABC-Bench: Benchmarking Agentic Backend Coding in Real-World Development

Paper • 2601.11077 • Published Jan 16 • 67
OpenMOSS-Team/ABC-Bench

Viewer • Updated Jan 20 • 224 • 251 • 4
OpenMOSS-Team/Qwen3-32B-ABC

Text Generation • 33B • Updated Jan 20 • 47 • 3
OpenMOSS-Team/Qwen3-8B-ABC

Text Generation • 8B • Updated Jan 20 • 17 • 3

Game-RL

[ICLR 2026] Game-RL: Synthesizing Multimodal Verifiable Game Data to Boost VLMs' General Reasoning

OpenMOSS-Team/GameQA-140K

Updated Mar 19 • 227 • 18
OpenMOSS-Team/GameQA-5K

Preview • Updated Jun 22, 2025 • 77 • 2
OpenMOSS-Team/Game-RL-Qwen2.5-VL-7B

Image-Text-to-Text • 8B • Updated Jul 27, 2025 • 11 • 1
OpenMOSS-Team/Game-RL-InternVL3-8B

8B • Updated Jun 17, 2025 • 10 • 2

DiRL

An Efficient Training Framework for Diffusion Language Models

OpenMOSS-Team/DiRL-8B-Instruct

Text Generation • 8B • Updated Jan 20 • 108 • 13

MOSS Embodied Planner

World Modeling Makes a Better Planner: Dual Preference Optimization for Embodied Task Planning

Paper • 2503.10480 • Published Mar 13, 2025 • 57
Unleashing Embodied Task Planning Ability in LLMs via Reinforcement Learning

Paper • 2506.23127 • Published Jun 29, 2025 • 2
World-aware Planning Narratives Enhance Large Vision-Language Model Planner

Paper • 2506.21230 • Published Jun 26, 2025 • 1
OpenMOSS-Team/Embodied_R1-ScienceWorld

8B • Updated Jun 30, 2025 • 5 • 1

MHA2MLA-refactor

The MHA2MLA model published in the paper "Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-Based LLMs"

OpenMOSS-Team/SmolLM-135M-MLA-d_kv_8-refactor

Text Generation • 0.1B • Updated Jun 23, 2025 • 5 • 1
OpenMOSS-Team/SmolLM-135M-MLA-d_kv_32-refactor

Text Generation • 0.1B • Updated Jun 17, 2025 • 20 • 1
OpenMOSS-Team/SmolLM-135M-MLA-d_kv_16-refactor

Text Generation • 0.1B • Updated Jun 17, 2025 • 7 • 1
OpenMOSS-Team/SmolLM-360M-MLA-d_kv_8-refactor

Text Generation • 0.3B • Updated Jun 17, 2025 • 5 • 1

MOSS

OpenMOSS-Team/moss-moon-003-sft-plugin

Text Generation • Updated Apr 25, 2023 • 257 • 71
OpenMOSS-Team/moss-moon-003-sft

Text Generation • Updated Apr 25, 2023 • 2.4k • 128
OpenMOSS-Team/moss-moon-003-base

Text Generation • Updated Apr 25, 2023 • 2.37k • 132
OpenMOSS-Team/moss-moon-003-sft-int4

Text Generation • Updated Apr 26, 2023 • 36 • 41

MOSS-Video-Preview

OpenMOSS-Team/moss-video-preview-base

Video-Text-to-Text • 11B • Updated Mar 22 • 93 • 12
OpenMOSS-Team/moss-video-preview-sft

Video-Text-to-Text • 11B • Updated Mar 22 • 114 • 7
OpenMOSS-Team/moss-video-preview-realtime-sft

Video-Text-to-Text • 11B • Updated Mar 22 • 47 • 16

MOSS-TTS

OpenMOSS-Team/MOSS-TTS

Text-to-Speech • 8B • Updated Mar 20 • 45.1k • 389
OpenMOSS-Team/MOSS-TTS-Local-Transformer

Text-to-Speech • 3B • Updated Mar 20 • 97.1k • 27
OpenMOSS-Team/MOSS-TTS-Realtime

Text-to-Speech • 2B • Updated Mar 20 • 23.8k • 80
OpenMOSS-Team/MOSS-TTS-Nano-100M

Text-to-Speech • Updated 16 days ago • 62.1k • 177

Llama Scope 2

Opensource Lorsas and Transcoders

OpenMOSS-Team/Llama-Scope-2

Updated Feb 10 • 1
OpenMOSS-Team/Llama-Scope-2-Qwen3-1.7B

Updated 27 days ago • 3

MOSS-TTSD

OpenMOSS-Team/MOSS-TTSD-v1.0

Text-to-Speech • 8B • Updated Feb 14 • 12.3k • 55
OpenMOSS-Team/MOSS-TTSD-v0.7

Text-to-Speech • 2B • Updated Nov 11, 2025 • 188 • 18
OpenMOSS-Team/MOSS-TTSD-v0.5

Text-to-Speech • 2B • Updated Sep 2, 2025 • 441 • 54
OpenMOSS-Team/MOSS-TTSD-v0

Text-to-Speech • 2B • Updated Jun 20, 2025 • 9 • 28

MOSS-Speech

True Speech-to-Speech Langugage Model

OpenMOSS-Team/MOSS-Speech

9B • Updated Sep 30, 2025 • 60 • 20
OpenMOSS-Team/MOSS-Speech-Codec

0.9B • Updated Oct 1, 2025 • 32 • 6
Running on Zero

Agents

19

MOSS-Speech Demo

🚀

19

True Speech-to-Speech Language Model
MOSS-Speech: Towards True Speech-to-Speech Models Without Text Guidance

Paper • 2510.00499 • Published Oct 1, 2025 • 22

FutureOmni

First Omni-modal Future Forecasting Benchmark

OpenMOSS-Team/FutureOmni

Viewer • Updated Jan 22 • 1.03k • 866 • 6
FutureOmni: Evaluating Future Forecasting from Omni-Modal Context for Multimodal LLMs

Paper • 2601.13836 • Published Jan 20 • 37

FRoM-W1

https://github.com/OpenMOSS/FRoM-W1

OpenMOSS-Team/FRoM-W1

Updated Feb 4 • 10
OpenMOSS-Team/FRoM-W1-Datasets

Viewer • Updated Jan 29 • 166k • 589 • 7
FRoM-W1: Towards General Humanoid Whole-Body Control with Language Instructions

Paper • 2601.12799 • Published Jan 19 • 4

RoboOmni

Proactive Robot Manipulation in Omni-modal Context

OpenMOSS-Team/RoboOmni

Robotics • Updated Oct 30, 2025 • 4.33k • 15
OpenMOSS-Team/OmniAction

Updated Mar 27 • 47.4k • 279
OpenMOSS-Team/OmniAction-LIBERO

Updated Mar 27 • 3.53k • 69
OpenMOSS-Team/RoboOmni-LIBERO-Spatial

Robotics • Updated Oct 31, 2025 • 27 • 3

Low Rank Sparse Attention

Open source weights of Lorsa modules introduced in "Towards Understanding the Nature of Attention with Low-Rank Sparse Decomposition".

OpenMOSS-Team/Lorsa

Updated Apr 28, 2025 • 3
OpenMOSS-Team/Lorsa-Pythia-160M

Updated May 8, 2025 • 2
OpenMOSS-Team/Lorsa-Llama-3.1-8B

Updated May 8, 2025 • 1

MHA2MLA

The MHA2MLA model published in the paper "Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-Based LLMs"

Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-based LLMs

Paper • 2502.14837 • Published Feb 20, 2025 • 4
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_16

Text Generation • 6B • Updated Mar 13, 2025 • 7 • 1
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_32

Text Generation • 6B • Updated Mar 13, 2025 • 3 • 1
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_64

Text Generation • 7B • Updated Mar 13, 2025 • 11 • 1

MOSS-Audio

An open-source audio understanding model supporting speech recognition, environmental sound analysis, music understanding, time-aware QA, and complex

Running on Zero

Agents

14

MOSS Audio 8B Thinking

🐢

14

Generate answers to audio or video prompts
OpenMOSS-Team/MOSS-Audio-4B-Instruct

Audio-Text-to-Text • 5B • Updated 15 days ago • 883 • 38
OpenMOSS-Team/MOSS-Audio-4B-Thinking

Audio-Text-to-Text • 5B • Updated 15 days ago • 459 • 24
OpenMOSS-Team/MOSS-Audio-8B-Instruct

Audio-Text-to-Text • 9B • Updated 15 days ago • 635 • 34

MOSS-Video-Preview

OpenMOSS-Team/moss-video-preview-base

Video-Text-to-Text • 11B • Updated Mar 22 • 93 • 12
OpenMOSS-Team/moss-video-preview-sft

Video-Text-to-Text • 11B • Updated Mar 22 • 114 • 7
OpenMOSS-Team/moss-video-preview-realtime-sft

Video-Text-to-Text • 11B • Updated Mar 22 • 47 • 16

MOSS-VL

OpenMOSS-Team/MOSS-VL-Instruct-0408

Video-Text-to-Text • 11B • Updated 7 days ago • 658 • 92
OpenMOSS-Team/MOSS-VL-Base-0408

Video-Text-to-Text • 11B • Updated 6 days ago • 302 • 59

MOSS-TTS

OpenMOSS-Team/MOSS-TTS

Text-to-Speech • 8B • Updated Mar 20 • 45.1k • 389
OpenMOSS-Team/MOSS-TTS-Local-Transformer

Text-to-Speech • 3B • Updated Mar 20 • 97.1k • 27
OpenMOSS-Team/MOSS-TTS-Realtime

Text-to-Speech • 2B • Updated Mar 20 • 23.8k • 80
OpenMOSS-Team/MOSS-TTS-Nano-100M

Text-to-Speech • Updated 16 days ago • 62.1k • 177

AI Can Learn Scientific Taste

AI Can Learn Scientific Taste

Paper • 2603.14473 • Published Mar 15 • 426
OpenMOSS-Team/SciJudgeBench

Preview • Updated Mar 17 • 178 • 8
OpenMOSS-Team/SciJudge-4B

Text Generation • 4B • Updated Mar 17 • 114 • • 6
OpenMOSS-Team/SciJudge-30B

Text Generation • 31B • Updated Mar 17 • 392 • 12

Llama Scope 2

Opensource Lorsas and Transcoders

OpenMOSS-Team/Llama-Scope-2

Updated Feb 10 • 1
OpenMOSS-Team/Llama-Scope-2-Qwen3-1.7B

Updated 27 days ago • 3

MOVA

OpenMOSS-Team/MOVA-360p

Image-to-Video • Updated Feb 15 • 66.9k • 213
OpenMOSS-Team/MOVA-720p

Any-to-Any • Updated Feb 11 • 630 • 130
MOVA: Towards Scalable and Synchronized Video-Audio Generation

Paper • 2602.08794 • Published Feb 9 • 159

MOSS-TTSD

OpenMOSS-Team/MOSS-TTSD-v1.0

Text-to-Speech • 8B • Updated Feb 14 • 12.3k • 55
OpenMOSS-Team/MOSS-TTSD-v0.7

Text-to-Speech • 2B • Updated Nov 11, 2025 • 188 • 18
OpenMOSS-Team/MOSS-TTSD-v0.5

Text-to-Speech • 2B • Updated Sep 2, 2025 • 441 • 54
OpenMOSS-Team/MOSS-TTSD-v0

Text-to-Speech • 2B • Updated Jun 20, 2025 • 9 • 28

MOSS Transcribe Diarize

A unified multimodal large language model for end-to-end speaker-attributed, time-stamped transcription.

MOSS Transcribe Diarize: Accurate Transcription with Speaker Diarization

Paper • 2601.01554 • Published Jan 4 • 60
Running

Agents

Featured

58

MOSS Transcribe Diarize

🏢

58

Transcribe audio/video with speaker diarization

MOSS-Speech

True Speech-to-Speech Langugage Model

OpenMOSS-Team/MOSS-Speech

9B • Updated Sep 30, 2025 • 60 • 20
OpenMOSS-Team/MOSS-Speech-Codec

0.9B • Updated Oct 1, 2025 • 32 • 6
Running on Zero

Agents

19

MOSS-Speech Demo

🚀

19

True Speech-to-Speech Language Model
MOSS-Speech: Towards True Speech-to-Speech Models Without Text Guidance

Paper • 2510.00499 • Published Oct 1, 2025 • 22

ABC-Bench

Evaluating Agentic Backend Coding Capabilities in Real-World Development Scenarios

ABC-Bench: Benchmarking Agentic Backend Coding in Real-World Development

Paper • 2601.11077 • Published Jan 16 • 67
OpenMOSS-Team/ABC-Bench

Viewer • Updated Jan 20 • 224 • 251 • 4
OpenMOSS-Team/Qwen3-32B-ABC

Text Generation • 33B • Updated Jan 20 • 47 • 3
OpenMOSS-Team/Qwen3-8B-ABC

Text Generation • 8B • Updated Jan 20 • 17 • 3

FutureOmni

First Omni-modal Future Forecasting Benchmark

OpenMOSS-Team/FutureOmni

Viewer • Updated Jan 22 • 1.03k • 866 • 6
FutureOmni: Evaluating Future Forecasting from Omni-Modal Context for Multimodal LLMs

Paper • 2601.13836 • Published Jan 20 • 37

Game-RL

[ICLR 2026] Game-RL: Synthesizing Multimodal Verifiable Game Data to Boost VLMs' General Reasoning

OpenMOSS-Team/GameQA-140K

Updated Mar 19 • 227 • 18
OpenMOSS-Team/GameQA-5K

Preview • Updated Jun 22, 2025 • 77 • 2
OpenMOSS-Team/Game-RL-Qwen2.5-VL-7B

Image-Text-to-Text • 8B • Updated Jul 27, 2025 • 11 • 1
OpenMOSS-Team/Game-RL-InternVL3-8B

8B • Updated Jun 17, 2025 • 10 • 2

FRoM-W1

https://github.com/OpenMOSS/FRoM-W1

OpenMOSS-Team/FRoM-W1

Updated Feb 4 • 10
OpenMOSS-Team/FRoM-W1-Datasets

Viewer • Updated Jan 29 • 166k • 589 • 7
FRoM-W1: Towards General Humanoid Whole-Body Control with Language Instructions

Paper • 2601.12799 • Published Jan 19 • 4

DiRL

An Efficient Training Framework for Diffusion Language Models

OpenMOSS-Team/DiRL-8B-Instruct

Text Generation • 8B • Updated Jan 20 • 108 • 13

RoboOmni

Proactive Robot Manipulation in Omni-modal Context

OpenMOSS-Team/RoboOmni

Robotics • Updated Oct 30, 2025 • 4.33k • 15
OpenMOSS-Team/OmniAction

Updated Mar 27 • 47.4k • 279
OpenMOSS-Team/OmniAction-LIBERO

Updated Mar 27 • 3.53k • 69
OpenMOSS-Team/RoboOmni-LIBERO-Spatial

Robotics • Updated Oct 31, 2025 • 27 • 3

MOSS Embodied Planner

World Modeling Makes a Better Planner: Dual Preference Optimization for Embodied Task Planning

Paper • 2503.10480 • Published Mar 13, 2025 • 57
Unleashing Embodied Task Planning Ability in LLMs via Reinforcement Learning

Paper • 2506.23127 • Published Jun 29, 2025 • 2
World-aware Planning Narratives Enhance Large Vision-Language Model Planner

Paper • 2506.21230 • Published Jun 26, 2025 • 1
OpenMOSS-Team/Embodied_R1-ScienceWorld

8B • Updated Jun 30, 2025 • 5 • 1

Low Rank Sparse Attention

Open source weights of Lorsa modules introduced in "Towards Understanding the Nature of Attention with Low-Rank Sparse Decomposition".

OpenMOSS-Team/Lorsa

Updated Apr 28, 2025 • 3
OpenMOSS-Team/Lorsa-Pythia-160M

Updated May 8, 2025 • 2
OpenMOSS-Team/Lorsa-Llama-3.1-8B

Updated May 8, 2025 • 1

MHA2MLA-refactor

The MHA2MLA model published in the paper "Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-Based LLMs"

OpenMOSS-Team/SmolLM-135M-MLA-d_kv_8-refactor

Text Generation • 0.1B • Updated Jun 23, 2025 • 5 • 1
OpenMOSS-Team/SmolLM-135M-MLA-d_kv_32-refactor

Text Generation • 0.1B • Updated Jun 17, 2025 • 20 • 1
OpenMOSS-Team/SmolLM-135M-MLA-d_kv_16-refactor

Text Generation • 0.1B • Updated Jun 17, 2025 • 7 • 1
OpenMOSS-Team/SmolLM-360M-MLA-d_kv_8-refactor

Text Generation • 0.3B • Updated Jun 17, 2025 • 5 • 1

MHA2MLA

The MHA2MLA model published in the paper "Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-Based LLMs"

Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-based LLMs

Paper • 2502.14837 • Published Feb 20, 2025 • 4
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_16

Text Generation • 6B • Updated Mar 13, 2025 • 7 • 1
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_32

Text Generation • 6B • Updated Mar 13, 2025 • 3 • 1
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_64

Text Generation • 7B • Updated Mar 13, 2025 • 11 • 1

MOSS

OpenMOSS-Team/moss-moon-003-sft-plugin

Text Generation • Updated Apr 25, 2023 • 257 • 71
OpenMOSS-Team/moss-moon-003-sft

Text Generation • Updated Apr 25, 2023 • 2.4k • 128
OpenMOSS-Team/moss-moon-003-base

Text Generation • Updated Apr 25, 2023 • 2.37k • 132
OpenMOSS-Team/moss-moon-003-sft-int4

Text Generation • Updated Apr 26, 2023 • 36 • 41

AI & ML interests

Recent Activity

Papers

Team members 19

OpenMOSS-Team 's collections 21

MOSS Audio 8B Thinking

MOSS Transcribe Diarize

MOSS-Speech Demo

MOSS Audio 8B Thinking

MOSS Transcribe Diarize

MOSS-Speech Demo