Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

One-click Deployment

Inference Endpoints

Microsoft Foundry

Amazon SageMaker AI

Misc

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

913

Base only

Active filters: modelopt

LGAI-EXAONE/K-EXAONE-2.0-750B-A37B-NVFP4

Text Generation • 411B • Updated 3 days ago • 84 • 34

baseten/GLM-5.2-Vision-NVFP4

Image-Text-to-Text • 381B • Updated 12 days ago • 3.75k • 139

nvidia/Qwen3.6-35B-A3B-NVFP4

Text Generation • 19B • Updated Jun 12 • 11M • 528

nvidia/GLM-5.2-NVFP4

Text Generation • 381B • Updated Jun 26 • 1.62M • 303

nvidia/Qwen3.6-27B-NVFP4

Text Generation • 18B • Updated Jun 30 • 1.97M • 416

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4

Text Generation • 335B • Updated Jun 24 • 244k • • 276

brandonmusic/GLM-5.2-EXL3-TR3-3.0bpw

Text Generation • 158B • Updated 6 days ago • 843 • 12

0xSero/GLM-5.2-TR3-Vision

Image-Text-to-Text • 159B • Updated 7 days ago • 248 • 8

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

Text Generation • 67B • Updated May 1 • 2.92M • 410

PassingByPixels/Qwen3.6-27B-Architect-Polaris2-Fable-B-F451-NVFP4

Image-Text-to-Text • 15B • Updated 5 days ago • 5.2k • 12

PassingByPixels/Qwen3.6-27B-Architect-Polaris2-Fable-B-F451-NVFP4-MTP

Image-Text-to-Text • 15B • Updated 5 days ago • 1.17k • 6

nvidia/llama-nemotron-rerank-vl-1b-v2-fp8

Text Ranking • 2B • Updated 5 days ago • 117 • 5

nvidia/MiniMax-M3-NVFP4

Text Generation • 247B • Updated Jun 26 • 563k • 72

willfalco/GLM-5.2-EXL3-TR3-3.25bpw

Text Generation • 169B • Updated about 23 hours ago • 236 • 5

sakamakismile/DeepSeek-V4-Flash-0731-Abliterated-NVFP4

Text Generation • 304B • Updated about 8 hours ago • 5

nvidia/Gemma-4-31B-IT-NVFP4

Text Generation • 21B • Updated 20 days ago • 2.84M • • 547

nvidia/Gemma-4-26B-A4B-NVFP4

Text Generation • 14B • Updated May 11 • 1.39M • 125

nvidia/Qwen3.5-122B-A10B-NVFP4

Text Generation • 65B • Updated Jun 2 • 249k • 47

nvidia/diffusiongemma-26B-A4B-it-NVFP4

Text Generation • 14B • Updated 29 days ago • 1.73M • 113

madeby561/GLM-5.2-MXFP8-NVFP4-NF3-Hybrid

318B • Updated 5 days ago • 5.24k • 67

Jiunsong/SuperGLM-5.2-abliterated-NVFP4

Text Generation • 381B • Updated 10 days ago • 4.38k • 54

nvidia/Nemotron-3-Embed-1B-NVFP4

Sentence Similarity • 0.7B • Updated 3 days ago • 34.7k • 72

0xSero/GLM-5.2-MXFP8-NVFP4-NF3-Hybrid-Vision

Image-Text-to-Text • 348B • Updated 7 days ago • 156 • 7

jacklarmer/GLM-5.2-Abliterated-MXFP8-NVFP4-NF3-Hybrid

Text Generation • 318B • Updated 3 days ago • 59 • 3

JasonW2025/Laguna-S-2.1-ModelOpt-NVFP4-W4A4-vllm

Text Generation • 61B • Updated 4 days ago • 68 • 3

nvidia/Qwen3-Next-80B-A3B-Instruct-NVFP4

Text Generation • Updated Feb 9 • 40.9k • 43

nvidia/Qwen3-Coder-480B-A35B-Instruct-NVFP4

Text Generation • 241B • Updated Feb 5 • 1.42k • 17

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-FP8

Text Generation • 124B • Updated Apr 29 • 214k • 271

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-NVFP4

Any-to-Any • 18B • Updated May 5 • 1.52M • 167

llmfan46/Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved-NVFP4-GGUF

Image-Text-to-Text • 0.5B • Updated May 7 • 10.4k • 38