int4 llm - a roshniramesh Collection

Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

roshniramesh 's Collections

nf4 llm

fp8 llm

int4 llm

updated Jan 16, 2025

OpenVINO/phi-2-int4-ov

Text Generation • Updated Nov 5, 2024 • 20 • 1
nvidia/Gemma-2b-it-ONNX-INT4

Updated Nov 15, 2024 • 8
nvidia/Meta-Llama-3.1-8B-Instruct-ONNX-INT4

Updated Nov 15, 2024 • 21 • 6
nvidia/Meta-Llama-3.2-3B-Instruct-ONNX-INT4

Updated Nov 15, 2024 • 8
nvidia/Phi-3.5-mini-Instruct-ONNX-INT4

Updated Nov 15, 2024 • 1
nvidia/Mistral-Nemo-12B-Instruct-ONNX-INT4

Updated Nov 15, 2024 • 3
nvidia/Nemotron-Mini-4B-Instruct-ONNX-INT4

Updated Nov 18, 2024 • 6
meta-llama/Llama-3.2-1B-Instruct-SpinQuant_INT4_EO8

Text Generation • Updated Nov 18, 2024 • 84 • 38
hugging-quants/gemma-2-9b-it-AWQ-INT4

Text Generation • 9B • Updated Oct 17, 2024 • 2.01k • 8
Qwen/Qwen2-7B-Instruct-GPTQ-Int4

Text Generation • 8B • Updated Aug 21, 2024 • 473 • 29
hugging-quants/Meta-Llama-3.1-8B-Instruct-AWQ-INT4

Text Generation • Updated Aug 7, 2024 • 400k • 87
RedHatAI/Meta-Llama-3.1-8B-Instruct-quantized.w4a16

Text Generation • 8B • Updated 9 days ago • 26.2k • 30
ModelCloud/Meta-Llama-3.1-8B-gptq-4bit

Text Generation • 8B • Updated Jul 26, 2024 • 114
hugging-quants/Llama-3.2-3B-Instruct-Q4_K_M-GGUF

Text Generation • 3B • Updated Sep 25, 2024 • 21.6k • 25
hugging-quants/Meta-Llama-3.1-70B-Instruct-AWQ-INT4

Text Generation • Updated Aug 7, 2024 • 79.2k • 107
hugging-quants/Llama-3.2-1B-Instruct-Q4_K_M-GGUF

Text Generation • 1B • Updated Sep 25, 2024 • 34.8k • 19
hugging-quants/Meta-Llama-3.1-70B-Instruct-GPTQ-INT4

Text Generation • 71B • Updated Aug 7, 2024 • 5.41k • 23
hugging-quants/Meta-Llama-3.1-8B-Instruct-GPTQ-INT4

Text Generation • 8B • Updated Aug 7, 2024 • 24.3k • 41
meta-llama/Llama-Guard-3-1B-INT4

Text Generation • Updated Sep 25, 2024 • 16 • 27
meta-llama/Llama-3.2-3B-Instruct-QLORA_INT4_EO8

Text Generation • Updated Nov 18, 2024 • 50 • 71
meta-llama/Llama-3.2-3B-Instruct-SpinQuant_INT4_EO8

Text Generation • Updated Nov 18, 2024 • 47 • 37
meta-llama/Llama-3.2-1B-Instruct-QLORA_INT4_EO8

Text Generation • Updated Nov 18, 2024 • 130 • 48
RedHatAI/Mistral-7B-Instruct-v0.3-GPTQ-4bit

Text Generation • 7B • Updated Jun 10, 2024 • 1.04k • 23
RedHatAI/Mistral-7B-Instruct-v0.3-quantized.w4a16

Text Generation • 7B • Updated Mar 13, 2025 • 124 • 2
RedHatAI/Llama-2-7b-chat-quantized.w4a16

Text Generation • 7B • Updated Jul 18, 2024 • 19
RedHatAI/Meta-Llama-3-8B-Instruct-quantized.w4a16

Text Generation • 8B • Updated Jul 18, 2024 • 26 • 2
RedHatAI/Meta-Llama-3-70B-Instruct-quantized.w4a16

Text Generation • 71B • Updated Aug 29, 2024 • 195 • 2
RedHatAI/gemma-2-2b-it-quantized.w4a16

Text Generation • 1B • Updated Oct 9, 2024 • 19 • 1
RedHatAI/gemma-2-9b-it-quantized.w4a16

Text Generation • 3B • Updated Oct 9, 2024 • 37 • 2
RedHatAI/Mistral-Nemo-Instruct-2407-quantized.w4a16

Text Generation • 3B • Updated Oct 9, 2024 • 470 • 4
RedHatAI/Meta-Llama-3.1-70B-Instruct-quantized.w4a16

Text Generation • 71B • Updated Feb 12, 2025 • 3.78k • 32
nvidia/Mistral-7B-Instruct-v0.3-ONNX-INT4

Updated Nov 15, 2024 • 6
OpenVINO/mistral-7b-instruct-v0.1-int4-ov

Text Generation • Updated Oct 29, 2024 • 13
OpenVINO/Mistral-7B-Instruct-v0.2-int4-ov

Text Generation • Updated Oct 31, 2024 • 561 • 1
Qwen/Qwen-72B-Chat-Int4

Text Generation • 72B • Updated Jan 4, 2024 • 223 • 47
Qwen/Qwen-14B-Chat-Int4

Text Generation • 14B • Updated Dec 13, 2023 • 45.6k • 100
Qwen/Qwen-7B-Chat-Int4

Text Generation • 8B • Updated Jan 4, 2024 • 609 • 75
Qwen/Qwen-1_8B-Chat-Int4

Text Generation • Updated Dec 13, 2023 • 310 • 36
Qwen/Qwen1.5-110B-Chat-GPTQ-Int4

Text Generation • 111B • Updated Apr 30, 2024 • 128 • 18
Qwen/Qwen1.5-1.8B-Chat-GPTQ-Int4

Text Generation • 2B • Updated Apr 30, 2024 • 131 • 7
Qwen/Qwen1.5-MoE-A2.7B-Chat-GPTQ-Int4

Text Generation • 14B • Updated Jun 9, 2024 • 1.03k • 50
Qwen/Qwen1.5-4B-Chat-GPTQ-Int4

Text Generation • 4B • Updated Apr 30, 2024 • 100 • 6
Qwen/Qwen1.5-72B-Chat-GPTQ-Int4

Text Generation • 72B • Updated Apr 30, 2024 • 1.38k • 37
Qwen/Qwen1.5-4B-Chat-GGUF

Text Generation • 4B • Updated Apr 9, 2024 • 613 • 16
Qwen/Qwen1.5-0.5B-Chat-GGUF

Text Generation • 0.6B • Updated Apr 9, 2024 • 3.95k • 35
Qwen/Qwen1.5-7B-Chat-GGUF

Text Generation • 8B • Updated Apr 9, 2024 • 2.57k • 70
Qwen/CodeQwen1.5-7B-Chat-GGUF

Text Generation • 7B • Updated Apr 23, 2024 • 913 • 110
Qwen/Qwen2.5-1.5B-Instruct-GPTQ-Int4

Text Generation • 2B • Updated Oct 9, 2024 • 1.39k • 3
Qwen/Qwen2.5-0.5B-Instruct-GPTQ-Int4

Text Generation • 0.5B • Updated Sep 19, 2024 • 791 • 9
Qwen/Qwen2.5-0.5B-Instruct-GGUF

Text Generation • 0.6B • Updated Sep 20, 2024 • 51.7k • 74
Qwen/Qwen2-1.5B-Instruct-GGUF

Text Generation • 2B • Updated Jun 18, 2024 • 7.51k • 27
Qwen/Qwen2-0.5B-Instruct-GGUF

Text Generation • 0.5B • Updated Aug 21, 2024 • 20.7k • 71
Qwen/Qwen2-7B-Instruct-GGUF

Text Generation • 8B • Updated Aug 21, 2024 • 4.41k • 178
Qwen/Qwen2-0.5B-Instruct-GPTQ-Int4

Text Generation • 0.6B • Updated Aug 21, 2024 • 142 • 15
Qwen/Qwen2-1.5B-Instruct-GPTQ-Int4

Text Generation • 2B • Updated Aug 21, 2024 • 19.4k • 5
Qwen/Qwen2-72B-Instruct-GPTQ-Int4

Text Generation • 73B • Updated Aug 21, 2024 • 81 • 33
Qwen/Qwen2-57B-A14B-Instruct-GPTQ-Int4

Text Generation • 57B • Updated Aug 21, 2024 • 98 • 23

Collection guide
Browse collections

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs