Pratyay Banerjee's picture

In a Training Loop 🔄

Pratyay Banerjee

Neilblaze

·

https://neilblaze.live

AI & ML interests

HCI, Computer Vision, Object Detection, Pattern Recognition, NLP, Supervised Learning

Recent Activity

liked a Space about 13 hours ago

webml-community/bonsai-ternary-webgpu

liked a model about 13 hours ago

prism-ml/Ternary-Bonsai-1.7B-mlx-2bit

upvoted a collection about 13 hours ago

View all activity

Organizations

upvoted a collection about 13 hours ago

Ternary Bonsai

1.58-bit Bonsai models • 9 items • Updated 4 days ago • 75

upvoted a collection about 14 hours ago

DeepSeek-V4

4 items • Updated about 23 hours ago • 476

upvoted 9 papers 5 days ago

S0 Tuning: Zero-Overhead Adaptation of Hybrid Recurrent-Attention Models

Paper • 2604.01168 • Published 23 days ago • 7

Self-Execution Simulation Improves Coding Models

Paper • 2604.03253 • Published Mar 11 • 34

ThinkTwice: Jointly Optimizing Large Language Models for Reasoning and Self-Refinement

Paper • 2604.01591 • Published 23 days ago • 41

How Well Do Agentic Skills Work in the Wild: Benchmarking LLM Skill Usage in Realistic Settings

Paper • 2604.04323 • Published 19 days ago • 41

DMax: Aggressive Parallel Decoding for dLLMs

Paper • 2604.08302 • Published 16 days ago • 51

Attention Sink in Transformers: A Survey on Utilization, Interpretation, and Mitigation

Paper • 2604.10098 • Published 14 days ago • 75

KnowRL: Boosting LLM Reasoning via Reinforcement Learning with Minimal-Sufficient Knowledge Guidance

Paper • 2604.12627 • Published 11 days ago • 98

Claw-Eval: Toward Trustworthy Evaluation of Autonomous Agents

Paper • 2604.06132 • Published 18 days ago • 117

SkillClaw: Let Skills Evolve Collectively with Agentic Evolver

Paper • 2604.08377 • Published 16 days ago • 284

upvoted 4 articles 5 days ago

Article

Training and Finetuning Multimodal Embedding & Reranker Models with Sentence Transformers

9 days ago

•

63

Article

Design Patterns for Building Agentic Workflows

Jul 14, 2025

•

10

Article

MINERVA: A Multi-Agent LLM System for Digital Scam Protection

Dec 19, 2024

•

4

Article

PangolinGuard: Fine-Tuning ModernBERT as a Lightweight Approach to AI Guardrails

Mar 23, 2025

•

13

upvoted an article 12 days ago

Article

Serverless Inference with Hugging Face and NVIDIA NIM

Jul 29, 2024

•

36

upvoted a collection 15 days ago

Qwen3.5

21 items • Updated Mar 9 • 1.57k

upvoted a paper 15 days ago

Learning to Retrieve from Agent Trajectories

Paper • 2604.04949 • Published 26 days ago • 70

upvoted an article 16 days ago

Article

Welcome Gemma 4: Frontier multimodal intelligence on device

+5

23 days ago

•

877

upvoted a collection 16 days ago

DFlash

Block Diffusion for Flash Speculative Decoding • 14 items • Updated 8 days ago • 75