Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2602.03837

SWE-Master: Unleashing the Potential of Software Engineering Agents via Post-Training

Paper • 2602.03411 • Published 13 days ago • 36
Learning Query-Specific Rubrics from Human Preferences for DeepResearch Report Generation

Paper • 2602.03619 • Published 13 days ago • 26
WorldVQA: Measuring Atomic World Knowledge in Multimodal Large Language Models

Paper • 2602.02537 • Published 19 days ago • 5
Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

Paper • 2602.03837 • Published 13 days ago • 5

Toolkit - Prompting Papers

Algorithm of Thoughts: Enhancing Exploration of Ideas in Large Language Models

Paper • 2308.10379 • Published Aug 20, 2023
Graph of Thoughts: Solving Elaborate Problems with Large Language Models

Paper • 2308.09687 • Published Aug 18, 2023 • 7
Skeleton-of-Thought: Large Language Models Can Do Parallel Decoding

Paper • 2307.15337 • Published Jul 28, 2023 • 38
Tab-CoT: Zero-shot Tabular Chain of Thought

Paper • 2305.17812 • Published May 28, 2023 • 2

Large Language Model (LLM) and NLP related papers.

LoRA+: Efficient Low Rank Adaptation of Large Models

Paper • 2402.12354 • Published Feb 19, 2024 • 7
The FinBen: An Holistic Financial Benchmark for Large Language Models

Paper • 2402.12659 • Published Feb 20, 2024 • 23
TofuEval: Evaluating Hallucinations of LLMs on Topic-Focused Dialogue Summarization

Paper • 2402.13249 • Published Feb 20, 2024 • 15
TrustLLM: Trustworthiness in Large Language Models

Paper • 2401.05561 • Published Jan 10, 2024 • 69

Interesting papers

Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published 18 days ago • 99
Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

Paper • 2602.03837 • Published 13 days ago • 5

Papers-Fundamentals

RoFormer: Enhanced Transformer with Rotary Position Embedding

Paper • 2104.09864 • Published Apr 20, 2021 • 17
Attention Is All You Need

Paper • 1706.03762 • Published Jun 12, 2017 • 111
Direct Nash Optimization: Teaching Language Models to Self-Improve with General Preferences

Paper • 2404.03715 • Published Apr 4, 2024 • 62
Zero-Shot Tokenizer Transfer

Paper • 2405.07883 • Published May 13, 2024 • 5

ChipNeMo: Domain-Adapted LLMs for Chip Design

Paper • 2311.00176 • Published Oct 31, 2023 • 9
Language Models can be Logical Solvers

Paper • 2311.06158 • Published Nov 10, 2023 • 20
JARVIS-1: Open-World Multi-task Agents with Memory-Augmented Multimodal Language Models

Paper • 2311.05997 • Published Nov 10, 2023 • 37
Lumos: Learning Agents with Unified Data, Modular Design, and Open-Source LLMs

Paper • 2311.05657 • Published Nov 9, 2023 • 30

SWE-Master: Unleashing the Potential of Software Engineering Agents via Post-Training

Paper • 2602.03411 • Published 13 days ago • 36
Learning Query-Specific Rubrics from Human Preferences for DeepResearch Report Generation

Paper • 2602.03619 • Published 13 days ago • 26
WorldVQA: Measuring Atomic World Knowledge in Multimodal Large Language Models

Paper • 2602.02537 • Published 19 days ago • 5
Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

Paper • 2602.03837 • Published 13 days ago • 5

Interesting papers

Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published 18 days ago • 99
Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

Paper • 2602.03837 • Published 13 days ago • 5

Toolkit - Prompting Papers

Algorithm of Thoughts: Enhancing Exploration of Ideas in Large Language Models

Paper • 2308.10379 • Published Aug 20, 2023
Graph of Thoughts: Solving Elaborate Problems with Large Language Models

Paper • 2308.09687 • Published Aug 18, 2023 • 7
Skeleton-of-Thought: Large Language Models Can Do Parallel Decoding

Paper • 2307.15337 • Published Jul 28, 2023 • 38
Tab-CoT: Zero-shot Tabular Chain of Thought

Paper • 2305.17812 • Published May 28, 2023 • 2

Papers-Fundamentals

RoFormer: Enhanced Transformer with Rotary Position Embedding

Paper • 2104.09864 • Published Apr 20, 2021 • 17
Attention Is All You Need

Paper • 1706.03762 • Published Jun 12, 2017 • 111
Direct Nash Optimization: Teaching Language Models to Self-Improve with General Preferences

Paper • 2404.03715 • Published Apr 4, 2024 • 62
Zero-Shot Tokenizer Transfer

Paper • 2405.07883 • Published May 13, 2024 • 5

Large Language Model (LLM) and NLP related papers.

LoRA+: Efficient Low Rank Adaptation of Large Models

Paper • 2402.12354 • Published Feb 19, 2024 • 7
The FinBen: An Holistic Financial Benchmark for Large Language Models

Paper • 2402.12659 • Published Feb 20, 2024 • 23
TofuEval: Evaluating Hallucinations of LLMs on Topic-Focused Dialogue Summarization

Paper • 2402.13249 • Published Feb 20, 2024 • 15
TrustLLM: Trustworthiness in Large Language Models

Paper • 2401.05561 • Published Jan 10, 2024 • 69

ChipNeMo: Domain-Adapted LLMs for Chip Design

Paper • 2311.00176 • Published Oct 31, 2023 • 9
Language Models can be Logical Solvers

Paper • 2311.06158 • Published Nov 10, 2023 • 20
JARVIS-1: Open-World Multi-task Agents with Memory-Augmented Multimodal Language Models

Paper • 2311.05997 • Published Nov 10, 2023 • 37
Lumos: Learning Agents with Unified Data, Modular Design, and Open-Source LLMs

Paper • 2311.05657 • Published Nov 9, 2023 • 30

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs