MADE Benchmark - a ragarwal Collection

ragarwal 's Collections

Factual Consistency Evaluation Across Domains

MADE Benchmark

updated 2 days ago

Artefacts related to MADE: A Living Benchmark for Multi-Label Text Classification with Uncertainty Quantification of Medical Device Adverse Events

ragarwal/MADE-Multilabel-Benchmark

Viewer • Updated 2 days ago • 380k • 36
MADE: A Living Benchmark for Multi-Label Text Classification with Uncertainty Quantification of Medical Device Adverse Events

Paper • 2604.15203 • Published Apr 16 • 1