nvidia
/

Qwen-3-Nemotron-32B-Reward

Text Classification

text-embeddings-inference

Model card Files Files and versions

odelalleau commited on May 30, 2025

Commit

309c6a8

·

verified ·

1 Parent(s): aca6709

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -74,7 +74,7 @@ As of 29 May 2025, Qwen-3-Nemotron-32B-Reward has comparable scores on [JudgeBen
 ## Use Case
-Qwen-3-Nemotron-32B-Reward assigns a reward score to each LLM-generated response in a user–assistant dialogue.
 ## Release Date
@@ -150,7 +150,7 @@ If you find this model useful, please cite the following work:
 ```bibtex
 @misc{wang2025helpsteer3preferenceopenhumanannotatedpreference,
-      title={HelpSteer3-Preference: Open Human-Annotated Preference Data across Diverse Tasks and Languages},
       author={Zhilin Wang and Jiaqi Zeng and Olivier Delalleau and Hoo-Chang Shin and Felipe Soares and Alexander Bukharin and Ellie Evans and Yi Dong and Oleksii Kuchaiev},
       year={2025},
       eprint={2505.11475},

 ## Use Case
+Qwen-3-Nemotron-32B-Reward assigns a reward score to an LLM-generated response in a user–assistant dialogue.
 ## Release Date
 ```bibtex
 @misc{wang2025helpsteer3preferenceopenhumanannotatedpreference,
+      title={Help{S}teer3-{P}reference: Open Human-Annotated Preference Data across Diverse Tasks and Languages},
       author={Zhilin Wang and Jiaqi Zeng and Olivier Delalleau and Hoo-Chang Shin and Felipe Soares and Alexander Bukharin and Ellie Evans and Yi Dong and Oleksii Kuchaiev},
       year={2025},
       eprint={2505.11475},