Salman Rahman PRO

salmannyu

·

https://salmanrahman.net/

AI & ML interests

Natural Language Processing, Deep Learning, Scalable Oversight, and Language Model Evaluation

Recent Activity

upvoted a paper about 8 hours ago

Understanding Reasoning from Pretraining to Post-Training

updated a model 20 days ago

salmannyu/first-mistake-rl-results

published a model 20 days ago

salmannyu/first-mistake-rl-results

View all activity

Organizations

Papers 5

arxiv:2604.18574

arxiv:2504.13203

arxiv:2504.07830

arxiv:2402.10965

spaces 1

Argilla Space

models 28

salmannyu/first-mistake-rl-results

Updated 20 days ago

salmannyu/model-checkpoints

salmannyu/llama_base_thinking_sft_noisy_reward_0_9

salmannyu/llama_base_thinking_sft_majority_vote_math_1024_sample_8k

salmannyu/mid_train_llama_52b_thinking_data_effect_math_8_sample

salmannyu/mid_train_llama_52b_thinking_noisy_reward_math_0.7_sample

salmannyu/mid_train_llama_52b_thinking_noisy_reward_math_0.9_sample

salmannyu/mid_train_llama_52b_thinking_majority_vote_math_1024_sample

salmannyu/mid_train_llama_52b_thinking_data_effect_math_2048_sample

salmannyu/data_effect_scp_do_llama_3b_2048_sample

datasets 0

None public yet