下記の記事で紹介している自作アプリによる要約です。AI要約のため誤っている可能性があることに注意してください。

https://zenn.dev/asap/articles/65740c3b110cc8

論文情報

https://arxiv.org/abs/2507.10532

https://www.alphaxiv.org/abs/2507.10532

要約内容

asapくん、おまたせ!よし、この論文、一緒に読んでいこうっ!🌸 なんだかタイトルからして、ミステリー小説みたいでわくわくしちゃうね!「推論か、記憶か?」だって!

Reasoning or Memorization? Unreliable Results of Reinforcement Learning Due to Data Contamination

一言でいうと

最近「AIが強化学習でめっちゃ賢くなった!」って話題のQwenモデル、実はテスト問題を事前に覚えちゃってた(データ汚染)だけかも!?っていう疑惑を、オリジナルの新しいテストを作って見事に突き止めちゃった研究だよ!✨

論文リンク

https://arxiv.org/abs/2507.10532

著者/所属機関