論文と社会実装の壁

これは壁 Advent Calendar 2025の記事です.

社会実装に注力している側から論文を見ると感じる壁について書く.今はあまり論文を書くモチベーションがない(この話は割愛)が,次に論文を書くときにはこの辺は抑えておきたい.

データ量の壁

社会実装側はデータがあることが多い一方で,論文では同じベンチマーク(しかもあまりサイズが大きいわけではない)をこすり続けることが多い.例えば私が仕事をしている製薬系でも,大きい会社はやはりデータの蓄積(しかも品質が一定!)がある一方で,アカデミアでは公開データベースから頑張ってキュレーションしている(実験条件が違ったり,間違えてデータが登録されていたりするので,キュレーションだけで大仕事である).データ量が大きく違うと取り得る手法も全く違うので,論文が全然参考にならなかったりする.

問題設定の壁

現場は問題しかない.多くの問題を優先順位付けして,解決し続けるしかない.なので,問題は考えるものではない.トリアージするものである.一方,自分が論文を書いているときは,問題は頑張って考えるものだと良く言われるのを耳にしていた(し,頑張って問題考えたなぁという論文も多く見る).それが実際に需要のある問題ならば良いが,そうではなく,ただの仮想の問題を解いてもしょうがない.

手法の壁

論文を書くときは,とりあえずSoTAを目指すとなると,ややこしい手法になることも多々ある.一方,社会実装しようと思うと,簡単な手法の方がありがたい.

評価の壁

機械学習では評価が一番難しいかつ大切だと思っている.社会実装では,想定したユースケースと沿うような実験設定や評価指標を考え,正しく性能評価できているかを常に疑いながら慎重に進めることが必須である.一方で,論文ではお決まりのベンチマークを無条件に信用してSoTA芸をしていることが多く見られる.

王道研究の壁

とはいいつつも,王道骨太研究は本当にすごい.普通に実応用でめっちゃ役に立つ.小手先こねくり回す論文じゃなくて,王道骨太研究をやっていこう.