Науковий репозиторій попередніх публікацій arXiv посилює боротьбу з недбалим використанням великих мовних моделей у наукових статтях.

Попри те, що роботи публікуються на сайті ще до проходження традиційного рецензування, arXiv (вимовляється як «аркаїв») став одним з основних каналів поширення досліджень у галузях на кшталт компʼютерних наук і математики. Сам сайт також є джерелом даних про тенденції в наукових дослідженнях.
Раніше arXiv уже запровадив кроки проти зростання кількості неякісних, згенерованих ШІ робіт — зокрема, вимагаючи, щоб автори, які публікуються вперше, отримували рекомендацію від уже відомого дослідника. Після понад 20 років хостингу на серверах Корнельського університету організація також перетворюється на незалежну некомерційну структуру, що має дозволити їй залучати більше коштів і краще вирішувати проблеми на кшталт «AI‑несміття».
У своєму останньому кроці голова секції компʼютерних наук arXiv Томас Діттеріх у четвер заявив, що «якщо подання містить беззаперечні докази того, що автори не перевірили результати генерації великою мовною моделлю, це означає, що ми не можемо довіряти нічому в цій роботі».
До таких беззаперечних доказів, за словами Діттеріха, можуть належати, наприклад, «галюциновані» (вигадані) посилання, а також коментарі до чи від мовної моделі, залишені в тексті. Якщо такі докази буде виявлено, автори роботи зіткнуться з «річною забороною на публікації на arXiv, після чого всі наступні подання на arXiv мають спершу бути прийняті авторитетним рецензованим виданням».
Йдеться не про повну заборону використання ШІ‑моделей, а радше про наполягання на тому, щоб, як каже Діттеріх, автори несли «повну відповідальність» за зміст роботи, «незалежно від того, яким чином цей зміст був згенерований». Тож якщо дослідники просто копіюють із ШІ «недоречну мову, плагіат, упереджений зміст, помилки, некоректні посилання або оманливу інформацію», вони все одно відповідають за це.
Діттеріх розповів виданню 404 Media, що це буде правило «одного порушення»: спершу модератори мають позначити проблему, а голови відповідних секцій — підтвердити наявність доказів, перш ніж накладати санкції. Автори також матимуть можливість оскаржити рішення.


