Большинство ученых скрывают исходные данные своих ИИ-исследований

Исследования, связанные с ИИ, — непрозрачная и сложная история пишет журнал Science. Главная проблема в том, что большинство исследователей не публикуют исходный код своих работ и обучающую алгоритм выборку. Это приводит к тому, что воссоздать результаты работы почти невозможно, а значит нельзя устроить полноценное сравнение или организовать работу по улучшению результатов.
Издание ссылается на исследование профессора Норвежского университета естественных и технических наук Одда Эрика Гюндерсена. Тот изучил 400 работ в сфере искусственного интеллекта, представленных на конференциях в течение нескольких последних лет. Оказалось, что только в 6% из них представлен исходный код. Половина работ идет с ограниченным описанием алгоритма, представленном в формате псевдокода. И только треть ученых поделилась данными, на которых проводились исследования.
Гюндерсен считает это большой проблемой, близкой к кризису. Невозможность воспроизвести эксперименты с ИИ других ученых ставит их результаты под вопрос. Помимо кризиса доверия, такая практика и в целом тормозит всю область машинного обучения. К слову, ранее с кризисом воспроизводимости столкнулась психология, медицина и другие области науки. Но считалось, что область, связанная с ИИ, защищена от этого, ведь всегда есть исходный код, есть данные — все это позволяет воспроизводить эксперименты до мельчайших подробностей. Но на практике все иначе.
Исследователи находят тысячи причин, чтобы не публиковать тренировочную выборку и исходный код, пишет издание. Они начинаются с объективных — соглашение о неразглашении или желание обогнать конкурентов — и заканчиваются «детскими» отговорками, вроде, «у нас полетел жесткий диск с данными». И Гюндерсен, и Science понимают причины, препятствующие публикации исходных данных, но протестуют против того, чтобы это тормозило развитие ИИ.
Другие ученые, например, Питер Хендерсон из Университета Макгилл в Монреале, отмечают, что именно в области машинного обучения и ИИ особенно важны точные исходные данные. Говоря "точные, он имеет в виду совпадение до последнего знака в коде. Он также подразумевает, что данные для тренировки алгоритма должны быть представлены. Свое мнение он подтверждает на примерах, запуская один и тот же алгоритм с самыми незначительными изменениями в тренировочной выборке или в коде. По описанию, это по-прежнему одна и та же программа, но результаты абсолютно противоположные. Поэтому Science, Гюндерсен и его коллеги приходят к выводу, что без исходного кода полноценное сравнение и реакция на работы в сфере ИИ других ученых невозможны.

Источник: hightech.fm

ЭТО ИНТЕРЕСНО

Пятничный чат ITC: Windows 25H2 наконец-то без «мусора», Gemini контролирует ваш смартфон и универсал-дальнобойщик от BYD

12.07.2025

Утечка зарплат «Супермена» — одна из звезд заработала в три раза больше, чем Дэвид Коренсвет

12.07.2025

Большинство ученых скрывают исходные данные своих ИИ-исследований

Пятничный чат ITC: Windows 25H2 наконец-то без «мусора», Gemini контролирует ваш смартфон и универсал-дальнобойщик от BYD

Утечка зарплат «Супермена» — одна из звезд заработала в три раза больше, чем Дэвид Коренсвет

Читайте так-же

Пятничный чат ITC: Windows 25H2 наконец-то без «мусора», Gemini контролирует ваш смартфон и универсал-дальнобойщик от BYD

Утечка зарплат «Супермена» — одна из звезд заработала в три раза больше, чем Дэвид Коренсвет

24 мировых рекорда: электрогиперкар Rimac Nevera R за €2,3 млн демонстрирует потенциал EV

YouTube разворачивает плеер «как в Apple» и убирает страницу «Тренды»

Hyundai показала заряженный IONIQ 6 N: 641 л.с., 3,2 секунды до сотни и имитация звука ДВС

ТОП НОВОСТИ

Пятничный чат ITC: Windows 25H2 наконец-то без «мусора», Gemini контролирует ваш смартфон и универсал-дальнобойщик от BYD

Мод превращает Dark Souls 3 в игру в стиле Bloodborne

Утечка зарплат «Супермена» — одна из звезд заработала в три раза больше, чем Дэвид Коренсвет

Sea of Thieves получит платные кастомные серверы в начале 2026 года

24 мировых рекорда: электрогиперкар Rimac Nevera R за €2,3 млн демонстрирует потенциал EV

ПОПУЛЯРНОЕ

Новый геймплей Mafia: The Old Country – больше деталей через неделю

«Совершенное оружие. Война, саботаж и страх в киберэпоху»: как происходили самые громкие кибератаки в истории

Нейросеть цифровых копий разума

Ryzen 7 7700X, RTX 3060 и всего 20 ГБ свободного места — опубликованы системные требования Killing Floor 3

Редкий случай, когда без переплаты за бренд. Обзор OnePlus 13 — в этот раз хорош