Сооснователь OpenAI: масштабирование искусственного интеллекта достигло предела, будущее за умными подходами к обучению

Сооснователь OpenAI Илья Сутскевер считает, что традиционные методы масштабирования крупных языковых моделей (LLM) исчерпали себя. Для значительного прогресса в будущем ИИ-компании должны обучать модели не только на больших объемах данных, но и подходить к этому процессу умнее.

ЭТО ИНТЕРЕСНО

Баги STALKER 2 ломают систему A-life, но GSC готовит исправления

22.11.2024

Новый тизер «Чужой: Земля» подтверждает ошибку в хронологии и устанавливает связь с оригинальным фильмом Ридли Скотта

22.11.2024

В интервью Reuters Сутскевер объяснил, что фаза предобучения, основополагающая для создания таких моделей, как ChatGPT, достигла своих пределов. На этапе предобучения обрабатываются огромные объемы неструктурированных данных, чтобы выявить языковые паттерны и структуры.

Ранее увеличение масштабов обучения — например, использование бОльших объемов данных — обеспечивало более мощные и способные модели. Но теперь это уже не работает. Гораздо важнее, какие данные используются для обучения и как именно этот процесс организован.

2010-е годы были временем масштабирования, а теперь мы вернулись в эпоху открытий. Все ищут следующее большое достижение.

— Сутскевер

По его словам, теперь гораздо важнее масштабировать правильные вещи, чем просто больше данных.

Эти комментарии сделаны на фоне замедления прогресса в развитии моделей, таких как ChatGPT 4.0. Основная проблема заключается в том, что ИИ-разработчики используют одни и те же общедоступные источники данных, из-за чего "просто добавлять масштаб" стало недостаточно для получения конкурентного преимущества.

Среди возможных решений рассматривается более интеллектуальный подход на этапе использования модели, известном как инференс. Здесь модели будут использовать многошаговый процесс для решения задач, включая самообучение в режиме реального времени, что приближает их мышление к человеческому.

Исследователь OpenAI Ноам Браун отметил:

Выяснилось, что заставить бота думать всего 20 секунд над одной раздачей в покере дало тот же прирост производительности, что и масштабирование модели в 100,000 раз или обучение ее в 100,000 раз дольше.

Это означает, что более длинное размышление моделей, вместо мгновенной выдачи ответа, может оказаться более эффективным. Если такая стратегия подтвердит свою продуктивность, то индустрия оборудования для ИИ может перейти от массивных кластеров для обучения к банкам графических процессоров, оптимизированных для улучшенного инференса.

Сооснователь OpenAI: масштабирование искусственного интеллекта достигло предела, будущее за умными подходами к обучению

Баги STALKER 2 ломают систему A-life, но GSC готовит исправления

Новый тизер «Чужой: Земля» подтверждает ошибку в хронологии и устанавливает связь с оригинальным фильмом Ридли Скотта

Читайте так-же

Баги STALKER 2 ломают систему A-life, но GSC готовит исправления

Новый тизер «Чужой: Земля» подтверждает ошибку в хронологии и устанавливает связь с оригинальным фильмом Ридли Скотта

Первый кадр из фильма «Франкенштейн» Гильермо дель Торо напоминает адвенчуру из 90-х годов

В Австралии представлен законопроект о запрете детям младше 16 лет пользоваться социальными сетями

У аниме по Скотту Пилигриму не будет второго сезона на Netflix

Илон Маск возглавил DOGE в новой администрации Дональда Трампа

ТОП НОВОСТИ

Баги STALKER 2 ломают систему A-life, но GSC готовит исправления

Нацкэшбек принес украинцам в октябре более 119 млн грн — втрое больше, чем в сентябре, но еще меньше 100 грн на каждого

Новый тизер «Чужой: Земля» подтверждает ошибку в хронологии и устанавливает связь с оригинальным фильмом Ридли Скотта

ПОПУЛЯРНОЕ

Обзор источников бесперебойного питания Legrand KEOR MULTIPLUG 800VA и SP 2000 ВА IEC

Сучасна заміна автоскла — чому важливо звертатися до кваліфікованих спеціалістів

Провідники й ізолятори електроструму: де їх використовують та як?

Юристы объяснили, при каких условиях покупка STALKER 2 может стать основанием для уголовного дела

AMD поможет Raytheon с разработкой многокристальных чипов для военного применения