Искусственный интеллект Meta сможет распознавать несколько тысяч языков

Искусственный интеллект Meta сможет распознавать несколько тысяч языков Цей матеріал також доступний українською 23.05.2023, 15:17 Фото: Pixabay

Meta создала языковую модель искусственного интеллекта, не являющуюся клоном ChatGPT. Об этом сообщает Engadget.

ЭТО ИНТЕРЕСНО

Чистая энергия: Нидерланды строят рекордную железо-воздушную батарею мощностью 1 ГВт·ч

25.06.2026

Подорожание iPhone: за последние 10 лет Apple повысила цены на флагманскую модель на 60%

25.06.2026

Проект компании Massively Multilingual Speech (MMS) может распознавать более 4000 разговорных языков и воспроизводить вещание на более чем 1100 языках. Как и большинство других своих публично объявленных проектов в области искусственного интеллекта, сегодня Meta предоставляет открытый доступ к MMS, чтобы помочь сохранить разнообразие языка и поощрить исследователей развивать его на этой основе.

Модели распознавания речи и преобразования текста в речи обычно требуют обучения на тысячах часов аудиозаписей с сопроводительными транскрипционными метками. (Метки имеют решающее значение для машинного обучения, позволяя алгоритмам правильно классифицировать и "понимать" данные.) Но для языков, которые не широко используются в индустриально развитых странах – многие из которых находятся под угрозой исчезновения в ближайшие десятилетия, – "этих данных просто не существует", отмечают в Meta.

Подписывайтесь на LIGA.Tech в Telegram: главные новости мира технологий

Meta применила нетрадиционный подход к сбору аудиоданных: прослушивание аудиозаписей переведенных религиозных текстов. "Хотя содержание аудиозаписей является религиозным, наш анализ показывает, что это не влияет на то, что модель производит больше религиозного языка, – пишет Meta. – Мы считаем, что это потому, что мы используем подход коннекционистской временной классификации (CTC), который является гораздо более ограниченным по сравнению с большими языковыми моделями (LLM) или моделями последовательности для распознавания речи".

После обучения модели выравнивания, чтобы сделать данные более пригодными для использования, Меtа использовала wav2vec 2.0, модель "самоконтролируемого обучения речевого представления", которая может учиться на немаркированных данных. Meta сравнила MMS с Whisper от OpenAI, и результаты превзошли ожидания: "Мы обнаружили, что модели, обученные данным Massively Multilingual Speech, имеют вдвое меньший процент ошибок в словах, но Massively Multilingual Speech охватывает в 11 раз больше языков".

Meta предупреждает, что ее новые модели не идеальны. "Например, существует определенный риск того, что модель превращения языка в текст может неправильно перевести отдельные слова или фразы", – пишет компания.

Читайте также ЕС оштрафовал Meta на $1,3 миллиарда из-за передачи данных Facebook между ЕС и США Ярослав Жахалов Если Вы заметили орфографическую ошибку, выделите её мышью и нажмите Ctrl+Enter. Еще по темеЦукерберг анонсировал искусственный интеллект "для миллиардов людей" 27.04.2023Украинский стартап тренирует нейросеть для распознавания крымскотатарского языка 24.04.2023Главреда немецкого журнала уволили из-за интервью с Шумахером, сгенерированного ИИ 23.04.2023

Искусственный интеллект Meta сможет распознавать несколько тысяч языков

Чистая энергия: Нидерланды строят рекордную железо-воздушную батарею мощностью 1 ГВт·ч

Подорожание iPhone: за последние 10 лет Apple повысила цены на флагманскую модель на 60%

Читайте так-же

Чистая энергия: Нидерланды строят рекордную железо-воздушную батарею мощностью 1 ГВт·ч

Подорожание iPhone: за последние 10 лет Apple повысила цены на флагманскую модель на 60%

В Украине представили дрон-дипстрайк Bravo: он может пролететь 2000 км и оснащен ИИ, который обучается с каждым полётом

Быстрее молнии: Google уже тестирует 5-ю бета-версию Android 17 QPR1 на Pixel

Разработчики Resonance: A Plague Tale Legacy показали 30 минут геймплея: София, древние руины и минойская сфера

ТОП НОВОСТИ

Red Dead Redemption 2 продалась тиражом 85 млн копий: глава Take-Two отверг обвинения в провале онлайна

Nvidia закрыла панель управления GeForce после 20 лет: все настройки теперь в новом приложении

«Письма счастья» от «налоговой»: мошенники массово рассылают фишинговые сообщения

Маск променял солнечную энергетику на ископаемое топливо для ЦОД под Grok, который никому не нужен

«Приключения Паддингтона 4» получил неожиданных сценаристов: задействованы авторы «Гущи событий»

ПОПУЛЯРНОЕ

Electronic Arts привезет на E3 2017 новые Star Wars: Battlefront и Need for Speed

Civilization VII получила локальный мультиплеер и масштабные нововведения в игровом процессе

Никогда не было и вот опять: издание Club386 и ютубер Дэниел Оуэн лишились своих RTX 5090 из-за 16-контактного разъема

Android 17 тихо привнёс в серию Google Pixel ценное улучшение звука

Пресс-снимки Samsung Galaxy Watch Ultra 2 и Watch 9 слиты в Сеть до анонса