ИИ от Microsoft нарисовал птицу по текстовому описанию

ИИ-алгоритм от Microsoft смог нарисовать птицу, основываясь исключительно на текстовом описании. Причем, компьютер создал изображение с нуля, не выбирая подходящее из базы данных, пишет Engadget.
Появились ИИ-алгоритмы, которые могут определить, что изображено на фотографии с точностью 80%. Но что если попробовать поставить ему обратную задачу — нарисовать картину, исходя из текстовых описаний? В Microsoft, кажется, смогли взять эту планку. Исследователи компании «попросили» компьютер нарисовать «желтую птицу с черными крыльями и коротким клювом», и он нарисовал.

ЭТО ИНТЕРЕСНО

В приложении «Дія» появится мультишеринг документов

16.04.2024

Бункер Сидоровича из S.T.A.L.K.E.R.: Shadow of Chernobyl воссоздали в Unreal Engine 5

16.04.2024

Рисунок выглядит на удивление точным и похож на фотографию, учитывая, что алгоритм не искал уже существующее изображение в базе данных, а создал его самостоятельно.
«Если вы отправитесь на Bing, и поищете птицу, то получите множество похожих картинок с птицей, но здесь фотографии создаются с помощью компьютера с нуля, пиксель за пикселем, — говорит глава исследовательской группы Сяодун Хэ. — Эти птицы могут не существовать в реальном мире — они всего лишь аспект воображения нашего компьютера».
Хотя нынешняя форма этой технологии рисования не идеальна, нетрудно представить себе будущее, где она может функционировать как помощник художников и дизайнеров интерьера или инструмент для улучшения фотографий на основе голосового ввода. В Microsoft идут дальше и видят применение своего алгоритма в анимационных фильмах, созданных компьютером исключительно по сценарию.
Команда начала исследования в области компьютерного зрения и обработки естественного языка с помощью CaptionBot, ИИ-системы, которая автоматически создает подписи к фотографиям. Затем исследователи создали систему, отвечающую на вопросы, связанные с изображениями под названием SeeingAI, которая может быть полезной для слепых.
Текущая технология состоит из двух частей: одна, Generative Adversarial Network (GAN), генерирует изображения, а другая, дискриминатор, оценивает их качество. CaptionBot обучался на парах изображений и подписей, которые подсказывают, как слова соотносятся с какими фотографиями.
Команда также создала математическое представление человеческого внимания, которое мы используем, когда рисуем картины, основываясь на сложных описаниях. «Внимание — это человеческое качество, мы же используем математику, чтобы сделать внимание вычисляемым», — говорит Хэ.

Источник: hightech.fm

ИИ от Microsoft нарисовал птицу по текстовому описанию

В приложении «Дія» появится мультишеринг документов

Бункер Сидоровича из S.T.A.L.K.E.R.: Shadow of Chernobyl воссоздали в Unreal Engine 5

Читайте так-же

В приложении «Дія» появится мультишеринг документов

Бункер Сидоровича из S.T.A.L.K.E.R.: Shadow of Chernobyl воссоздали в Unreal Engine 5

После Путина Такер Карлсон смог разговорить Дурова. Выступление главы Telegram в Дубае отложили из-за потопа

Scrum, «Дедлайн» и Kaizen Hub. Какие лучшие книги, подкасты и YouTube-каналы о менеджменте

Представлен Nissan Paladin 2024 — с усиленными амортизаторами, внедорожной резиной и шноркелем

Экспертам удалось заработать больше $100 тыс. за взлом Google Pixel

ТОП НОВОСТИ

В приложении «Дія» появится мультишеринг документов

Анонс Motorola Edge 50 Ultra — деревянный стиляга с крутой камерой

Nintendo пропустит выставку gamescom 2024

ПОПУЛЯРНОЕ

Google и Bayer анонсировали ИИ-платформу для рентгенологов

Космические силы США проведут демонстрационную миссию на орбите Земли

Является ли iPhone 14 водонепроницаемым? Краткий обзор новых мобильных телефонов Apple

Мало кто знает об этом суперкаре. Редчайший Vector М12 с мотором Lamborghini V12, которым управлял Джереми Кларксон, выставлен на продажу

JPMorgan: Биткойн может продолжить падение