Стремительно завоевавший популярность китайский ИИ-стартап DeepSeek представил набор новых мультимодальных ИИ-моделей, которые, по утверждению компании, превосходят DALL-E 3 от OpenAI.
Нейросети являются частью нового семейства Janus-Pro. Их размер варьируется от 1 млрд до 7 млрд параметров.
Janus-Pro способна анализировать и создавать новые изображения. В двух бенчмарках GenEval и DPG-Bench она обошла DALL-E 3, PixArt-alpha, Emu3-Gen и другие аналоги.
Модели демонстрируют высокую производительность, несмотря на их относительно небольшой размер.
«Janus-Pro превосходит предыдущие унифицированные модели и сопоставима или превосходит нейросети, специализирующиеся на отдельных задачах. Простота, высокая гибкость и эффективность Janus-Pro делают ее сильным кандидатом на создание унифицированных мультимодальных нейросетей следующего поколения», — заявили в DeepSeek.
Стартап ранее стал сенсацией после выпуска модели R1, что привело к снижению акций Nvidia, ряда других технологических компаний и криптовалют.
Напомним, эксперты призвали не спешить с выводами о реальных возможностях нейросети.