IT обозрение
Четверг, 23 октября, 2025
No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
No Result
View All Result
IT обозрение
No Result
View All Result
Home ИИ

DeepSeek представил технологию сжатия текста для ИИ

21.10.2025
A A
0
Share on FacebookShare on Twitter

deepseek

Китайский ИИ-стартап DeepSeek представил новый мультимодальный ИИ, способный обрабатывать большие и сложные документы с задействованием значительно меньшего количества токенов.

ЭТО ИНТЕРЕСНО

Coinbase открыла ИИ-агентам доступ к криптоплатежам

Coinbase открыла ИИ-агентам доступ к криптоплатежам

23.10.2025
Илон Маск: роботы Optimus станут «невероятными хирургами»

Илон Маск: роботы Optimus станут «невероятными хирургами»

23.10.2025

DeepSeek-OCR применяет визуальное восприятие как средство сжатия информации.

Система стала результатом исследования «роли визуальных энкодеров» для сжатия текста в больших языковых моделях (LLM). Благодаря такому подходу нейросети способны обрабатывать огромные объемы информации без пропорционального роста затрат на вычисления.

«С помощью DeepSeek-OCR мы продемонстрировали, что сжатие текста через визуальные представления позволяет сократить количество токенов в 7–20 раз на разных стадиях контекста. Это открывает перспективное направление для решения проблемы длинной истории в LLM», — заявили в компании.

DeepSeek-OCR состоит из двух основных компонентов:

  • DeepEncoder — кодировщик;
  • DeepSeek3B-MoE-A570M — декодер.

Первый служит основным вычислительным ядром модели. Он сохраняет низкую активность в ходе обработки изображений высокого разрешения, одновременно достигая существенного уровня сжатия. Это позволяет сократить количество токенов.

Декодер — модель Mixture-of-Experts с 570 млн параметров — отвечает за восстановление исходного текста. Архитектура делит нейросеть на несколько независимых подсетей — «экспертов», каждый из которых специализируется на своей части входных данных. Вместе они решают общую задачу.

DeepSeek-OCR способна анализировать сложно структурированный визуальный контент, таблицы, формулы и геометрические схемы. По словам компании, это делает модель особенно полезной для применения в финансовой сфере и научных исследованиях.

Она отметила, что DeepSeek-OCR достигала 97% точности декодирования. При коэффициенте 20х модель сохраняла около 60%. Это подчеркивает ее способность не терять информацию даже при экстремальном уровне сжатия.

На OmniDocBench — эталонном тесте для оценки понимания разнообразных документов — DeepSeek-OCR превзошла ведущие модели оптического распознавания текста вроде GOT-OCR 2.0 и MinerU 2.0. При этом она использовала значительно меньше токенов.

Напомним, в августе стартап обновил свою флагманскую ИИ-модель V3.

Читайте так-же

Coinbase открыла ИИ-агентам доступ к криптоплатежам
ИИ

Coinbase открыла ИИ-агентам доступ к криптоплатежам

23.10.2025
0

Крупнейшая в США криптобиржа Coinbase запускает систему Payments MCP, которая позволит языковым моделям вроде Claude от Anthropic и Gemini от...

Read more
Илон Маск: роботы Optimus станут «невероятными хирургами»

Илон Маск: роботы Optimus станут «невероятными хирургами»

23.10.2025
Исследователи выявили склонность Sora 2 к созданию дипфейков

Исследователи выявили склонность Sora 2 к созданию дипфейков

22.10.2025
Сооснователь Apple и принц Гарри и призвали запретить сверх-ИИ

Сооснователь Apple и принц Гарри и призвали запретить сверх-ИИ

22.10.2025
Исследование выявило признаки деградации искусственного интеллекта из-за соцсетей 

Исследование выявило признаки деградации искусственного интеллекта из-за соцсетей 

22.10.2025

ТОП НОВОСТИ

Ультратонкий смартфон с приличной батареей и забавной подсветкой: обзор TECNO SPARK Slim

Ультратонкий смартфон с приличной батареей и забавной подсветкой: обзор TECNO SPARK Slim

23.10.2025
Режиссер третьего сезона «Ванпанчмена» покинул социальные сети из-за травли фанатов

Режиссер третьего сезона «Ванпанчмена» покинул социальные сети из-за травли фанатов

23.10.2025
Какую криптовалюту купить сегодня: обзор XRP и SNORT

Какую криптовалюту купить сегодня: обзор XRP и SNORT

23.10.2025
«Просто возьмите мои деньги»: фанат Fallout создал лучший скин для Pixel Watch 4

«Просто возьмите мои деньги»: фанат Fallout создал лучший скин для Pixel Watch 4

23.10.2025
Стримерша Lululuvely обнаружила вредоносное ПО на компьютере, который ей предоставили на TwitchCon

Стримерша Lululuvely обнаружила вредоносное ПО на компьютере, который ей предоставили на TwitchCon

23.10.2025

ПОПУЛЯРНОЕ

  • Таблица сроков программной поддержки всех Android-брендов

    Таблица сроков программной поддержки всех Android-брендов

    0 shares
    Share 0 Tweet 0
  • Нил Ньюбон, сыгравший Астариона в Baldur’s Gate 3, рассказал о том, как работа в видеоигровой индустрии спасла его от долгов в 34 тысячи фунтов

    0 shares
    Share 0 Tweet 0
  • Переиздание Surviving Mars для ПК и консолей выйдет в ноябре

    0 shares
    Share 0 Tweet 0
  • Искусственный нейрон ведет себя как настоящий: те же реакции, размер и потребление

    0 shares
    Share 0 Tweet 0
  • Блейд, Мэджик, Тор и Каратель против зомби в трейлере первого PvE-режима Marvel Rivals

    0 shares
    Share 0 Tweet 0
  • Реклама
  • Контакты
  • Политика конфиденциальности
Реклама: digestmediaholding@gmail.com

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

wpDiscuz