IT обозрение
Четверг, 23 октября, 2025
No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
No Result
View All Result
IT обозрение
No Result
View All Result
Home ИИ

DeepSeek представил технологию сжатия текста для ИИ

21.10.2025
A A
0
Share on FacebookShare on Twitter

deepseek

Китайский ИИ-стартап DeepSeek представил новый мультимодальный ИИ, способный обрабатывать большие и сложные документы с задействованием значительно меньшего количества токенов.

ЭТО ИНТЕРЕСНО

Coinbase открыла ИИ-агентам доступ к криптоплатежам

Coinbase открыла ИИ-агентам доступ к криптоплатежам

23.10.2025
Илон Маск: роботы Optimus станут «невероятными хирургами»

Илон Маск: роботы Optimus станут «невероятными хирургами»

23.10.2025

DeepSeek-OCR применяет визуальное восприятие как средство сжатия информации.

Система стала результатом исследования «роли визуальных энкодеров» для сжатия текста в больших языковых моделях (LLM). Благодаря такому подходу нейросети способны обрабатывать огромные объемы информации без пропорционального роста затрат на вычисления.

«С помощью DeepSeek-OCR мы продемонстрировали, что сжатие текста через визуальные представления позволяет сократить количество токенов в 7–20 раз на разных стадиях контекста. Это открывает перспективное направление для решения проблемы длинной истории в LLM», — заявили в компании.

DeepSeek-OCR состоит из двух основных компонентов:

  • DeepEncoder — кодировщик;
  • DeepSeek3B-MoE-A570M — декодер.

Первый служит основным вычислительным ядром модели. Он сохраняет низкую активность в ходе обработки изображений высокого разрешения, одновременно достигая существенного уровня сжатия. Это позволяет сократить количество токенов.

Декодер — модель Mixture-of-Experts с 570 млн параметров — отвечает за восстановление исходного текста. Архитектура делит нейросеть на несколько независимых подсетей — «экспертов», каждый из которых специализируется на своей части входных данных. Вместе они решают общую задачу.

DeepSeek-OCR способна анализировать сложно структурированный визуальный контент, таблицы, формулы и геометрические схемы. По словам компании, это делает модель особенно полезной для применения в финансовой сфере и научных исследованиях.

Она отметила, что DeepSeek-OCR достигала 97% точности декодирования. При коэффициенте 20х модель сохраняла около 60%. Это подчеркивает ее способность не терять информацию даже при экстремальном уровне сжатия.

На OmniDocBench — эталонном тесте для оценки понимания разнообразных документов — DeepSeek-OCR превзошла ведущие модели оптического распознавания текста вроде GOT-OCR 2.0 и MinerU 2.0. При этом она использовала значительно меньше токенов.

Напомним, в августе стартап обновил свою флагманскую ИИ-модель V3.

Читайте так-же

Coinbase открыла ИИ-агентам доступ к криптоплатежам
ИИ

Coinbase открыла ИИ-агентам доступ к криптоплатежам

23.10.2025
0

Крупнейшая в США криптобиржа Coinbase запускает систему Payments MCP, которая позволит языковым моделям вроде Claude от Anthropic и Gemini от...

Read more
Илон Маск: роботы Optimus станут «невероятными хирургами»

Илон Маск: роботы Optimus станут «невероятными хирургами»

23.10.2025
Исследователи выявили склонность Sora 2 к созданию дипфейков

Исследователи выявили склонность Sora 2 к созданию дипфейков

22.10.2025
Сооснователь Apple и принц Гарри и призвали запретить сверх-ИИ

Сооснователь Apple и принц Гарри и призвали запретить сверх-ИИ

22.10.2025
Исследование выявило признаки деградации искусственного интеллекта из-за соцсетей 

Исследование выявило признаки деградации искусственного интеллекта из-за соцсетей 

22.10.2025

ТОП НОВОСТИ

Сушит быстро и без хлопот. Обзор Dreame Hair Mini

Сушит быстро и без хлопот. Обзор Dreame Hair Mini

23.10.2025
Космический корабль сбежал от игрока No Man’s Sky прямо во время кастомизации

Космический корабль сбежал от игрока No Man’s Sky прямо во время кастомизации

23.10.2025
Coinbase открыла ИИ-агентам доступ к криптоплатежам

Coinbase открыла ИИ-агентам доступ к криптоплатежам

23.10.2025
Какие альткоины поднимутся: ставки на ETH, ADA, HYPER

Какие альткоины поднимутся: ставки на ETH, ADA, HYPER

23.10.2025
Как «Очень странные дела», но с Пеннивайзом: сериал «Добро пожаловать в Дерри» оценили в 79% на Rotten Tomatoes

Как «Очень странные дела», но с Пеннивайзом: сериал «Добро пожаловать в Дерри» оценили в 79% на Rotten Tomatoes

23.10.2025

ПОПУЛЯРНОЕ

  • Таблица сроков программной поддержки всех Android-брендов

    Таблица сроков программной поддержки всех Android-брендов

    0 shares
    Share 0 Tweet 0
  • Нил Ньюбон, сыгравший Астариона в Baldur’s Gate 3, рассказал о том, как работа в видеоигровой индустрии спасла его от долгов в 34 тысячи фунтов

    0 shares
    Share 0 Tweet 0
  • OpenAI и Google выпустили обновления видеомоделей Sora и Veo

    0 shares
    Share 0 Tweet 0
  • Искусственный нейрон ведет себя как настоящий: те же реакции, размер и потребление

    0 shares
    Share 0 Tweet 0
  • Блейд, Мэджик, Тор и Каратель против зомби в трейлере первого PvE-режима Marvel Rivals

    0 shares
    Share 0 Tweet 0
  • Реклама
  • Контакты
  • Политика конфиденциальности
Реклама: digestmediaholding@gmail.com

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

wpDiscuz