Как стать автором
Обновить

Мощное мультимодальное семейство больших языковых моделей от Alibaba Group для понимания сложных документов и работы с ними.

mPLUG-DocOwl1.5 - модель для извлечения единой структуры из документов без распознавания текста.

TinyChart - SOTA в различных тестах понимания диаграмм, в том числе Chart-to-Text, Chart-to-Table, OpenCQA, and ChartX. TinyChart превосходит несколько MLLM для понимания диаграмм по параметрам до 13B, таких как ChartLlama и ChartAst (код на подходе). 

mPLUG-PaperOwl -  научный анализ диаграмм, с помощью мультимодальной LLM.

UReader  - разбор документов  с помощью мультимодальной модели большого языка без OCR.

Проект

В своем канале я публикую самые интересные новые модели и разбираю их, welcome.


Теги:
+1
Комментарии0

Публикации

Истории

Работа

Data Scientist
54 вакансии

Ближайшие события

One day offer от ВСК
Дата16 – 17 мая
Время09:00 – 18:00
Место
Онлайн
Конференция «Я.Железо»
Дата18 мая
Время14:00 – 23:59
Место
МоскваОнлайн
Антиконференция X5 Future Night
Дата30 мая
Время11:00 – 23:00
Место
Онлайн
Конференция «IT IS CONF 2024»
Дата20 июня
Время09:00 – 19:00
Место
Екатеринбург
Summer Merge
Дата28 – 30 июня
Время11:00
Место
Ульяновская область