Зоопарк моделей

На этой странице перечислены пресеты и релизные артефакты, задокументированные для версии 0.1.12.

Детекция

Пресет

Архитектура

Параметров

Поворот

Артефакты

Происхождение

Лицензия

east_50_g1

EAST (ResNet-50)

53.86M

Да

Manuscript

MIT

yolo26s_obb_text_g1

YOLO26-S OBB

9.75M

Да

Обучено авторами с Ultralytics YOLO

лицензия Ultralytics

yolo26x_obb_text_g1

YOLO26-X OBB

57.61M

Да

Обучено авторами с Ultralytics YOLO

лицензия Ultralytics

Layout-анализ

Пресет

Архитектура

Параметров

Поддерживает

Артефакты

Происхождение

Лицензия

SimpleSorting

Алгоритмическая сортировка

Слева направо, многоколоночно

Manuscript

MIT

Распознавание

Пресет

Архитектура

Параметров

Письмо

Артефакты

Происхождение

Лицензия

trba_base_g1

TRBA

45.10M

Современный + дореформенный русский

Manuscript

MIT

trba_lite_g1

TRBA-Lite

9.46M

Современный + дореформенный русский

Manuscript

MIT

trba_lite_g2

TRBA-Lite

9.46M

Современный + дореформенный русский

Manuscript

MIT

Посткоррекция

Пресет

Архитектура

Параметров

Орфография

Артефакты

Происхождение

Лицензия

modern_charlm_g1

CharLM

4.38M

Современный русский

Manuscript

MIT

prereform_charlm_g1

CharLM

4.39M

Дореформенный русский

Manuscript

MIT

Источники архитектур

  • EAST: An Efficient and Accurate Scene Text Detector (Zhou et al., CVPR 2017) — академическая основа для семейства детекторов EAST. Реализация в manuscript-ocr основана на оригинальной архитектуре, но процедура обучения существенно переработана. Предобученные веса получены авторами проекта.

  • What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis — архитектурная основа для семейства TRBA (TPS-ResNet-BiLSTM-Attn). Распознаватели в manuscript-ocr адаптированы под задачи проекта.