Зоопарк моделей
На этой странице перечислены пресеты и релизные артефакты, задокументированные для версии 0.1.12.
Детекция
Пресет |
Архитектура |
Параметров |
Поворот |
Артефакты |
Происхождение |
Лицензия |
|---|---|---|---|---|---|---|
|
EAST (ResNet-50) |
53.86M |
Да |
Manuscript |
MIT |
|
|
YOLO26-S OBB |
9.75M |
Да |
Обучено авторами с Ultralytics YOLO |
||
|
YOLO26-X OBB |
57.61M |
Да |
Обучено авторами с Ultralytics YOLO |
Layout-анализ
Пресет |
Архитектура |
Параметров |
Поддерживает |
Артефакты |
Происхождение |
Лицензия |
|---|---|---|---|---|---|---|
|
Алгоритмическая сортировка |
Слева направо, многоколоночно |
Manuscript |
MIT |
Распознавание
Пресет |
Архитектура |
Параметров |
Письмо |
Артефакты |
Происхождение |
Лицензия |
|---|---|---|---|---|---|---|
|
TRBA |
45.10M |
Современный + дореформенный русский |
Manuscript |
MIT |
|
|
TRBA-Lite |
9.46M |
Современный + дореформенный русский |
Manuscript |
MIT |
|
|
TRBA-Lite |
9.46M |
Современный + дореформенный русский |
Manuscript |
MIT |
Посткоррекция
Пресет |
Архитектура |
Параметров |
Орфография |
Артефакты |
Происхождение |
Лицензия |
|---|---|---|---|---|---|---|
|
CharLM |
4.38M |
Современный русский |
Manuscript |
MIT |
|
|
CharLM |
4.39M |
Дореформенный русский |
Manuscript |
MIT |
Источники архитектур
EAST: An Efficient and Accurate Scene Text Detector (Zhou et al., CVPR 2017) — академическая основа для семейства детекторов
EAST. Реализация в manuscript-ocr основана на оригинальной архитектуре, но процедура обучения существенно переработана. Предобученные веса получены авторами проекта.What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis — архитектурная основа для семейства
TRBA(TPS-ResNet-BiLSTM-Attn). Распознаватели в manuscript-ocr адаптированы под задачи проекта.