Структура библиотеки
graph LR
manuscript[manuscript]
manuscript --> Pipeline[Pipeline]
manuscript --> data[data]
manuscript --> detectors[detectors]
manuscript --> layouts[layouts]
manuscript --> recognizers[recognizers]
manuscript --> correctors[correctors]
manuscript --> utils[utils]
manuscript --> api[api]
Pipeline --> p1[predict]
Pipeline --> p2[get_text]
Pipeline --> p3[last_detection_page]
Pipeline --> p4[last_layout_page]
Pipeline --> p5[last_recognition_page]
Pipeline --> p6[last_correction_page]
detectors --> EAST[EAST]
detectors --> YOLO[YOLO]
layouts --> SimpleSorting[SimpleSorting]
recognizers --> TRBA[TRBA]
correctors --> CharLM[CharLM]
utils --> organize_page[organize_page wrapper]
Обзор
Pipelineкоординирует этапы OCR.detectorsпредоставляют модели детекции, такие какYOLOиEAST.layoutsпредоставляют модели упорядочивания и группировки, напримерSimpleSorting.recognizersпредоставляют модели распознавания текста.correctorsпредоставляют модели постобработки текста.utils.organize_pageостаётся совместимым обёрточным вызовом над layout-логикой.