Конвейер

Основной высокоуровневый интерфейс для OCR-обработки.

class manuscript._pipeline.Pipeline(detector=<object object>, layout=<object object>, recognizer=<object object>, corrector=None, layout_after='detector')[исходный код]

Базовые классы: object

Высокоуровневый OCR-конвейер с настраиваемым порядком этапов.

Конвейер по умолчанию: detector -> layout -> recognizer. corrector необязателен и по умолчанию отключён.

Атрибуты:
last_correction_page
last_detection_page
last_layout_page
last_recognition_page
Параметры:
  • detector (DetectorProtocol)

  • layout (LayoutProtocol | None)

  • recognizer (RecognizerProtocol | None)

  • corrector (CorrectorProtocol | None)

  • layout_after (str)

Методы

get_text(page)

Извлечь обычный текст из объекта Page.

predict(image[, vis, profile])

Запустить конвейер на одном изображении.

__init__(detector=<object object>, layout=<object object>, recognizer=<object object>, corrector=None, layout_after='detector')[исходный код]

Инициализация OCR-конвейера.

Параметры:
  • detector (object, optional) – Экземпляр детектора с интерфейсом predict(image) -> Page. Если не указан, используется YOLO(weights="yolo26x_obb_text_g1") по умолчанию. Детектор отключить нельзя.

  • layout (object or None, optional) – Экземпляр layout-модели с интерфейсом predict(page, image=None) -> Page. Если не указан, используется SimpleSorting() по умолчанию. Передайте None, чтобы отключить этап layout.

  • recognizer (object or None, optional) – Экземпляр распознавателя с интерфейсом predict(page, image=None, ...) -> Page. Если не указан, используется TRBA(weights="trba_lite_g2") по умолчанию. Передайте None, чтобы отключить этап распознавания.

  • corrector (object or None, optional) – Экземпляр корректора с интерфейсом predict(page, image=None) -> Page. По умолчанию None (отключён).

  • layout_after ({"detector", "recognizer", "corrector"}, optional) – Слот, в котором выполняется этап layout. По умолчанию "detector".

predict(image, vis=False, profile=False)[исходный код]

Запустить конвейер на одном изображении.

Параметры:
  • image (str, Path, numpy.ndarray, or PIL.Image) – Входное изображение.

  • vis (bool, optional) – Если True, возвращает изображение визуализации вместе с результатом.

  • profile (bool, optional) – Если True, выводит время выполнения каждого этапа.

Тип результата:

Union[Dict[str, Page], tuple]

get_text(page)[исходный код]

Извлечь обычный текст из объекта Page.

Тип результата:

str

Параметры:

page (Page)

property last_detection_page: Page | None
property last_layout_page: Page | None
property last_recognition_page: Page | None
property last_correction_page: Page | None