All articles
ProductFebruary 4, 20266 min

From Unstructured Scan to Structured JSON in One API Call

Розпізнати текст з документа — це тільки половина справи. Справжня цінність з'являється, коли ви можете автоматично витягнути конкретні поля та отримати структурований JSON.

Проблема: Різні документи — різна структура

Кожен постачальник має свій формат рахунку-фактури. Кожна лікарня — свій формат медичної довідки. Традиційний підхід вимагає створення окремих шаблонів для кожного формату, що не масштабується.

Наше рішення: Schema-Driven Extraction

Ви описуєте, які поля вам потрібні, у вигляді JSON schema. Наприклад: назва компанії, ІПН, дата, сума, перелік товарів. Rekognita автоматично знаходить ці поля на документі будь-якого формату.

Під капотом ми використовуємо Large Language Model, спеціально навчену на українських бізнес-документах. Модель розуміє контекст і може знайти "суму до оплати" навіть якщо вона підписана як "Разом з ПДВ", "Всього" або "До сплати".

Один API виклик

Весь процес — від завантаження скану до отримання JSON — відбувається в одному API виклику. Ви відправляєте зображення та schema, отримуєте структурований результат з confidence scores для кожного поля.

{
  "company": "ТОВ Промтех",
  "tax_id": "12345678",
  "date": "2026-01-15",
  "total": 15750.00,
  "items": [...]
}

Середній час обробки одного документа — менше 2 секунд. Для пакетної обробки ми підтримуємо до 100 документів в одному запиті з паралельною обробкою.

From Unstructured Scan to Structured JSON in One API Call — Rekognita Blog