docs
UAEN

Markdown & HTML

Найпопулярніші вихідні формати. Rekognita генерує чистий, структурований Markdown або HTML зі збереженою ієрархією заголовків, таблицями та списками.

Markdown вихід

Markdown — ідеальний формат для:

  • RAG-пайплайнів та LLM-контексту
  • Документації та Knowledge Base
  • Git-репозиторіїв і README

Приклад

# Quarterly Report Q4 2024

## Executive Summary

The company achieved record revenue of **$4.5M** in Q4...

## Financial Results

| Quarter | Revenue | Expenses | Profit |
|---------|---------|----------|--------|
| Q1      | $2.4M   | $1.8M    | $600K  |
| Q2      | $3.1M   | $2.1M    | $1.0M  |
| Q3      | $3.8M   | $2.4M    | $1.4M  |
| Q4      | $4.5M   | $2.7M    | $1.8M  |

## Key Highlights

- Net profit increased by **67%** QoQ
- New product line launched in Q2
- Customer base grew to **12,000+**

> ¹ All figures are audited and in compliance with IFRS.

HTML вихід

HTML зберігає повне форматування і підходить для:

  • Вбудовування в веб-додатки
  • Рендерингу з CSS-стилями
  • Подальшої конвертації в PDF

Приклад

<h1>Quarterly Report Q4 2024</h1>
<h2>Executive Summary</h2>
<p>The company achieved record revenue of <strong>$4.5M</strong>...</p>
<h2>Financial Results</h2>
<table>
  <thead>
    <tr><th>Quarter</th><th>Revenue</th><th>Profit</th></tr>
  </thead>
  <tbody>
    <tr><td>Q1</td><td>$2.4M</td><td>$600K</td></tr>
    <tr><td>Q2</td><td>$3.1M</td><td>$1.0M</td></tr>
  </tbody>
</table>

API запит

POST /v1/documents/convert
Content-Type: multipart/form-data
Authorization: Bearer rk_sk_your_key

file=@document.pdf
output_format=markdown    # або "html"
model=rekognita-balanced

SDK приклад

from rekognita import RekognitaClient

client = RekognitaClient()

# Markdown
md_result = client.documents.convert(
    file="report.pdf",
    output_format="markdown"
)
print(md_result.content)  # Markdown текст

# HTML
html_result = client.documents.convert(
    file="report.pdf",
    output_format="html"
)
print(html_result.content)  # HTML текст

Rekognita vs конкуренти

МожливістьRekognitaКонкуренти
Ієрархія заголовків✅ H1-H6❌ Плоский текст
Таблиці✅ Повні з заголовками❌ Текст без структури
Списки✅ Нумеровані + вкладені⚠️ Простий текст
Зноски✅ Пов'язані з текстом❌ Не підтримується
Зображення✅ Підписи та посилання❌ Ігноруються