Підтримувані типи файлів
Rekognita підтримує широкий спектр форматів документів. Кожен формат обробляється відповідним парсером для максимальної точності.
Документи
| Формат | Розширення | Примітки |
|---|---|---|
.pdf | Цифрові та скановані (OCR). Підтримка захищених PDF | |
| Microsoft Word | .docx, .doc | Повна підтримка таблиць, зображень, стилів |
| Microsoft Excel | .xlsx, .xls | Конвертація таблиць зі збереженням структури |
| Microsoft PowerPoint | .pptx, .ppt | Витягування тексту та зображень зі слайдів |
| OpenDocument | .odt, .ods | LibreOffice / OpenOffice документи |
| Rich Text | .rtf | Базова підтримка форматування |
| Plain Text | .txt | UTF-8, різні кодування |
Зображення
| Формат | Розширення | Макс. розмір |
|---|---|---|
| JPEG | .jpg, .jpeg | 50 MB |
| PNG | .png | 50 MB |
| TIFF | .tiff, .tif | 100 MB (мульти-сторінковий) |
| WebP | .webp | 50 MB |
| BMP | .bmp | 50 MB |
| HEIC | .heic | 50 MB |
Підтримувані мови OCR
Rekognita підтримує OCR для 25+ мов, включаючи:
- Латиниця: English, Deutsch, Français, Español, Italiano, Português, Nederlands, Polski
- Кирилиця: Українська, Русский, Беларуская, Български, Српски
- CJK: 中文 (Chinese), 日本語 (Japanese), 한국어 (Korean)
- Арабська: العربية (Arabic), فارسی (Persian)
- Інші: हिन्दी (Hindi), ภาษาไทย (Thai), Tiếng Việt (Vietnamese)
Рекомендації
- Для скановних документів рекомендується роздільна здатність ≥ 300 DPI
- PDF з вбудованим текстом обробляються швидше, ніж скановані
- Для Excel/PowerPoint рекомендуємо конвертувати в PDF перед завантаженням для найкращого результату