Распознавание и индексация

Распознавание и индексация

Для эффективного использования важно не только отсканировать документы, а и иметь возможность производить по ним поиск. Есть несколько вариантов решения этой задачи — распознавание документов или их индексация.

Распознавание документов

Распознавание документов применяется для первоисточников хорошего качества, без наличия «артефактов» (мусора, комментариев, записей на полях и т.д.). Для этого используются различные системы распознавания документов или OCR-системы (Optical Character Recognition). Их задача  заключается в автоматическом вводе всех данных в компьютер. Этот метод используется для документов без «артефактов», например, страниц «свежей» книги, журнала, словаря, опросной анкеты. Распознанный документ пользователь сможет скопировать, работать с отдельными абзацами текста, корректировать их.
Что касается архивных документов — процедура налаживания распознавания документов проходит дольше, а его достоверность составляет небольшой процент. В этом случае используются различные методы полуавтоматического преобразования документов в электронный вид, с помощью ключевых слов (индексация).

Индексация документов

Индексирование документов — это процесс присвоения документам (их электронным копиям или электронным документам) идентификационных признаков, позволяющих быстро находить нужную информацию в базе данных. Такими индексами могут быть тип документа, его номер, дата, автор, пр.

Преимуществом «Цифровой Краины» на этапе распознавания данных / индексации, является работа с самыми сложными данными, в частности:

  • рукописными (полностью рукописные документы или же содержащие информацию, написанную от руки);
  • выполненные на печатной машинке;
  • плохо читаемые (текст выцвел, информация частично утрачена и др.);
  • информация с документов одного типа расположена в разных частях (например, при изменении порядка оформления договоров).

При выполнении полного или частичного распознавания документов, специалисты нашей команды используют многоуровневую проверку качества массива. Избежать возможных ошибок помогает также создание ресурса, где на небольшом объеме тестируется вся технология, согласуются поля, определяются критерии качества.

 

Важно!
Цены на распознавание документов или индексацию определяются индивидуально,
в зависимости от объема, критериев качества и т.д.

 

ЗАКАЗАТЬ УСЛУГУ










[свернуть]

Партнеры