ABBYY FormReader

ABBYY FormReaderABBYY FormReader - система ввода форм, заполненных от руки или на принтере, с применением технологии ICR (Intelligent Character Recognition).

Знаете ли вы, что по мировой статистике 80% всех документов, использующихся в бизнесе, - это формы? Это значит, что автоматизировав ввод форм, вы в 5 раз сократите объём ручного ввода, избавив себя и свой бизнес от всех связанных с этим проблем!

А вот еще пять причин автоматизировать процесс ввода форм с помощью программного продукта ABBYY FormReader:

  • 90% проектов по автоматизации ввода форм с использованием системы ABBYY FormReader успешны благодаря тому, что сначала реализуется пилотный проект и только по его результатам принимается решение о внедрении FormReader.
  • ABBYY FormReader легко настраивается на любые виды форм - как структурированные, так и гибкие.
  • С внедрением системы ABBYY FormReader время на ввод данных с бумажных форм уменьшается в 10 раз.
  • Точность итоговых данных повышается в 20 раз благодаря технологиям распознавания ABBYY (OCR, ICR and OMR/Barcode), заслужившим признание во всём мире.
  • Практика показывает, что система окупает себя в среднем в течение 3 месяцев благодаря разумной стоимости, низким затратам на внедрение и сопровождение.

Семейство ABBYY FormReader 6.5 включает в себя:

  • простую во внедрении и изучении систему ABBYY FormReader 6.5 Desktop Edition для использования на локальной рабочей станции

FormReader 6.5 Desktop Edition предназначен для использования одним оператором. Программа не требует специальных знаний для инсталляции и имеет интуитивно понятный интерфейс. Использование Desktop Edition позволит вводить сотни и даже тысячи страниц форм с вовлечением всего одного сотрудника, рабочее место которого оборудовано сканером. Невысокая стоимость владения продуктом наряду с отличной производительностью обеспечивает высочайшую окупаемость решения по автоматизированному вводу форм.

Версия ABBYY FormReader 6.5 Desktop Edition предназначена для использования на локальной рабочей станции и позволяет обрабатывать до 3000 форм в день силами одного оператора. Система позволяет автоматизировать весь процесс ввода, обработки и сохранения результатов распознавания печатных форм в файл или базу данных. При этом продукт не требует специальных знаний для инсталляции и имеет понятный интерфейс, что обеспечивает простоту и удобство работы с ним.

Весь процесс обработки формы с помощью ABBYY FormReader Desktop Edition требует минимального вмешательства операциониста. Оператор вставляет пачку форм в сканер, запускает ABBYY FormReader, а затем проверяет результаты распознавания форм и сохраняет распознанную информацию в файл или базу данных.

Особенности обработки печатных форм с помощью системы ABBYY FormReader 6.5 Desktop Edition:

  • Формы сканируются при помощи скоростного сканера (обычно с производительностью не менее 10 страниц в минуту). В процессе сканирования FormReader применяет развитые алгоритмы адаптивного подбора яркости, поворота изображений, определения ориентации страницы, компенсации искажений и очистки.
  • Продукт позволяет обрабатывает различные типы форм. Помимо традиционных цветных и растровых форм продукт может распознавать информацию и с чёрно-белых форм, с различными типами разметки полей (рамочки, гребёнки и прочие элементы).
  • При распознавании продукт проверяет информацию с помощью правил автоматического контроля, а также применяет сравнение данных со словарями, базами данных.
  • Символы, относительно которых у системы распознавания сложилось несколько гипотез, подаются на проверку оператору.

Используя ABBYY FormReader 6.5 Desktop Edition с технологией ABBYY FlexiCapture, можно вводить данные даже из форм, которые не отвечают общим требованиям машиночитаемости. Эти формы, как правило, поступают в компанию из разных источников и при одинаковом смысловом содержании могут кардинально отличаться по структуре и расположению полей. Такие формы, называют "гибкими" или не структурированными.

  • распределённое и легко масштабируемое решение ABBYY FormReader 6.5 Enterprise Edition для потокового ввода больших объёмов данных

FormReader 6.5 Enterprise Edition предназначен для обработки больших объёмов бумажных форм - от 200 000 до 1 000 000 в месяц. Документы проходят несколько этапов обработки - сканирование, распознавание, верификация, корректировка и экспорт - на специализированных станциях. Enterprise Edition позволяет обрабатывать многостраничные документы, формы со сложной структурой, а также документы различных типов в одном потоке.

Как работает ABBYY FormReader Enterprise Edition

Программа FormReader Enterprise Edition обеспечивает потоковый ввод документов и незаменима в крупных проектах. Если средний ежедневный объём обрабатываемых бумажных документов составляет 2-3 тыс. или пиковые нагрузки превышают 10000 документов в день, если в процесс обработки вовлечены более трёх сотрудников, то, возможно, программа FormReader Enterprise Edition - тот инструмент, который позволит сделать задачу ввода данных с бумажных документов простой и легко выполнимой.

Формы формируются в виде пакетов и проходят все стадии процесса обработки. Маршрут пакетов показан на схеме. Сначала происходит сканирование, затем распознавание. Извлеченные данные сравниваются с оригинальным изображением и при необходимости исправляются. Отдельные страницы собираются в документ. Затем итоговые данные экспортируют в базу данных или файл. За каждую операцию процесса обработки отвечает специализированная станция комплекса.

Структура вводимых документов может быть любой сложности. Формы могут быть многостраничными, содержать приложения, формы нескольких типов могут обрабатываться в едином потоке без предварительной сортировки. Обрабатывая пакет форм, ABBYY FormReader Enterprise Edition отслеживает маршрут и состояние каждой страницы, собирает их в документы в соответствии с заданной структурой, отслеживает правильность сборки и предупреждает пользователя об ошибках.

Бесперебойность и эффективность работы комплекса на базе Enterprise Edition достигаются за счет чёткого определения параметров работы комплекса, гибкого распределения задач между станциями в процессе, концентрации операторов на своих задачах. Этому также способствуют мониторинг и контроль хода обработки пакетов, возможности дублировать выполнения операций и при необходимости расширить комплекс, подключив дополнительные станции.

Для создания комплекса потребуется несколько - по числу операторов - компьютеров, объединённых в сеть, сервер, один или несколько сканеров (их количество зависит от объёма документов и технических характеристик самих сканеров). В комплекс FormReader Enterprise Edition входят сервер данных, станции настройки, сканирования, распознавания, верификации, корректировки, а также станция экспорта и мониторинга. Некоторые станции участвуют в процессе ввода и обработки данных, другие отвечают за работу самого комплекса.

Сервер данных и лицензий

С помощью сервера данных, входящего в состав комплекса, происходит обмен данными между станциями. На сервере к тому же устанавливается единый для всего комплекса ключ защиты.

Станция настройки

Станция настройки предназначена для подготовки комплекса к работе (непосредственно к процессу ввода форм). Оператор станции настройки планирует процесс обработки форм в целом и настраивает работу на каждой станции в отдельности: включает в проект и настраивает необходимые типы пакетов, назначает папки для хранения исходных и итоговых данных, распределяет обязанности между операторами, дает им необходимые права. Оператор станции настройки может просмотреть параметры лицензии комплекса, просмотреть список компьютеров сети, на которые установлены станции комплекса и которые в данный момент работают в комплексе.

После того как настройка комплекса закончена, можно приступать к процессу обработки форм.

Станция сканирования

Станция сканирования является первой станцией, на которую поступают формы в процессе ввода и обработки. На станцию сканирования поступает пачка бумажных форм или файлы изображений заранее отсканированной пачки. Оператор станции сканирования создаёт новый пакет для хранения и последующей обработки изображений пачки форм, регистрирует этот пакет, сканирует бумажные формы и/или добавляет готовые файлы изображений в созданный пакет и отправляет его для последующей обработки на станцию распознавания.

При необходимости обработку любого пакета можно отложить. Отложенный пакет не поступает на дальнейшую обработку; оператор станции сканирования может открыть и продолжить его обработку позже.

Станция распознавания

На станции распознавания производится распознавание пакетов в автоматическом режиме. Оператору станции необходимо лишь запустить процесс распознавания. После этого каждый пакет, готовый к распознаванию, распознаётся автоматически. После завершения процесса распознавания пакеты автоматически отправляются на станцию верификации или на станцию корректировки, если станция верификации отсутствует.

Станция верификации (опциональная)

На станции верификации производится редактирование результатов распознавания и, опционально, выполнения одностраничных правил. Оператор станции верификации последовательно выполняет верификацию неуверенно распознанных символов и проверку данных с помощью одностраничных правил, руководствуясь подсказками программы. По окончании работы пакет отправляется для последующей обработки на станцию корректировки. В случае возникновения проблем при обработке пакета оператор станции верификации может отправить пакет на станцию корректировки как проблемный, снабдив его комментариями. Станция верификации является опциональной.

В случае отсутствия станции верификации в комплексе, верификация данных и проверка данных с помощью одностраничных правил осуществляются на станции корректировки.

Станция корректировки

На станции корректировки производится сборка документов пакета (сборка пакета) и редактирование результатов выполнения многостраничных правил. Оператор станции корректировки последовательно выполняет сборку пакета и проверку данных с помощью многостраничных правил, руководствуясь подсказками программы. По окончании обработки пакет отправляется для последующей обработки на станцию экспорта и мониторинга.
В случае необходимости оператор станции корректировки может отсканировать или распознать страницы пакета заново, изменив при этом, например, настройки сканирования или распознавания, а также провести повторную верификацию страниц пакета, корректировку результатов проверки одностраничных правил.

В случае возникновения проблем при обработке пакета, оператор станции корректировки может отправить пакет на станцию экспорта и мониторинга как проблемный, снабдив его комментарием. В случае отсутствия опциональной станции верификации на станции корректировки производится верификация данных и проверка данных с помощью одностраничных правил.

Станция экспорта и мониторинга

На станции экспорта и мониторинга производится экспорт пакетов, общий мониторинг работы комплекса и работа с проблемными пакетами.

Экспорт данных может происходить в двух режимах - автоматическом или ручном. В первом случае после запуска экспорта автоматически экспортируются все пакеты, поступающие в очередь на экспорт. Во втором случае оператор сначала должен выбрать пакеты для экспорта, выделив их в списке пакетов в очереди на экспорт, а затем запустить процесс экспорта выделенных пакетов.

В процессе мониторинга комплекса оператор может просмотреть статистику обработки пакетов и сеансов работы станций, проверить журнал событий.

Если в процессе обработки возникли проблемы, этот пакет отправляется оператору станции экспорта и мониторинга, который может приписать пакет для обработки какому-либо оператору, удалить пакет из базы данных, остановить работу какой-либо станции комплекса, заблокировать обработку пакета.

  • средство разработки ABBYY FormReader 6.5 Developer Edition для интеграции функций FormReader во внешние приложения

FormReader 6.5 Developer Edition - средство разработки, дающее возможность интегрировать функции FormReader Desktop Edition во внешние информационные системы. Доступный программный интерфейс (API) позволяет вызывать все базовые функции FormReader, используя язык программирования, поддерживающий OLE Automation (C/C++, Visual Basic, Delphi, Java).

Если вам необходимо

  • интегрировать функции ABBYY FormReader в систему документооборота, бухгалтерскую систему или корпоративную информационную систему,
  • быстро вызывать функции распознавания форм нажатием одной кнопки из любого приложения Windows,
  • задать уникальные условия экспорта распознанных данных из системы FormReader,

вы можете решить эти задачи при помощи средства для разработки ABBYY FormReader Developer Edition, которое обеспечивает доступ к внутренним настройкам (API) программного обеспечения ABBYY FormReader.

Интеграторы, VAR 'ы и разработчики, написав нескольких строк программного кода на одном из языков программирования, поддерживающих OLE Automation, имеют возможность настроить пользовательский интерфейс, механизмы запуска операции обработки пакета, процедуры импорта и экспорта данных по желанию компании-пользователя.

Возможности настройки ABBYY FormReader 6.5 Developer Edition

В программе ABBYY FormReader 6.5 Developer Edition с помощью компоненты API можно управлять следующими операциями:

  • запуск системы распознавания и выход из неё,
  • изменение параметров окон пользовательского интерфейса,
  • добавление изображений для обработки,
  • наложение шаблонов, распознавание, экспорт полученных данных в файл или базу данных,
  • управление сообщениями программной оболочки,
  • обработка событий на всех стадиях ввода данных.

В качестве средства разработки могут быть использованы:

  • Microsoft Visual Basic 5.0 или более поздняя версия,
  • Microsoft Visual С++ 4.x или более поздняя версия,
  • другое средство, поддерживающее OLE-Automation (C/C++, Visual Basic, Delphi, Java, etc.).

Тиражирование приложений, разработанных с помощью ABBYY FormReader 6.5 Developer Edition

Вместе с программным продуктом ABBYY FormReader Developer Edition в комплект входит описание использования ABBYY FormReader API, несколько примеров и ключ защиты, позволяющий использовать пакет локально. После того, как приложение с помощью FormReader Developer Edition создано, разработчик может заняться его распространением. Чтобы созданное приложение могло использоваться у третьих лиц, им необходимо получить пользовательскую лицензию ABBYY FormReader Developer Edition.

  • инструментарий ABBYY FlexiCapture Studio 1.5 для создания на базе ABBYY FormReader с технологией ABBYY FlexyCapture решений для обработки гибких форм и документов.

ABBYY FlexiCapture Studio - это новый продукт компании ABBYY, основанный на технологии FlexiCapture, для разработчиков, интеграторов и VAR 'ов. Используя ABBYY FlexiCapture Studio совместно с системой ввода форм ABBYY FormReader 6.5 или инструментарием разработчика ABBYY FineReader Engine 7.1, вы сможете создать для ваших клиентов решение для ввода гибких форм, например, накладных, счетов, шапок входящих документов и т.д.

Технология ABBYY FlexyCapture построена на принципах IPA (Integrity, Purposefulness, Adaptability, то есть целостность, целенаправленность и адаптивность), на основе которых действуют живые "распознаватели". Чтобы "научить" программу FormReader или SDK FineReader Engine находить и идентифицировать поля на гибкой форме, создаётся "инструкция" - описание, как искать поля на форме, опираясь на названия полей или другие признаки (тип единиц, пояснительная надпись). Это описание гибкой формы называется FlexiLayout.

ABBYY FlexiCapture Studio - гибкий инструмент, который позволяет разрабатывать FlexiLayout на двух уровнях: через диалоги программы и с использованием мета-языка FlexiCapture. Поэтому разработать шаблон сможет даже не имеющий навыков программирования специалист.

Flexi Layout состоит из блоков и элементов. Блоки - это описания полей, из которых будет вводится информация в FormReader, а элементы - объекты на форме, на которые опирается программа при поиске полей.

Расположение каждого блока задается через окружающие его элементы: текст, рисунки, разделители, свободные участки. На поле ищут все похожие объекты, для каждого варианта оценивается степень соответствия описанию и выбирается наилучший.

Уникальный алгоритм поиска по совокупности элементов (вместо перебора каждого элемента в отдельности, как это происходит в других программных продуктах данного класса) позволяет FlexiCapture Studio резко ограничить время обработки документов и снизить вероятность ошибки при выборе элементов.

Протестированное описание гибкой формы FlexiLayout переносится в программу FormReader. ABBYY FormReader со встроенной технологией FlexiCapture Studio справится с вводом любой гибкой формы, в том числе с формой сложной структуры, с большим количеством полей.

ABBYY FlexiCapture Studio сделал доступной мощную технологию ABBYY для описания структуры гибких форм, которая ранее использовалась только экспертами ABBYY в заказных проектах. В короткие сроки VAR'ы и интеграторы смогут с его помощью создать адаптированное под задачи и типы документов решение "на заказ" или разработать тиражируемое решение для ввода гибких форм, например, страховых, платёжных, складских или медицинских документов.

Залогом надежности и высочайшего качества технологии FlexiCapture служат системы ввода данных, созданные на её основе и успешно работающие в крупных компаниях и органах государственного управления, а также программный продукт для ввода платёжных документов FineReader Bank, который используют более 500 российских банков.

ABBYY FlexiCapture - мощная технология для ввода гибких форм

От бумажного хаоса к порядку

Задумывались ли вы, сколько человеко-часов теряет ваша компания ежедневно, чтобы привести в порядок входящий поток бумажных документов? Ввод вручную данных со счетов и чеков, обработка квитанций и заказов, сортировка писем и договоров, разбор бухгалтерских и финансовых документов - вот куда тратятся драгоценные ресурсы компании.

Эти схожие по содержанию документы приходят в компанию из разнообразных источников, и поэтому бывают по-разному структурированы и оформлены, одни и те же поля (дата, название компании, сумма, адрес и т.д.) расположены на них не одинаково. Специалисты называют такие документы неструктурированными, или гибкими формами.

Tехнология ABBYY FlexiCapture, основанная на многолетних исследованиях компании ABBYY и опыте реализации крупных проектов, позволяет вводить данные с гибких форм автоматически. Чтобы организовать обработку гибких форм в своей компании, вам понадобится сканер и программа ввода форм ABBYY FormReader с технологией FlexiCapture.

Почти как человек: ввод гибких форм с помощью технологии ABBYY FlexiCapture

Как действует человек, когда вводит информацию с гибких форм? Он просматривает документ и по названию поля или другим признакам (тип единиц, пояснительная надпись) находит нужные данные и переносит их в базу данных или файл. Так же работает и программа FormReader с технологией FlexiCapture.

Технология ABBYY FlexiCapture использует принципы IPA (Integrity, Purposefulness, Adaptability, то есть целостность, целенаправленность и адаптивность), на основе которых действуют живые "распознаватели". Чтобы "научить" программу FormReader находить и идентифицировать поля на гибкой форме, создаётся "инструкция" - описание, как искать поля на форме, опираясь на названия полей или другие признаки (тип единиц, пояснительная надпись). Это описание гибкой формы называется FlexiLayout. Для разработки FlexiLayout предназначено приложение ABBYY FlexiCapture, входящее в состав FormReader.

ABBYY FlexiCapture Studio - гибкий инструмент, который позволяет разрабатывать FlexiLayout на двух уровнях: через диалоги программы и с использованием мета-языка FlexiCapture. Поэтому разработать шаблон сможет даже не имеющий навыков программирования специалист.

Flexi Layout состоит из блоков и элементов. Блоки - это описания полей, из которых будет вводится информация в FormReader, а элементы - объекты на форме, на которые опирается программа при поиске полей.

Расположение каждого блока задается через окружающие его элементы - текст, рисунки, разделители, свободные участки. На поле ищут все похожие объекты, для каждого варианта оценивается степень соответствия описанию и выбирается наилучший.

Уникальный алгоритм поиска по совокупности элементов (вместо перебора каждого элемента в отдельности, как это происходит в других программных продуктах данного класса) позволяет FlexiCapture Studio резко ограничить время обработки документов и снизить вероятность ошибки при выборе элементов.

Протестированное описание гибкой формы FlexiLayout переносится в программу FormReader. ABBYY FormReader со встроенной технологией FlexiCapture Studio справится с вводом

ABBYY FormReader успешно используют банки, страховые компании, маркетинговые агентства и производственные компании, государственные учреждения и учебные заведения, торговые компании и медицинские организации. Всего в 30 странах мира работает 3500 копий продукта!

Возможности ABBYY FormReader

Удобство работы

  • ABBYY FormReader способен обрабатывать любые типы форм, соответствующие простым требованиям машиночитаемости.
  • Распознаёт текст, напечатанный на машинке или принтере, для 172 языков и написанный печатными буквами от руки для 90 языков, а также метки (пункты) и штрих-коды.
  • Автоматически сортирует бланки, проверяет комплектацию многостраничных форм.
  • Не требует вмешательства оператора на этапах сканирования и распознавания.
  • Предлагает трехступенчатую технологию верификации, позволяющую подобрать оптимальный вариант проверки для каждого типа данных.
  • Позволяет экспортировать результаты ввода данных в файлы форматов TXT, DBF, Microsoft Excel, CSV или базы данных, сохранять изображения в виде pdf-файлов.

Лёгкость освоения

  • ABBYY FormReader имеет понятную структуру и удобный интерфейс.
  • Программа снабжена подробным электронным справочником и руководством пользователя.
  • Для создания нового пакета и нового шаблона формы используются редакторы, шаг за шагом подсказывающие пользователю верную последовательность действий.
  • Изучение программы занимает от нескольких часов до нескольких дней и не требует специальных знаний и навыков.

Качественный результат

  • Уровень корректного распознавания рукописных символов достигает 98%.
  • Качество данных при автоматизированном вводе форм оказывается на несколько порядков выше, чем при ручном вводе.
  • Сводится к нулю влияние человеческого фактора, абсолютно исключаются "позиционные" ошибки, когда при ручном вводе оператор заносит, например, имя в поле "отчество".
  • Проводится автоматический контроль результатов распознавания с помощью перекрёстных проверок, правил контроля сумм, сверок по словарям и базам данных.
  • Существует возможность создать собственные правила проверки, в том числе с подключением списков и словарей, и использовать их для контроля качества вводимых данных.

Высокая производительность

  • Использование локальной версии ABBYY FormReader позволяет силами одного сотрудника вводить ежедневно от 500 до 1000 страниц в зависимости от сложности формы и аппаратной конфигурации.
  • Применение ABBYY FormReader 6.5 Enterprise Edition обеспечивает практически неограниченные объёмы обработки форм.
  • При использовании ABBYY FormReader 6.5 Enterprise Edition скорость выполнения операций в процессе ввода форм увеличивается в несколько раз за счет разделения между сотрудниками решаемых задач.

Возможность масштабировать систему

  • Пользователь изначально имеет возможность подобрать наиболее подходящую для своих задач конфигурацию ABBYY FormReader 6.5 - Desktop, Enterprise или Developer, а также определить ограничение на максимальное количество страниц для ввода в течение месяца или года, исходя из планируемых потребностей.
  • Если объём работ по вводу данных увеличится, пользователь в течение дня сможет модифицировать существующий комплекс, перейдя на версию с большей производительностью.
  • Чтобы увеличить скорость обработки форм на 1000 страниц в день, достаточно установить ABBYY FormReader на еще одно рабочее место.

Быстрая окупаемость

  • Использование программы ABBYY FormReader экономически более выгодно, чем организация ручного ввода, так как подразумевает, что переменные издержки - на зарплату операторов, аренду офисных помещений, расходы на электроэнергию - будут гораздо ниже.
  • Затраты на приобретение программы, компьютеров и сканеров носят разовый характер, при этом бесперебойная работа с высокой производительностью и отличным качеством обработки гарантирована в течение нескольких лет.

Страница сайта http://test.interface.ru
Оригинал находится по адресу http://test.interface.ru/home.asp?artId=6906