Суббота
04.05.2024, 16:54
КЛЮЧ
Приветствую Вас Гость | RSS
Главная Каталог статей Регистрация Вход
Вход на сайт

Меню сайта

Категории раздела
Компьютер и интернет [21]
Всё о железе и об интернете
Разное [4]
То что не подходит ни в одну категорию
Спорт [0]
Кулинария (моя) [0]
Блюда которые я готовил
Кулинария [0]
Рецепты пользователей
Телевидение [1]
Телевизионные каналы, IP-TV и всё что с ними связано

Поиск

Наш опрос
Вы у нас впервые?
Всего ответов: 15

Интересное
  • Запросы в Yandex
  • Мои достижения
  • Луркоморье
  • Народная карта

  • Статистика

    Онлайн всего: 1
    Гостей: 1
    Пользователей: 0

    Главная » Статьи » Компьютер и интернет

    ПО для распознования текста.
         Часто приходится работать со сканированным текстом? Я думаю время от времени приходится сканированный текст перевести в формат Word’а , распознать в цифровой вид и представить в текстовом редакторе. Особенно возникает в этом необходимость, когда надо курсовую или доклад написать. Так вот у меня такие моменты время от времени возникают.
         Точное распознавание латинских символов в печатном тексте в настоящее время возможно только если доступны чёткие изображения, такие как сканированные печатные документы. Точность при такой постановке задачи превышает 99%, абсолютная точность может быть достигнута только путем последующего редактирования человеком. Проблемы распознавания рукописного «печатного» и стандартного рукописного текста, а также печатных текстов других форматов (особенно с очень большим числом символов) в настоящее время являются предметом активных исследований. 
         Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные — последовательность кодов, использующихся для представления символов в компьютере (например, в текстовом редакторе). Распознавание широко используется для конвертации книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание текста позволяет редактировать текст, осуществлять поиск слова или фразы, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения.
          Системы оптического распознавания текста требуют калибровки для работы с конкретным шрифтом; в ранних версиях для программирования было необходимо изображение каждого символа, программа одновременно могла работать только с одним шрифтом. В настоящее время больше всего распространены так называемые «интеллектуальные» системы, с высокой степенью точности распознающие большинство шрифтов. Некоторые системы оптического распознавания текста способны восстанавливать исходное форматирование текста, включая изображения, колонки и другие нетекстовые компоненты.

         Как происходит распознавание текста на ПК
       Процесс оцифровки и оптического распознавания текста включает в себя пять этапов.
       Ввод страницы. На этом этапе отсканированный или сфотографированный документ попадает в компьютер в виде изображения.
       Анализ макета. OCR-приложение определяет, где на странице находятся текст, рисунки, таблицы и т.п., и разбивает ее на блоки. Программа последовательно дробит страницу на все более мелкие блоки: разбивает текст на абзацы, затем на предложения, отдельные слова и символы. В финале анализа макета документ представляет собой набор отдельных символов. Программа запоминает, в каком месте на странице каждый из них находится.
       Распознавание символов – самый ответственный этап процесса OCR, ведь программа должна правильно идентифи­цировать все найденные знаки. Используется в тексте буква «В» (и какая – русская или латинская) или это цифра «8»? Если программа допустит ошибку, результат распознавания превратится в абракадабру. Для более точного распознавания текста программы комбинируют различные методы, которые условно делятся на две категории: методы сопоставления с образцом и методы сопоставления признаков (более подробно о них читайте далее).
       Реконструкция документа. После завершения процесса распознавания программа начинает воссоздавать страницы, с помощью встроенного словаря объединяя отдельные символы в слова, слова в предложения, предложения в абзацы и т.д. Для ускорения процесса используются результаты анализа макета страницы (этап 2). Кроме того, применяя специальные методы, программы пытаются учитывать грамматические особенности текста, чтобы в итоге получились корректные с точки зрения распознаваемого языка предложения.
       Сохранение документа. OCR-приложение сохраняет распознанный документ в определенном пользователем формате (только текст – TXT; макет страницы – файлы Microsoft Word или PDF).



         Как выполняется распознавание символов
       Для этого используется несколько различных технологий.
       Метод сопоставления признаков. Программа распознавания текста «знает», что каждому символу присущи те или иные признаки; к примеру, буква «А» состоит из двух наклонных линий, соединяющихся вверху, и горизонтальной линии в центре. Эти признаки остаются неизменными, даже если начертание шрифта меняется на полужирное или наклонное. При выборе из нескольких вариантов предпочтение отдается символам с самой высокой степенью совпадения признаков.
       Метод сопоставления с образцом предусматривает сравнение каждого отдельного символа с шаблоном, хранящимся в программе. Для этого предусмотрены большие базы данных с различными шрифтами. Если найденный символ совпадает с шаблоном в базе, то он считается распознанным. Описание выглядит просто, но на практике этот метод оборачивается большими временными затратами и отличается невысокой эффективностью. Причина: каждый символ должен на 100% соответствовать шаблону, иначе он не будет понят. Шрифты в распознаваемом документе и шаблоне для этого должны быть абсолютно идентичными, с учетом всех видов форматирования.
       Отсечение цвета. Документы с цветными рисунками или диаграммами можно отсканировать, но OCR-приложение будет работать только с изображениями, запи­санными в градациях серого. Это практично в том смысле, что цвет распознаваемого текста будет проигнорирован, так что файл займет меньше места.



         Что затрудняет распознавание текста.
       Распознавание текста даже для мощных компьютеров – задача не из простых. Поэтому раньше существовали специальные типы шрифтов для распознавания, символы которых машина понимала лучше.
       Неправильная ориентация страницы. Необычно оформленный текст, расположенный на странице, например по диагонали, создает программе распознавания дополнительные трудности и скорее всего будет распознан с ошибками. А текст, расположенный вверх тормашками, OCR-приложение почти наверняка не сможет распознать правильно. Правда, во всех современных приложениях существуют инструменты, позволяющие автоматически повернуть страницу.
       Многостраничные документы – серьезное испытание для OCR-приложений, поскольку их методы распознавания эффективно работают только в рамках отдельной страницы. Поэтому программы разбивают многостраничные документы на отдель­ные страницы и поочередно выполняют распознавание каждой из них.
       Шрифт. Эффективнее всего OCR-системы справляются с такими легко читаемыми шрифтами, как Times New Roman или Courier. А вот с мелкими или декоративными шрифтами у них с большей долей вероятности возникнут проблемы, равно как и с математическими или химиче­скими символами (в последнем случае необходимо явно указать программе, что ее задача – распознать формулы).
       Профессиональные термины и слова на иностранном языке. Большинство OCR-приложений содержит мультиязычные и тематические словари и легко справляется с распознаванием слов из других языков и терминов. Однако узкоспециальные слова и выражения доставляют программам большие трудности – например, словосочетание «дезоксирибонуклеиновая кислота» может отсутствовать в словаре программы и будет помечено ею как нераспознанное, чтобы пользователь мог исправить его написание.
       Пятна и грязь на документе могут сбить систему распознавания с толку. Так, две крупинки тонера способны быстро превратить «е» в «ё». Поэтому OCR-приложения имеют специальные фун­кции «очистки» документа.
       Текст на рисунках. В некоторых случаях программа должна «читать» и иллюстрации, выделяя на них текстовые блоки, к примеру, чтобы распознавать надписи на диаграммах. Эта задача решается следующим образом: как только на странице обнаруживаются элементы, похожие на текст, выполняется предварительное выборочное распознавание символов. Если результат проверки окажется убедительным, то программа продолжит работать с надписями на рисунках.
       Таблицы. Для любого OCR-приложения таблица представляет собой смесь графических элементов (линий) и текста. Для того чтобы любой элемент таблицы удалось распознать, разработчики предусмотрели специальные функции. Корректно распознанные таблицы можно редактировать, к примеру в Excel или Word.

         Программы распознавания текста
       Наиболее известными программами распознавания текста являются ABBYY FineReader, CuneiForm, OmniPage и Readiris. Они доступны в различных версиях – для домашнего и профессионального использования. Сравнительно новыми являются такие программы, как ABBYY Foto­Reader, способная распознавать текст на фотографиях.

    Microsoft Office Document Imaging



       В последних версиях офисного пакета Microsoft Office появились инструменты для сканирования и распознавания текста – MS Office Document Scanning и Document Imaging. Высокая степень интеграции с другими приложениями MS Office, поддерживаются средства индексирования документов. Document Imaging может открывать файлы MDI (собственный формат Microsoft для сжатия изображений) и TIFF, и передавать результаты распознавания в Microsoft Word.
       Программа DocumentImaging  работает только с двумя языками: английским и языком локализации самого MS Office. Для поддержки других языков необходимо дополнительно устанавливать пакет Multilingual User Interface (MUI). OCR настроек в программе практически нет, программа в автоматическом режиме поддерживает распознавание типа и размера шрифтов, картинок и простых таблиц.
       Хотя возможности оптического распознания текста (OCR) в Microsoft Office Document Imaging скромнее чем в ABBYY FineReader, но если нет желания платить лишние деньги, то получается вполне годный инструмент. Распознав текст, его можно скопировать с отсканированного изображения или факса в другое место либо отправить в Word.
       Но к счастью для нас, программный пакет MODI можно установить отдельно!
       Весьма неожиданно, что MODI перекочевал в установочный пакет SharePoint Designer 2007 – бесплатного HTML-редактора и программы для веб-дизайна от Microsoft.
       Скачать SharePoint Designer 2007 можно с сайта Microsoft, там же можно выбрать язык установочного пакета.

    ABBYY Finereader



       ABBYY Finereader 10.0.102.95 – популярная программа распознавания текста российской компании ABBYY.
       Finereader обеспечивает качественное распознавание и сохранение оформления документов. Существуют три версии этого пакета распознавания: Home Edition, Professional Edition и Corporate Edition, которые отличаются своими возможностями, пользовательским интерфейсом, ценой и типом лицензии.
       Версия Home Edition предназначена только для домашнего использования и пригодится тем, кому время от времени требуется получить распознанную копию страниц книги, учебника, статьи из журнала для последующего редактирования в распространенных офисных программах. Интерфейс программы упрощен, для работы можно выбрать один из типовых способов обработки изображения и нажатием одной кнопки быстро получить результат.
       Professional и Corporate Edition имеют профессиональный интерфейс, дополнительно содержат поддержку распознавания PDF файлов, встроенный редактор текста, проверку орфографии. Corporate версия ориентирована на использование в организациях, поддерживаются сетевые сканеры и многофункциональные устройства, добавлены возможности для совместной работы пользователей.
       Программа производит распознавание текста с более 180 языков, для 38 из них предусмотрена встроенная проверка орфографии. Начиная с версии Professional, распознаются иврит, японский, тайский, китайский языки. Finereader открывает файлы графических форматов (TIFF, JPG, PFD, PNG и др.) в том числе DjVu – компактный формат для хранения отсканированных документов, книг.
       В версии 9.0 также есть возможность распознавания изображений, полученных с цифровых фотоаппаратов. Обработка таких изображений имеет свои особенности, нужно скорректировать неравномерное освещение страницы, недостаточную резкость, изгиб строчек текста.

    Scanitto Pro


       Программа предназначена для сканирования документов и изображений, сохранения их в удобном для вас формате. Кроме того, Scanitto имеет функцию прямой печати на принтере, что позволит использовать ваш принтер и сканер как копир.
       Используя сканер, дома или в офисе, Вы наверняка сталкивались с такими проблемами:
    1.  неудобный и достаточно сложный интерфейс программ сканирования, которые поставляются со сканерами
    2.  отсутствие возможности сохранения изображений в необходимом Вам формате
    3.  отсутствие функции прямой печати, которая сэкономила бы Вам много времени
       Для упрощения процесса сканирования была разработана программа Scanitto, которая позволит Вам быстро и удобно получать изображения со сканера.
       Воспользовавшись программой Scanitto, Вы получаете возможность легко и просто сканировать изображения, документы или фотографии, и сохранять их в удобном для вас формате. Кроме того, Scanitto порадует вас функцией прямой печати на принтере, что позволит использовать ваш принтер и сканер как копир.
       Использовать Scanitto просто, Вам нужно лишь выбрать сканер, указать параметры сканирования и папку для сохранения изображений. Вы сможете сразу же распечатать их на принтере.
       Scanitto предоставит Вам:
    1. Простой и удобный интерфейс
    2. Функцию прямой печати отсканированных изображений. Создание копий
    3. Возможность сохранения отсканированных изображений в следующих форматах: bmp, jpeg, tiff, png, pdf, gif
    4. Выбор необходимого Вам разрешения и цветности изображения
    5. Совместимость со всеми TWAIN сканерами
       Scanitto Pro — это легкое, быстрое и не перегруженное массой ненужных функций программное обеспечение для сканирования. Точная настройка параметров сканирования, копирование документов в один клик и сохранение документов в многостраничные PDF и TIFF файлы — это именно то, что постоянно нужно под руками пользователя сканера!
       Большинство приложений, которые поставляются в комплекте со сканерами, распространяются как демо-версии, в то время как их полные версии довольно дорогое удовольствие и в то же время переполнены огромным количеством ненужных функций, которые, скорее всего, не будут использоваться. Обычные пользователи редко прибегают к современной цветовой коррекции, нестандартным форматам бумаги и другим новомодным функциям, в то время как специалисты просто не покупают недорогие сканеры и приложения — каждый из них имеет свои собственные требования, которые вряд ли будут удовлетворены стандартными решениями. Если у вас есть сканер, который вы используете для ограниченного круга задач (копирования, сканирования простых текстов и изображений) и ищете простое в использовании и недорогое средство, обязанное делать работу хорошо каждый день, вам, безусловно, следует проверить Scanitto Pro.
       Scanitto Pro по всем параметрам превосходит своего предшественника, программу Scanitto, и существенно расширяет свою функциональность, вдобавок к множеству удобных возможностей, которые сделают вашу ежедневную работу еще более, свободной и эффективной. Scanitto Pro поддерживает практически все существующие TWAIN сканеры, так что вам не придется беспокоиться о совместимости, кроме случаев, если у вас есть нечто крайне редкое или экзотическое. Если у вас есть принтер, Scanitto Pro поможет вам сделать копию в один клик — просто подождите пока отсканируется оригинал и программа передаст его на устройство печати. Теперь можно выбирать область для сканирования, поэтому можно забыть о дальнейшей обрезке изображений. Если у вас есть огромный документ, состоящий из нескольких страниц, Scanitto Pro может сохранить его в многостраничный TIFF или PDF файл, поэтому вы легко можете оцифровать свои рукописи в один компактный файл. Плюс ко всему, каждый момент процесса сканирования может быть доработан с учетом конкретных требований.
       Scanitto Pro является улучшенной программой для сканирования, которую может позволить себе каждый. Легкость в использовании каждой функции программы, необходимой для ежедневного сканирования — это выбор, о котором вы не будете жалеть!

    VueScan


       VueScan — программа для работы со сканерами HP, Minolta, Nikon, Polaroid, Epson, Canon и другими. VueScan может работать с внутренней глубиной цвета. VueScan поддерживает автоматическую и ручную настройку большинства параметров и пакетный режим сканирования. В VueScan поддерживается более 500 моделей сканеров с определенным перевесом в сторону слайд-сканеров — Nikon, Minolta, Polaroid, Microtek, Epson. Предусмотрено автоматическое удаление дефектов изображения за счет канала инфракрасного сканирования и многопроходное сканирование с последующим усреднением результата — для подавления собственных шумов сканера. В VueScan имеются фильтры подавления зерна, нерезкого маскирования и удаления паразитного оттенка оригинала. В VueScan есть средства ручной корректировки динамического диапазона и градационной характеристики (независимо по каналам R, G, B). В большинстве случаев, стандартный драйвер устройства имеет крайне ограниченные возможности по регулировке параметров сканирования. Используя зачастую скрытые возможности конкретного сканера, VueScan позволяет гибко настроить процесс обработки изображений, включая развитую цветокоррекцию, возможности многопроходного и пакетного сканирования, аппаратную регулировку экспозиции, выбор максимальной глубины цвета и формата сохраняемых файлов. Большой интерес представляет функция сохранения исходных данных сканера в файл (raw file) и последующая обработка этих данных при выключенном устройстве, что избавляет от необходимости повторного сканирования оригиналов и увеличивает ресурс оборудования.
       Применение VueScan особенно актуально при работе с прозрачными оригиналами (негативы, слайды), т.к. в программе содержится информация о цветовых характеристиках более 150 типов плёнок. Речь идёт, прежде всего, о маске цветного негатива, которая может сильно отличаться у разных плёнок и производителей. В программе предусмотрен прямой выбор маски из списка распространенных плёнок, а также возможность ручной регулировки цветовых компонентов маскирующего слоя. Пользовательские настройки можно сохранять в специальный файл, что позволяет создать индивидуальные профили для каждого вида работ.

       Особенности программы VueScan:
    • Поддержка работы с более 1200 моделями сканеров
    • Версии для Windows, Linux и Mac OS
    • Улучшает вашу производительность и качество сканирования
    • Программа скачана более 5 000 000 раз
    • Создание RAW сканированных файлов
    • ICC профили и цветовые пространства
    • Калибровка IT8 цвета What’s new in version 8.5.39:
    • Fixed problem with OCR (Optical Character Recognition)
    • Fixed problem with some HP scanners on Mac OS X
    OCR CuneiForm



       Бесплатная программа сканирования и распознавания текста российского разработчика Cognitive Technologies.
       Первоначально OCRCuneiForm разрабатывался как коммерческий продукт, однако, в декабре 2007 года компания-разработчик стала распространять программу бесплатно, а в апреле 2008 года открыла исходные тексты программы. В планах дальнейшее развитие этой системы распознавания текста – проект OpenOcr.Org, поддерживаемый компанией CognitiveTechnologies и сообществом OpenSource разработчиков.
       Эта OCR программа прилагается в комплекте с некоторыми моделями сканеров фирм Canon, HewlettPackard, Oki, Olivetti. Технологии распознавания компании Cognitive используются в популярном издательском пакете CorelDraw.
       OCRCuneiForm обеспечивает быстрое, удобное и качественное распознавание текста с сохранением исходного вида документа. Поддерживается распознавание с более 20 языков, среди них русский, украинский, английский, немецкий, французский, испанский, итальянский, португальский, шведский, финский, сербский, хорватский, польский, а также распознавание смешанного русско-английского текста.
       Основные возможности бесплатной программы сканирования и распознавания текста OCRCuneiForm:
    • современный и интуитивно-понятный интерфейс, встроенные помощники для сканирования и распознавания текста
    • встроенный текстовый редактор и система контроля правописания для работы с распознанным текстом
    • распознавание текста с сохранением исходного вида документа
    • распознавание таблиц со сложной структурой, многоколоночного текста
    • сохранение черно-белых и цветных иллюстраций в распознанном документе
    • поддерживаются все TWAIN-совместимые сканеры
    • использование современных разработок, таких как нейронные сети, адаптивное распознавание символов, когнитивный анализ и другие
    • распознавание печатных шрифтов из книг, журналов, газеты, текстов из пишущих машинок, распечаток из матричных и лазерных принтеров и т.п.
    • режимы автоматического, полуавтоматического и ручного разбиения на блоки для поиска в документе текстовых фрагментов, рисунков и таблиц
    • дополнительные возможности, повышающие удобство работы с программой.
    OmniPage



       Программа отличается высокой скоростью и точностью распознавания. Распознаются более 120 языков с различными алфавитами: латинский, греческий алфавиты, кириллица, китайский, японский и корейский языки. Как и FineReader, OmniPage уверенно распознает документы, полученные с помощью цифровых камер с помощью технологии коррекции изображения «3D Correction».
       В этой программе есть поддержка параллельной работы с несколькими документами: можно открывать, распознавать, корректировать и сохранять несколько документов одновременно.
       OmniPage выпускается в трех версиях: Standard, Professional, Enterprise. Версия Professional, в отличие от Standard, включает средство для управления документами, ParerPort, и программа PDF Create, позволяющее создавать PDF документы из любого приложения. В версии Enterprise добавлены интеграция с Microsoft SharePoint Server, дополнительные сетевые и многопользовательские функции.
       Основные возможности программы сканирования и распознавания текста OmniPage:
    • высокая точность и скорость распознавания
    • сохранение форматирования документа как в оригинале: колонки, таблицы, рисунки, списки
    • технология «3DCorrection» позволяет корректировать и распознавать изображения, полученные с цифровых камер
    • сохранение результатов распознавания в PDF, HTML, MicrosoftWord, Excel и PowerPoint, CorelWordPerfect и других форматах. Поддержка XML и XPS — открытого графического формата на основе XML, разработанного компанией Microsoft
    • встроенные словари распознавания, в том числе финансовый, юридический, медицинский, для более точного распознавания специфических терминов
    • средства коррекции изображений: удаление шума с рисунков, регулировка контрастности, яркости, других параметров
    • поддержка многопоточного распознавания, использующая все возможности современных многоядерных процессоров
    • преобразование форматов рисунков в полученном документе. Поддерживаются распространенные форматы изображений: TIF, JPG, BMP, PCX, GIF, PDF, MAX и другие
    • возможность непосредственного распознавания из популярных офисных приложений, без запуска самой программы OmniPage
    • регулировка соотношения скорость/качество распознавания. Это позволяет быстрее распознавать хорошо отсканированные, четкие документы
    • возможность распознавания информации из различных электронных форм, анкет
    • средства автоматизации выполнения различных задач, настройка и выполнение последовательности действий путем нажатия одной кнопки (WorkflowAssistant).

    Readiris


       Так же, как и другие программы распознавания текста, Readiris преобразует отсканированные изображения документов в редактируемый формат. Readiris уверенно распознает документы, содержащие сложную верстку, таблицы, иллюстрации. Существуют Pro и Corporate версии этого продукта, а также добавочные модули распознавания ближневосточных и восточных языков. Версия Corporate отличается от Pro улучшенной работой с PDF, поддержкой сжатия выходных файлов, распознаванием одного пакета в несколько файлов, индексированием распознанных документов и другими возможностями. В Corporate версии есть удобное средство для автоматического распознавания файлов, попадающих в определенную папку (Watchedfolder).
       Поддерживается распознавание текста с более 120 языков распознавания, включая русский, а также ближневосточные языки — арабский, иврит, фарси (в версии Middle-East) и японский, китайский, корейский (в версии Asian). Есть версия Readiris для Macintosh.
       Вместе с поддержкой распознавания популярных форматов картинок, распознаются файлы PDF и DjVu.
       Основные возможности программы сканирования и распознавания текста ReadIris:
    • кнопки SmartTasks — позволяют выполнять различные задачи (сканирование, распознавание, сохранение и др.) путем нажатия одной кнопки
    • поддержка формата XPS (XML Paper Specification)
    • сохранение результатов распознавания в распространенных форматах: doc, xls, pdf, html, rtf и других. В 12 версии добавлено также сохранение в форматах OpenOfficeDocument (ODT), XMLPaperSpecification (XPS), PDF/A
    • возможность сжатия выходных файлов PDF, XPS & PDF/A с помощью собственной проприетарной технологии intelligentHigh-QualityCompression (iHQC™), позволяющая, по словам компании-разработчика, создавать сжатые файлы по размеру до 400 раз меньше, чем оригинальные цветные изображения. В версии Corporate есть возможность автоматически распознавать файлы изображений, которые попадают в определенную папку (Watchedfolder) возможность автоматического распознавания мультистраничных документов или последовательности изображений в разные выходные файлы распознаются файлы изображений популярных форматов (TIFF, JPG, BMP, JPEG2000 и др.), а также PDF и DjVu файлы.Более 120 языков распознавания, в том числе русский, со встроенным орфографическим словарем для каждого языка. 25 языков интерфейса программы, русский интерфейс тоже есть.Распознавание арабского языка, фарси и иврита в версии Middle-East,распознавание восточных языков: китайского (упрощенное и традиционное письмо), японского и корейского языков в версии Asian,средства индексирования документов (возможность указать для каждого документа название, ключевые слова и расположение файла с распознанным текстом) — в версии Corporate. Развитые средства автоматизации сканирования и распознавания текста встроенные инструменты редактирования изображений: автоматическое определение ориентации документа, удаление шума, настройка резкости, яркости, контрастности, гаммы.
    RiDoc



       RiDoc сканирует документы, одновременно уменьшая размеры файла отсканированного документа без потери информационного качества. Используйте RiDoc для создания электронных документов (цифровой копии документа).
       Основные функции программы:
    • сканирование документа. Работа со сканерами с автоматической подачей листов
    • создание архива отсканированных документов
    • наложение на отсканированный документ водяного знака (watermark)
    • удобная технология сохранения документов с помощью «Быстрых папок»
    • ссканированние документа в tiff (в т.ч. MiltiPage режим), bmp, jpeg, png форматы
    • сканирование документа в Word
    • сканирование документа в PDF файл
    • отправка отсканированного документа по электронной почте
    • печать отсканированного документа на принтере
    • ксерокопия документа
    • экспорт файлов формата doc (xls, pdf и др.) в графические файлы: bmp, png, jpeg, tiff с помощью виртуального принтера RiDoc.
       Программа будет полезной для:
    • рядовых пользователей, которым требуется сканировать документы
    • быстрого создания с помощью сканера электронных документов малого размера без потери информационного качества
    • создания электронных документов с помощью сканера, предназначенных для кодированной передачи (шифрование с открытым ключом (ЭЦП, электронная подпись)
    • создания электронного документа с помощью сканера для передачи по электронной почте
    • удобного создания электронных версий документов при помощи виртуального принтера RiDoc
    • ведения собственного архива документов.
    SimpleOCR



       SimpleOCR - это бесплатная OCR система для распознавания текстов со сканера или с рисунков. 
       По качеству работы он не уступает многим платным аналогам. Точность распознавания может достигать 99% - это очень высокий показатель для подобных систем. Эта версия SimpleOCR работает с документами только на английском и французском языках, но в будущем появятся и словари на других языках.
       Среди прочих возможностей SimpleOCR можно отметить следующие:
    • большой словарь, насчитывающий около 120 тысяч слов
    • удаление пятен и "шумов" с документов
    • сохранение форматирования шрифтов - подчеркивание, жирный, курсив
    • захватывание фотографий из текста
    • коррекция ошибок
    • пакетное распознавание текста
    • экспорт полученного документа в форматы txt, rtf, tiff.

      Оф. сайт Скачать с DF Торрент Скачать с ОС Размер
     Microsoft Office Document Imaging www.microsoft.com Скачать Скачать Скачать 297 Мб
     ABBYY Finereader www.abbyy.ru Скачать Скачать Скачать 111 Мб
     Scanitto Pro www.scanitto.com Скачать Скачать Скачать 9,4 Мб
     VueScan www.hamrick.com Скачать Скачать Скачать 7,5 Мб
     OCR CuneiForm cognitiveforms.ru Скачать Скачать Скачать 33.3 Мб
     OmniPage www.nuance.com Скачать Скачать Скачать 130 Мб
     Readiris www.irislink.com Скачать Скачать Скачать 239,8 Мб
     RiDoc www.riman.ru Скачать Скачать Скачать 9 Мб
     SimpleOCR www.simpleocr.com Скачать Скачать Скачать  9,3 Мб

    Использовались материалы с сайтов: blogomoney.ru, wikipedia.org, computerbild.ru, winunleaked.tk.

    Категория: Компьютер и интернет | Добавил: WAW (11.11.2012)
    Просмотров: 22637 | Комментарии: 6 | Теги: Распознавание текста
    Всего комментариев: 0
    Имя *:
    Email *:
    Код *:
    Печать страницы

    Откуда ты пришел

    ТЕГИ

    Погода

    Регистрация на DF

    Друзья сайта
  • Официальный блог

  • Скорость интернета


    Copyright MyCorp © 2024