Реферат программное обеспечение распознавания символов

История[ править править код ] В году Густав Таушек Gustav Tauschek получил патент на метод оптического распознавания текста в Германии, после чего за ним последовал Гендель Paul W. Handel , получив патент на свой метод в США в В году Таушек также получил патент США на свой метод. Машина Таушека представляла собой механическое устройство, которое использовало шаблоны и фотодетектор. В году Дэвид Х.

Проектирование модели информационной системы и создание приложения по обработке информации на тему "Программное обеспечение Центра занятости населения". Описание структуры базы данных. Технологическое обеспечение, внешний вид и описание работы программы. История возникновения и развития идеи автоматического перевода текста.

Оптическое распознавание символов

Виды сканеров, характеристика и принципы работы 1. Программное обеспечение распознавания информации Заключение Используемая литература Введение Почти каждый пользователь компьютера постоянно сталкивается с проблемой преобразования документов из бумажной формы в электронную. Однако процедура ввода информации вручную отнимает огромное количество времени и чревата ошибками.

Кроме того, вручную можно вводить только тексты, но не изображения. Выходом из положения является сканер, позволяющий вводить в компьютер, как изображения, так и текстовые документы. Они служат везде: в крупных компаниях, где обрабатываются огромные архивы документов, в издательствах и проектно-конструкторских организациях, а также в небольших фирмах и домашних офисах. В году флорентийский аббат Джованни Казелли Giovanni Caselli изобрёл прибор для передачи изображения на расстояние, названный впоследствии пантелеграф.

Передаваемая картинка наносилась на барабан токопроводящими чернилами и считывалась с помощью иглы. В году, немецким физиком Артуром Корном Arthur Korn была запатентована технология фотоэлектрического сканирования, получившая впоследствии название телефакс.

Передаваемое изображение закреплялось на прозрачном вращающемся барабане, луч света от лампы, перемещающейся вдоль оси барабана, проходил сквозь оригинал и через расположенные на оси барабана призму и объектив попадал на селеновый фотоприёмник. Эта технология до сих пор применяется в барабанных сканерах. В дальнейшем, с развитием полупроводников, усовершенствовался фотоприёмник, был изобретен планшетный способ сканирования, но сам принцип оцифровки изображения остаётся почти неизменным.

Процесс получения этой копии называется сканированием. Сканирование -- это процесс оцифровки изображений, иными словами, перевод его в компьютерный вид. Ранее данная область была уделом только профессионалов. Однако технический прогресс позволил сканировать изображения и рядовому пользователю. Классификация сканеров: 1. Ручной вид сканеров. Небольшой размер и приемлемая цена устройства сначала привлекает покупателей, но вот принцип действия отталкивает, так как нужно равномерно провести устройством по сканируемому изображению.

Дрожание руки или другие помехи - прощай высокое качество изображения. Планшетный вид сканеров. Любые размеры устройства, стандартные - формат листа А4. Принцип работы: изображение кладется на прозрачную поверхность, закрывается крышка, запускается сканер, изображение цифруется посредством бегающего под стеклянной поверхностью распознающего элемента.

Можно также приобрести сканеры, способные распознавать изображения формата А2, А3, но это больше подходит для профессиональной индустрии. Протяжной вид сканеров. Принцип работы схож с работой сканера, так как изображение равномерно протягивается через сканер посредством специального механизма.

Данный вид - нечто среднее между ручным и планшетным сканером. Перечислена основная классификация моделей. Однако существует масса других разновидностей, направленных на удовлетворение потребностей профессионалов. Распознавание текста - перевод изображений букв и цифр в цифровой вид для последующей обработки в текстовом редакторе. Технические характеристики сканеров: 1. Разрешающая способность Разрешающая способность, или разрешение, -- один из основных параметров, используемых производителями для описания возможностей сканера.

Наиболее распространенная единица измерения разрешающей способности сканеров -- количество пикселей на один дюйм pixels per inch, ppi. He следует путать ppi с более распространенной аббревиатурой dpi dots per inch -- количество точек на дюйм. Различают оптическое и интерполированное разрешение. Величину оптического разрешения можно вычислить, разделив количество светочувствительных элементов в сканирующей линейке на максимальную ширину области сканирования.

Нетрудно посчитать, что количество светочувствительных элементов у сканера, имеющего оптическое разрешение ppi и максимальную ширину области сканирования 8,5 дюйма мм , должно составлять не менее Важно понимать, что оптическое разрешение -- это частота дискретизации, только в данном случае отсчет идет не по времени, а по расстоянию.

Большинство современных недорогих планшетных сканеров имеют оптическое разрешение , ppi и даже более. Интерполированное разрешение -- это повышение количества пикселей в отсканированном изображении за счет программной обработки.

Разрядность Разрядность, или глубина цвета, определяет диапазон значений, которые может принимать цвет пикселя. Иначе говоря, чем больше разрядность при сканировании, тем большее количество оттенков может быть сохранено в полученном изображении. В настоящее время для хранения и передачи полноцветных изображений например, фотографий стандартом является разрядный формат RGB. При сканировании цветных оригиналов с использованием модели RGB изображение формируется из трех цветовых каналов, на каждый из которых приходится по 8 бит.

Шум Цифровой шум появляется в сканируемом изображении вследствие неидеальности конструкции электронных узлов сканера, в первую очередь -- светочувствительных элементов и их цепей. К сожалению, производители сканеров практически никогда не указывают уровень цифрового шума в характеристиках выпускаемых изделий. Отчасти это объясняется тем, что на сегодняшний день пока не существует стандартизированной методики измерения данного параметра.

Применительно к отсканированным изображениям различают два вида цифрового шума -- случайный и регулярный. Для минимизации случайного шума перед сканированием выполняется процедура калибровки, во время которой измеряются пороговые значения и смещение базового напряжения для каждого светочувствительного элемента. Регулярный шум, в отличие от случайного, очень хорошо заметен, поскольку проявляется в виде горизонтальных, вертикальных либо диагональных полос. Производительность Производительность сканера складывается из трех параметров: времени прогрева источника света, времени предварительного сканирования и времени окончательного сканирования.

Некоторые модели сканеров не нуждаются в прогреве и готовы к работе сразу после включения. Что касается устройств, оснащенных люминесцентными и газоразрядными лампами, то для выхода их на рабочий режим необходимо определенное время, обычно несколько десятков секунд. Поскольку в универсальных сканерах для работы с прозрачными и непрозрачными оригиналами обычно используются разные источники света, при каждом переключении соответствующих режимов устройство заново выполняет процедуру прогрева активируемой лампы.

Время окончательного сканирования для одной и той же модели сканера может варьироваться в широких пределах в зависимости от величины установленного в настройках разрешения и прочих параметров. Это стоит учитывать при сравнении параметров, заявленных в технических характеристиках сканеров от разных производителей. Зачастую каждый производитель использует собственную методику для определения данной величины.

Тип и размер оригиналов Конструкция сканера накладывает определенные ограничения на тип и формат оригиналов, которые можно оцифровывать с помощью данного устройства. В первую очередь следует обращать внимание на то, для работы с какими именно категориями носителей предназначена та или иная модель.

Обычно в характеристиках сканера указывается максимальный иногда, если существует такое ограничение, -- и минимальный размер сканируемого оригинала и сканируемой области. Некоторые модели сканеров могут работать только с оригиналами строго определенных размеров: в этом случае в спецификации должен быть приведен перечень всех поддерживаемых форматов.

У универсальных сканеров допустимые форматы носителей и размеры сканируемой области для прозрачных и непрозрачных оригиналов часто различаются. Интерфейс В большинстве современных моделей сканеров низшей и средней ценовой категории для подключения к ПК используется интерфейс USB 2.

Оптическая система сканера, состоящая из объектива и зеркал или призмы, проецирует световой поток от сканируемого оригинала на приемный элемент, осуществляющий разделение информации о цветах. В трехпроходных сканерах используются лампы разных цветов или же меняющиеся светофильтры на лампе или CCD-матрице Charge-Couple Device -- устройство с зарядовой связью. Приемный элемент преобразует уровень освещенности в уровень напряжения все еще аналоговую информацию.

Далее аналоговый сигнал поступает на аналого-цифровой преобразователь АЦП. С АЦП информация выходит в двоичном виде и после обработки в контроллере сканера через интерфейс поступает в компьютер. Разрядность АЦП сканера составляет 48 бит и определяет глубину цвета. Но, как было указано раньше, видеоадаптеры поддерживают максимально битный цвет.

Возникает вопрос: зачем такая разрядность, если монитор не может поддерживать такое разрешение. Разъяснение довольно простое: имея избыточную информацию, довольно легко провести цветовую корректировку изображения без потери качества.

Другими словами, сканер, который имеет большую глубину цвета, позволяет сохранить больше оттенков и переходов в темных и светлых тонах. Это позволяет программным путем повести коррекцию полученного изображения. Чем больше светочувствительных элементов у сканера, тем больше точек он может снять с каждой горизонтальной полосы изображения.

Это и называется оптическим разрешением. Обычно его считают по количеству точек на дюйм -- dpi dots per inch.

Когда указывается разрешение устройства, например Ч dpi, то это означает, что механика сканера может передвигать считывающую головку на половину точки пикселя.

Для обработки слайдов необходимо разрешение не менее dpi. По большому счету это просто упрощенный ее вариант. В сканерах такого типа отсутствует система зеркал и объектив.

Светочувствительная линейка соответствует ширине листа и каждая точка строки фокусируется на фотодиоде цилиндрической микролинзой.

Сканируемый документ освещается линейкой светодиодов, а в цветном сканере -- светодиодами трех основных цветов. Сканеры с такой технологией используются в основном в офисных моделях.

Качество сканирования во многом зависит от лампы, которая освещает оригинал. К ней предъявляются очень высокие требования -- стабильность свечения и спектральной характеристики, равномерность спектра и малый нагрев. В настоящее время используются лампы с холодным катодом.

От лампы, в первую очередь, зависит правильность цветопередачи. Все сканеры, предназначенные для сканирования фотографий, обязательно в качестве источника света используют лампу с холодным катодом. Следует отметить еще одну возможность современных сканеров -- сканирование негативов и слайдов. Суть метода состоит в том, что негатив или слайд укрепляется в специальной пластмассовой рамке так, чтобы пленка не касалась стекла , затем пленка просвечивается внешней лампой, а внутренняя лампа выключается.

Существует множество вариантов таких сканеров. Обычно лампа монтируется в крышке, но существуют модели с внешней лампой в виде отдельного съемного блока. Программное обеспечение распознавания информации Для максимально эффективного использования устройства необходима программа распознавания текста С помощью сканера достаточно просто получить изображение страницы текста в графическом файле.

Но работать с текстом невозможно по определённым причинам: - страница с текстом представляет собой графический файл - обычную картинку; - текст нельзя редактировать и форматировать; - необходимо преобразовать элементы графического изображения в последовательности текстовых символов. Основным методом перевода бумажных документов в электронную форму является сканирование: - в результате сканирования получается графическое изображение, состоящее из точек; - количество точек определяется размером изображения и разрешением сканера.

Преобразованием графического изображения в текст занимаются специальные программы распознавания текста Optical Character Recognition - OCR. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения.

Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати.

ПОСМОТРИТЕ ВИДЕО ПО ТЕМЕ: Программа для распознавания текста - Программа для сканирования текста

Программное обеспечение распознавания информации: ABBYY FineReader и пр. и программное обеспечение распознавания символов" (реферат). портативных сканеров (Handy scanner) до сложных систем оптического распознавания символов OCR (Optical Character Recognition)., страница 1.

Безусловно, лидер программ в распознавании текста является ABBYY FineReader, но, чтобы удостовериться в этом, проведем сравнительный анализ еще нескольких программ для распознавания текста из графического файла. В результате мы сможем, во-первых, оценить рынок доступных ПО для распознавания текста, во-вторых, указать сильные и слабые стороны каждого из них. ABBYY FineReader 12 — это профессиональное программное обеспечение, с помощью которого можно распознавать текст из графического файла и переводить его в различные редактируемые форматы. Программа точно определяет текст и структурно его переводит в нужный формат. Она позволяет не перепечатывать текст в ручную, а это, в свою очередь, сокращает затраты на обработку. Данное ПО используется в фирмах и организациях, которые постоянно работают с бумажной документацией. Рисунок 6. Данное программное обеспечение показало себя, как качественный продукт. Также стоит отметить, что ключевые поля, по которым в дальнейшем будут выгружаться данные из документа, были распознаны хорошо и без ошибок, а значит, основную задачу оптимизации и автоматизации возможно реализовать. Его легко и просто использовать любому пользователю, так как нет необходимости загружать и устанавливать программу на компьютер. Данный продукт поддерживает множество языков для распознавания в том числе и русский. Рисунок 8. В основном, для быстрого распознавания текста этих форматов достаточно. Так как имеется необходимый в данной дипломной работе формат.

Программа позволяет переводить изображения документов фотографий, результатов сканирования, PDF-файлов в электронные редактируемые форматы.

Виды сканеров, характеристика и принципы работы 1. Программное обеспечение распознавания информации Заключение Используемая литература Введение Почти каждый пользователь компьютера постоянно сталкивается с проблемой преобразования документов из бумажной формы в электронную. Однако процедура ввода информации вручную отнимает огромное количество времени и чревата ошибками.

Сканирование документов и системы распознавания

Список источников Введение Тема распознавания текста попадает под раздел распознавания образов. И для начала коротко о самом распознавании образов. Распознавание образов или теория распознавания образов - это раздел информатики и смежных дисциплин, развивающий основы и методы классификации и идентификации предметов, явлений, процессов, сигналов, ситуаций и т. Можно выделить два основных направления в этой области: изучение способностей к распознаванию, которыми обладают живые существа, объяснение и моделирование их; развитие теории и методов построения устройств, предназначенных для решения отдельных задач в прикладных целях. Всем давно известно, что существуют миллионы старых книг, которые хранятся в хранилищах строгого режима, доступ к которым имеет только специализированный персонал.

Лащенко Константин Сергеевич

Появление сканеров, развитие скорости сканирования и быстроты распознавания символов решающим образом ускорило развитие глобальных вычислительных сетей. В современном мире каждый день переводится с бумаги в электронную форму огромное количество различных документов печатные тексты, платежные поручения, таможенные или налоговые декларации, бюллетени для голосования, различные анкеты и множество других Активно используются тысячи различных систем электронного документооборота практически во всех сферах деятельности При современных объемах потоков документов подобные операции немыслимы без автоматизированной обработки Во всех системах электронного документооборота и системах ввода печатных текстов одним из ключевых этапов является распознавание текстовых символов - перевод информации из графической формы - результата сканирования — в текстовую формую Объект работы — обработка текстовых и графических данных. Предмет исследования - сканеры и программное обеспечение распознавания символов. Цель работы — рассмотреть сканеры и программное обеспечение распознавания символов. В связи с поставленной целью необходимо решить следующие задачи: выявить сущность сканеров и провести их классификацию; рассмотреть программное обеспечение для распознавания символов.

Презентация на тему: " Сканеры и программное обеспечение распознавания символов Анна Виноградова. Сканер - оптико- электронное устройство для ввода в компьютер графических изображений.

Электронный архив: Сканирование и OCR Сканирование документов и системы распознавания Введение Преобразование документа в электронный вид делится на два этапа: получение графического образа документа и перевод графического образа в текстовый формат. Графический образ документа является результатом сканирования. Перевод графического образа документа в текстовый формат может быть произведен вручную этот способ будет подробно рассмотрен в лекции "Индексация и имиджинг" или посредством автоматического распознавания. Настоящая лекция посвящена вопросам сканирования и распознавания, в ней будут рассмотрены следующие темы: Технология сканирования Обзор сканеров для ЭА, их основные характеристики и примеры Программное обеспечение сканирования Суть процесса распознавания Точность распознавания и пути ее достижения Сканирование - процесс оцифровки аналогового изображения документ, фотография, иллюстрация, слайд при помощи специального устройства, называемого сканером.

Сканеры и программное обеспечение распознавания символов

.

Реферат по информатике на тему "Сравнительный анализ возможностей систем распознавания символов"

.

.

.

.

.

ВИДЕО ПО ТЕМЕ: Лучшие программы для распознавания текста. Рейтинг OCR.
Похожие публикации