Реферати українською » Информатика, программирование » Системи оптичного розпізнавання образів


Реферат Системи оптичного розпізнавання образів

>Реферат

на задану тему:

“>Системиоптичногорозпізнаванняобразів”


Наступного дняіснуєдосить багатопотужнихпрограм порозпізнаваннюсимволів, але йслідзазначити, щоздатністьлюдиничитатидрукований текстнизькоїякостідотеперперевершуєздатностікомп'ютера.

>Кожендрукований текстмаєпервиннувластивість —шрифти,якимивіннадрукований.Виходячи із цого,існують двакласиалгоритміврозпізнаваннядрукованихсимволів:шрифтовий табезшрифтовий.Шрифтові чишрифтозалежніалгоритмивикористовуютьапріорнуінформацію про шрифт,якимнадрукованобукви. Цеозначає, щопрограмі винна бутинаданаповноціннавибірка тексту,надрукованогоданим шрифтом. Програмувимірює іаналізуєрізні характеристики шрифту і заносити їхні у свою базуеталонних характеристик. Позакінченні цогопроцесушрифтовапрограмаоптичногорозпізнаваннясимволів готова дорозпізнаванняданого конкретного шрифту.

>Недоліки зазначеногопідходу:

- алгоритм винензаздалегідь знаті шрифт, щойомупредставляють длярозпізнавання,тобтовін винензберігати вбазірізні характеристики цого шрифту;

-якістьрозпізнавання тексту,надрукованогодовільним шрифтом, якщо прямопропорційнакореляції характеристик цого шрифтузі шрифтами,наявними вбазіпрограми.

>Ціфакториобмежуютьуніверсальність такихалгоритмів.

Для роботипрограмирозпізнаваннянеобхідний блокнастроювання наконкретний шрифт. Вочевидь, щоцей блок якщовносити своючасткупомилок вінтегральнуоцінкуякостірозпізнавання, чифункціювстановлення шрифтудоведетьсяпокласти накористувача.

Програму,заснована нашрифтовомуалгоритмірозпізнаваннясимволів,вимагає відкористувачаспеціальних знань прошрифтивзагалі, проїхнігрупи івідмінності один від одного, прошрифти,якиминадруковано документкористувача. Увипадкуякщопаперовий документ нестворений самимкористувачем, априйшов доньогоззовні, неіснуєзагального способудовідатися, ізвикористанням якішрифтів бувнадрукованийцей документ.

Зіншого боці, у шрифтовогопідходуєперевага,завдякиякій його активновикористовують і, очевидно, будутьвикористовувати вмайбутньому. Асаме,маючидетальнуапріорнуінформацію просимволи, можнапобудуватидоситьточні інадійніалгоритмирозпізнавання.Взагалі, припобудові шрифтового алгоритмурозпізнавання, навідміну відбезшрифтового,надійністьрозпізнавання символуєінтуїтивноясною іматематичновираженоювеличиною.Ця величинавизначається яквідстань уякому-небудьметричномупросторі відеталонного символу,пред'явленогопрограмі впроцесінавчання, до символу, щопрограманамагаєтьсярозпізнати.

Іншийкласалгоритмів —безшрифтові чишрифтонезалежні,тобтоалгоритми, що немаютьапріорних знань просимволи, щонадходять перед тим навхід.Ціалгоритмивимірюють іаналізуютьрізні характеристики (>ознаки), щовластиві буквах як такимбезвідносно шрифту і абсолютногорозміру,яким смердотінадруковані. Уграничномувипадку дляшрифтонезалежного алгоритму процеснавчанняможе бутивідсутнім. У цьомувипадку характеристикисимволіввимірює,кодує іпоміщає до базипрограми сама людина. Однак, напрактицірідкозустрічаютьсявипадки, колитакий шляхвичерпновирішуєпоставлене заподіяння.Більшзагальний шляхствореннябази характеристикполягає внавчанніпрограми навибірціреальнихсимволів.

>Hедолікомданогопідходуєнижчаякістьрозпізнавання, ніж ушрифтовихалгоритмів. Цепов'язане із тім, щорівеньузагальнення привимірах характеристиксимволівнабагатобільший, ніж увипадкушрифтозалежнихалгоритмів.Фактичноцеозначає, щорізні допуски іспрощення привимірах характеристиксимволів для роботибезшрифтовихалгоритмівможуть бути в 2-20разівбільші впорівняннізішрифтовими.

>Переваги цогопідходутіснопов'язані із йогонедоліками.Основнимиперевагамиє:

-універсальність. Цеозначає, із одного боці,можливістьзастосування цогопідходу увипадкахвеликоїрізноманітностісимволів, котріможутьнадійти навхідсистеми; ізіншого боці, зарахунокзакладеної у якихздатностіузагальнювати,такіалгоритмиможутьекстраполюватинакопиченізнання замежінавчальноївибірки,тобтостійкорозпізнаватисимволи, навигляддалекі від тихий, котрі булиприсутні внавчальнійвибірці.

-технологічність.Процеснавчанняшрифтонезалежнихалгоритмівзвичайноє понад вибачимо іінтегрованим у томурозумінні, щонавчальнавибірка нефрагментована нарізнікласи. При цьомувідсутнянеобхідність підгримувати вбазі характеристикрізніумовиспільногоіснуванняцихкласів (>некорельованість,незмішуваність, системуунікальногоіменування і т.п.).Проявомтехнологічностієтакож тієї факт, що частовдаєтьсястворитимайжеповністюавтоматизованіпроцедуринавчання.

-зручність упроцесівикористанняпрограми. Увипадку,якщопрограмапобудована нашрифтонезалежних алгоритми,користувач незобов'язаний знатіщо-небудь просторінку, якоївінхоче вводити накомп'ютернупам'ять йповідомлятипрограму процізнання.Такожспрощуєтьсяінтерфейскористувачапрограми зарахуноквідсутності наборуопцій йдіалогів, щообслуговуютьнавчання ікерування базою характеристик. У цьомувипадку процесрозпізнавання можнапредставлятикористувачеві як “>чорний ящик” (при цьомукористувачповністю немаєзмогикерувати, чиякимось чиноммодифікуватихідпроцесурозпізнавання). Упідсумкуце приводити дорозширення колапотенційнихкористувачів зарахуноквключення по людях, щонаділенімінімальноюкомп'ютерноюграмотністю.

Прирозпізнаваннісимволівдосить широковикористовуютьсяштучнінейроннімережі.Алгоритми, щовикористовуютьнейроннімережі длярозпізнаваннясимволів, частобудуються втакийспосіб.Зображення символу (растр), щоєвхідним длярозпізнавання, наводитися додеякого стандартногорозміру. як правило,використається растррозміром16х16пікселів.

>Значенняяскравості увузлахнормалізованого растравикористовуються, яквхідніпараметринейронноїмережі. Кількістьвихіднихпараметрівнейронноїмережідорівнює числурозпізнаванихсимволів. Результатомрозпізнаванняє символ,якомувідповідаєнайбільшезізначеньвихідного векторанейронноїмережі.Підвищеннянадійності такихалгоритмівпов'язано, як правило, чи ізпошуком болееінформативнихвхіднихознак, чи ізускладненнямструктуринейронноїмережі.

>Надійністьрозпізнавання і потребапрограми вобчислювальних ресурсах багато вчомузалежать відвиборуструктури іпараметрівнейронноїмережі.Зображення цифрприводяться доєдиногорозміру (>16х16пікселів).Отриманезображенняподається навхіднейронноїмережі, щомає тривнутрішніхрівні і 10вузлів уверхньомурівні.Нижні шаримережі неєповнопов‘язаними.Вузлинижчогорівняспільновикористовуютьзагальнийнабір ваг. Усіце, зазадумомрозроблювачів,повинне підвищитиздатністьнижчихрівнівмережі довиділенняпервиннихознак узображеннях.Отримана втакийспосібнейроннамережамає 1256вузлів і 9760незалежнихпараметрів. Для збільшенняздатностімережі доузагальнення ізменшенняобсягу необходимихобчислень йпам'яті проводитисявидаленнямаловикористовуваних ваг. Урезультаті числонезалежнихпараметрівзменшується вчотири рази.Навчаннянейронноїмережі проведено нанаборі із 7300символів,тестування нанаборі із 2000символів.Помилкирозпізнаваннястановлятьприблизно 1% нанавчальномунаборі і 5% наперевірочному.

яквхідніпараметринейронноїмережі,замістьзначеньяскравості увузлахнормалізованого растраможутьвикористовуватисязначення, щохарактеризують перепадяскравості.Таківхідніпараметридозволяютькращевиділятимежібукви.Об‘єктирозпізнаванняприводяться дорозміру16х16пікселів.Після цого смердотіпіддаютьсядодатковійобробці ізметоювиділенняділянок ізнайбільшими перепадами вяскравості.

Одним з широковикористовуванихметодівпідвищенняточностірозпізнаванняєодночасневикористаннядекількохрізнихрозпізнавальнихмодулів йнаступнеоб'єднанняотриманихрезультатів (>наприклад, шляхомголосування). При цьомудужеважливо,щобалгоритми,використовуваніцими модулями, були як можна понаднезалежні. Цеможедосягатися як зарахуноквикористаннярозпізнавальнихмодулів, щовикористовуютьпринциповорізніалгоритмирозпізнавання, то йспеціальнимпідборомнавчальнихданих.

Один із такихметодів бувзапропонованийкілька років тому йзаснований навикористаннітрьохрозпізнавальнихмодулів (машин).Перша машинанавчаєтьсязвичайним чином. Друга машинанавчається на символах, котрі буливідфільтрованіпершоюмашиною таким чином, що друга машинабачитьсумішсимволів, 50% із які булирозпізнаніпершоюмашиноювірно і 50%невірно.Нарешті,третя машинанавчається на символах, на якірезультатирозпізнавання1-ої і2-ий машинрізні. Притестуваннірозпізнаванісимволиподаються навхід усімтрьом машинам.Оцінки,одержувані навиході всіхтрьох машинскладаються. Символ, що здобувшинайбільшусумарнуоцінкувидається як результатрозпізнавання.

як правило, алгоритмрозпізнаваннязаснований навиділенні із растра ззображеннямбуквипервиннихознак йнаступномувикористанніштучноїнейронноїмережі дляоцінкиблизькостівхідногозображення з символами ззаданого набору літер. Результатом роботиєнабіроцінок, щовідбиваютьступіньблизькостірозпізнаваного символу з символами ззаданого наборусимволів.Набіррозпізнаванихсимволівможевключатибукви іцифри.Вхідніматеріали длярозпізнаваннязображеннясимволівперетворюються доєдиногорозміру.

>Відмінноюрисоюреалізованого алгоритмуєвикористаннянейронноїмережі іздосить великоюкількістювхіднихознак.Hавихідномузображеннівиділяютьсяпервинніознаки, щохарактеризуютьперепадияскравості увузлах растра.Нейроннамережамає одинвнутрішнійрівень, щомістить 100вузлів йєзагальнопов‘язаною,тобтокоженвузолвнутрішньогорівняз'єднаний ізусімавхіднимивузлами, акоженвузолверхньогорівняз'єднаний ізусімавузламивнутрішньогорівня. Длязменшенняобсягуобчислень прирозпізнаванні для шкірногорозпізнаваногозображення символувикористовуються не усівхідніознаки, а лишечастина,іншими словами векторвхіднихпараметрівнейронноїмережіє сильнорозрідженим.

>Навчаннянейронноїмережівідбуваєтьсязвичайним чином,тобтовикористовується алгоритмзворотньогопоширенняпомилки. Програмунавчанняодержує навхід файл ззображеннямисимволів. Принавчаннісимволи зцієїбазиперебираютьсяциклічно. Для шкірногозображення ізбазивиділяютьсяпервинніознаки, после чоговиконуютьсяпрямий йзворотний коли б помережі.Модифікація вагмережі принавчаннівиконується после шкірного символу. Крокзміни вагмережі постійна.

Дляприскорення іполіпшеннянавчання злерозпізнаванісимволипроглядаютьсячастіше заінші. Для цоговикористовується кеші, уякомузберігаютьсяважкорозпізнаванізображення.Растри длянавчаннявибираються як звхідного файлу, то й ізкешу.Вибір символу ізкешувідбувається ізурахуваннямякості йогорозпізнавання,тобто злерозпізнаванісимволивибираютьсячастіше.

>Крім того, принавчаннімережівикористовуєтьсярегулярізація вагмережі,тобто вводитисяїхнєекспонентнезгасання.

>Якістьрозпізнаваннязалежить не лише відалгоритмів, щовикористовуютьсяпрограмамирозпізнавання інавчаннянейронноїмережі, але й і від того,яким чиномнавчаласянейроннамережа. Наякістьнавчаннянейронноїмережівпливаютьнаступніфактори:параметрибази ізнавчальнимирастрамиб,розмір,спосібвідборурастрів, порядокрастрів убазі,наявність грязнихсимволів йпомилок урозмітці.

Нарізнихетапахнавчанняможливевикористаннярізнихоптимізуючихфакторів:

1. Крокзміникоефіцієнтівмережі.

2.Використаннярегуляризаціїмережі.

3. Історіянавчаннямережі.

4.Використаннядодаткового галасу іперекручуваньсимволів.

5. Моментзупинкинавчання.Бажаноуникати якнедостатньогонавчаннямережі, то йперенавчання.

6.Розміркешупоганихрастрів йвідносна частотавиборурастрів ізнавчальноїбазиданих й ізкешупоганихсимволів.

>Параметринавчаннявзаємозалежні іповиннівибиратисяузгоджено. Так,наприклад, приневеликомурозмірінавчальноїбазивикористанняперекручуваньсимволівможеприводити дополіпшенняякостінавчання, а призбільшеннірозмірубази приводити до йогопогіршення.Використаннякешупоганихсимволів на самому початкунавчання немаєособливогосенсу.Навпаки, последекількохпроходів побазі ізнавчальними символамибільшачастинасимволів ізбазирозпізнається іздуже великоюнадійністю.Зміна вагмережівідбуваєтьсяголовним чином зарахунокрастрів, щовтримуються вкешіпоганихсимволів.

>Регуляризація (>тобтовведенняекспонентногозгасання ваг принавчанні) приводити додеякогопогіршенняякостірозпізнавання. Однаквикористаннядуженевеликогокоефіцієнтазгасаннядозволяє підвищитистійкістьмережі безпомітнихвтрат длярозпізнавання.

Длявизначеннянайкращого моментузупинкимережі можнаперіодичнотестуватиякістьрозпізнавання наневеликійнезалежнійбазіданих.

>Порівнянняякостірізнихалгоритміврозпізнаваннясимволівускладнене тім, щовідноснезначення числа правильнорозпізнанихсимволівістотнозалежить відконкретноїбазиданих, наякій проводитисятестування. Наякістьрозпізнаваннятакожвпливають:обсяг наборурозпізнаванихсимволів,технологіянавчаннянейронноїмережі, методика іалгоритмивиділенняпервиннихознак,технологіяпідготовкинавчальноїбазиданих ііншіфактори.

Алгоритмможе бутивдосконалений шляхомпошуку более адекватногоподанняструктурнихознакрозпізнаванихсимволів.Використаннябільшоїнавчальноїбазиданих й збільшенняпам'ятінейронноїмережітакожможедатидеякеполіпшенняякостірозпізнавання.Проектована системамаєпрацювати урежимі,близькому до реального години, аотжерозроблюваний алгоритммає бутидоситьшвидким й, у тій годину, матірдостатнюточністьрозпізнання.

Дляреалізаціїпоставленої метидоцільно якщоспочаткувиділити нафотознімкуномерний знак, апотім,використовуючиадаптовані дореальних умівіснуючіалгоритмирозпізнаваннясимволів,розпізнативласнедержавний номер.

Зцієюметоювхіднезображення проходитиетаппервинноїобробкинаступним чином:

-пікселам,колір яківідповідаєкольорутла номерного знаку (>білий,жовтий,блакитний),привласнюєтьсябілийколір — [>fde_1328385688_8288356381_1328385688_1838583862_177]FFFFFF уформатіRGB;

-пікселам,колір які невідповідаєкольорутла номерного знаку,привласнюєтьсячорнийколір — [>fde_1328385688_8288356381_1328385688_3882583186_5809]000000 уформатіRGB;

>Цейетапможливопроводити якокрему процедурупопередньоїобробки, то й вякостіскладової под годину более детальногоаналізузображення.

>Зображенняаналізуєтьсяпочинаючи ізверхньоголівогокута йзакінчується правимонижнім. Метааналізу –визначитимісця переходуміжбілою тачорноюобластюзображення, на їхніосновівизначитипрямілінії, але вперетиніпрямихлінійвизначити гуляйотриманої рамки номерного знаку.Дослідним шляхомвизначається такакількістьпослідовнихточок переходу, щоможетрактуватися як прямалінія.Слідзазначити, щоперебирати всезображенняпопіксельнонедоцільно.Післязнаходження Першого перепадукольору прямалініявизначаєтьсярізницеюміжкольорамисусідніхпікселів. Для цоговикористаємофункцію:

де А –амплітуда,відстань поосі ординатаналізованогопіксела відпрогнозованоїграниці (>підбираєтьсяекспериментально); У –коефіцієнтрозтягнення поосіабсцис (>оптимальнезначенняВ=4 –забезпечуєпрямолінійнедіагональнесканування); З –забезпечуєпочатковіумови длясканування (ізякогопікселаобчислюєтьсяперехідкольору).

>Коефіцієнти А, У, Здоцільнообиратисередмножининатуральних чисел. Таким чиномкількістьаналізованихпікселівможливоскоротити удвічі рази.

>Сучасніметодирішенняпоставленого заподіяння наддостатніймеріпроблемифіксації ірозпізнаваннятекстовихзображень йприйняттявідповіднихрішень.


Схожі реферати:

Навігація