Реферат Створення синтезатора мови

>ЗМІСТ

>ВСТУП

1.МЕТОДИСИНТЕЗУМОВИ

1.1Повний синтезмови за правилами

1.2 Синтез фонемами

2.АНАЛІЗЗАВДАННЯ

2.1Якість звуку

2.2Підбір фонем

3.СИНТЕЗУВАННЯМОВИ

3.1Обробка тексту

3.2Генераціяпроміжківміж фонемами

3.3Згладжування звуку

3.4Обробкавихідного звуку

3.5Аналізрезультатівсинтезування

4.ІНСТРУКЦІЯКОРИСТУВАЧА

4.1Опис головноговікнапрограми

4.2Відтвореннямови

4.3Модифікаціямови

4.4Збереженнямови

>СИСТЕМНІВИМОГИ

>ВИСНОВОК

СПИСОКЛІТЕРАТУРИ


>ВСТУП

Утеперішній одну годину набагатьох сферахзастосовуютьсясинтезаторимови,зокрема іросійськоїтеж.Найчастішетакісинтезаториобмежуються наборомпевнихслів, відразу ж чипропозиції. Аліінодіпотрібносинтезуватимову подовільному,заздалегідь невідомому тексту.Останніхналічується негаразд уже і багато й голоси,якими смердотіговорятьдуже сильнообмежені зарізноманітністю.Створення такого синтезаторадоситьскладне заподіяння,притомускладність особливо незалежить відмови, наякому винна говоритипрограма.Найпростішим зспособівсинтезімови подовільному текстом -є синтез із фонем. Уходівиконання роботи якщовикористанийсамецей метод. На шкодавін недаєвисокоїякостімови, але йменшвитративши за годиноюреалізації, ніжінші. Так самевінвидаємову, Яказадовольняєвимогамчіткості.


1.МЕТОДИСИНТЕЗУМОВИ

1.1Повний синтезмови за правилами

>Повний синтезмови за правилами (чи синтез подрукарському тексту)забезпечуєуправління всіма параметрамимовного сигналу й, таким чином,можегенеруватимову позаздалегідьневідомому тексту. У цьомувипадкупараметри,отримані прианалізімовного сигналу,зберігаються впам'яті то й правилаз'єднаннязвуків в слова йфрази. Синтезреалізується шляхоммоделюваннямовного тракту,застосуванняаналогової чицифровоїтехніки.Причому впроцесісинтезуваннязначенняпараметрів й правилаз'єднання фонемвводятьпослідовно черезпевнийчасовийінтервал,наприклад 5-10 мс. Метод синтезумови подрукарському тексту (синтез по правилах)базується назапрограмованомузнанніакустичних йлінгвістичнихобмежень й невикористовуєбезпосередньоелементівлюдськоїмови. У системах,заснованих на цьомуспособі синтезу,виділяється двапідходи. першийпідхід напрямів напобудовумоделімовотворчоїсистемилюдини,вінвідомий подназвоюартикуляторного синтезу. Іншийпідхід —формантний синтез за правилами.Розбірливість йнатуральність такихсинтезаторівможе бути доведено до величин,порівнянних із характеристикамиприродноїмови.

1.2 Синтез фонемами

Синтезмови по правилах ізвикористаннямпопередніхвідрізаньприродноїмови, щозапам'ятали, —церізновид синтезумови по правилах, Яканабулапоширення у зв'язку ізпоявоюможливостейманіпулюваннямовним сигналом воцифрованійформі.Залежно відрозмірупочатковихелементів синтезувиділяютьсянаступнівиди синтезу:

·мікросегментний (>мікрохвильовий);

·аллофонічний;

·дифонний;

·напівскладовий;

·складовий;

синтез ізодиницьдовільногорозміру.

>Зазвичай яктакіелементивикористовуютьсянапівсклади —сегменти, щомістять половинузгідного й половину щопримикає доньогоголосного. При цьому можнасинтезуватимову позаздалегідь незаданому тексту, але йважкоуправлятиінтонаційними характеристиками.Якість такого синтезу невідповідаєякостіприродноїмови,оскільки награницяхзшиваннядифонів частовиникаютьспотворення.Компіляціямови ззаздалегідьзаписаних словоформтакож невирішуєпроблемивисокоякісного синтезудовільнихповідомлень,оскількиакустичні йпросодичні (>тривалість йінтонація) характеристикислівзмінюютьсязалежно від типуфрази ймісця слова уфразі. Цеположення неміняєтьсянавіть привикористанні великихоб'ємівпам'яті длязберігання словоформ.


2.АНАЛІЗЗАВДАННЯ

2.1Якість звуку

Так яквикористовуваний метод недаєвисокоїякостімови, то ісенсувикористовувативисокоякісний звуксенсу немає. Тому длязапису фонем якщовикористанонижчеякість звуку.Амплітуда -8біт, а частота8кГц. Цеякість звуку длятелефонноїрозмови.

2.2Підбір фонем

Дляросійськоїмовивиділяютьнаступніфонеми а е і у и п п' б б' м м' ф ф' в в' т т' буд буд' зв зв' з з' із із' р р' л л'ш жщ ц год і до до' р р' x x'. Алівиділеніфонемиєдеякоюабстракцією й надданомувидізастосуються для синтезумови.

Уходіекспериментів було бвстановлено, щозвучаннявідрізківслів, де послеголосноїстоїтьприголосна,доситьзадовільно. Однак призворотному порядку усіінакше - однаприголоснаможезвучати якінша, аможе бутивзагалі нечутно. Удеякихвипадкахдопомагає методз'єднаннязвуків, деміжстикамивставляєтьсязгенерований звук, щовраховуєзакінченняпопереднього й початкунаступного. Про цьомуметоді якщодокладнорозказано впункті 3.2. Дляіншихсполученьтакийпідхід позбавити їїбажаного результату й було бухваленорішеннязаписати усіможливіпоєднання. Урезультаті миотрималифонемизазначені втаблиці 1.Фонемизакінчуються на знак "!"Знаходяться вкінціслів йє болеедзвінкими, ніж їхнізвичайні аналоги (беззакінчень). Знак "_" вкінціназвифонемиозначає, що вонм'якша, ніж аналог беззакінчення ййдепереважно передголосними.


>Таблиця 1 –Фонеми

А - - - - - - - - - - -
Є - - - - - - - - - - -
Ё - - - - - - - - - - -
І - - - - - - - - - - -
Про - - - - - - - - - - -
У - - - - - - - - - - -
И - - - - - - - - - - -
Еге - - - - - - - - - - -
Ю - - - - - - - - - - -
Я - - - - - - - - - - -
Б - ба >бе >бе бі >бо >бу б >бе >бю >бя
У - >ва >ве >ве ві у ву ви че вю >вя
Р Р! - - - - - - - - - -
Д Д! - - - - - - - - - -
Ж - - - - - - - - - - -
З З_ - - - - - - - - - -
- - - - - - - - - - -
До До_ - - - - - - - - - -
Л Л_ >ла ле >ле чи >ло >лу >ли ле >лю ля
М - мало >ме >ме ми >мо му ми >ме >мю мя
М - - - - - - - - - - -
П П_ - - - - - - - - - -
Р Р_ - - - - - - - - - -
З З_ - - - - - су - - - -
Т Т_ - - - - - - - - - -
Ф Ф_ фа феє >фе фі >фо виженіть >фи фе >фю >Фя
Х Х_ - - - - - - - - - -
Ц - - - - - - - - - - -
Ч - - - - - - - - - - -
Ш - - - - - - - - - - -

3.СИНТЕЗУВАННЯМОВИ

3.1Обробка тексту

>Перш ніжприступити досинтезуваннямови,необхідновизначити котріфонеми, де й вякому порядкуповиннівідтворюється. Для цогоспочатку текстрозбивається на свої слова, а словапотім нафонеми. Колі ми маємо список фонем,між фонемамиприголосна-голоснавставляєтьсязгенерованихпослідовність. Методгенерації описів впункті 3.2.Потім все словозгладжується, дляпридушенняклацань, котрівиникають прирізких перепадахзначення сигналу. Методзгладжування описів впункті 3.3.Повна схема алгоритму наведена удодатку А.

3.2Генераціяпроміжківміж фонемами

Длягенераціїпослідовностіберетьсяостаннячастиналівоїфонемидовгорівнийперіодуповторення схожихділянок узвуці. Однак саме вушкоправою за тім ж принципом.Потімгенеруютьсяп'ятьділянок, котрі плавноперетікають ізлівоїфонеми в праву.Тобтопершийділянкадуже схожий наліву фонему,третій щосьсереднєміжлівою йправою, ап'ятийдуже схожий на праву.Фактичнофонемичастковонакладаються одного одного. Намалюнках 3.1, 3.2, 3.3відображуєграфічнепредставленняцихзвуків. як видно ізмалюнка 3.3,згенерованихчастина сильновиділяєтьсярізкими переходами, щопризводить доклацанням под годинувідтворення звуку.


Малюнок 3.1 –Фонема “Р_”

Малюнок 3.2 –Початокфонеми “А”

Малюнок 3.3 –Згенерованийпроміжокміж фонемами “Р_” й “А”


3.3Згладжування звуку

>Післязлиття фонем тазгенерованихділянок,можеутворитисямісцярізкого перепаду сигналу, що Веде за собоюклацання, накожному такомуперепаді. Коли всередньомускладає попівтораклацання накожну букву вслові. Цепризводить допостійногоклацання, дляусуненняякого буввикористанийусереднюютьсяфільтр затрьома точками.

Малюнок 3.4 -Згенерованийпроміжокміж фонемами "Р_" й "А" ззастосуваннямусереднюєфільтра.

3.4Обробкавихідного звуку

Передвідтворенням звукще два разизазнаєобробці. Припершій йогогучністькоригуєтьсязалежно від установоккористувача. Для чогозначення сигналу множитися накоефіцієнтгучності,якийваріюється від нуля й до 1.5. Намалюнках 3.5 - 3.8зображена фонема "Р" прирізнихрівняхгучності.


Малюнок 3.5 –Фонема "Р" пригучності 100%

як видно ізмалюнка 3.8, пригучності 250% фонема "Р"значноспотворюється йперетворюється на шум. Длярізних фонем максимальнагучністьрізна, тому було бприйняторішенняобмежитикористувачамаксимальнимрівнем 150%.Данихрівеньпідходить для всіхвикористовуваних фонем.

Малюнок 3.6 –Фонема “Р” пригучності 40%

Малюнок 3.7 –Фонема “Р” пригучності 150%

>Потімвідрегульований погучності звук наводитися донеобхідноїшвидкості. Для цоговінрозтягується на завданькористувачемкоефіцієнт.Фактично для звукузмінюється частотадискретизації за годиною.Коефіцієнтваріюється від 0.5 до 5. Алі припідвищеннішвидкості запозначку 2.0, моваперестає бутирозбірливим. Намалюнку 3.5зображена фонема "Р" пришвидкості 100%. Намалюнках 3.9 - 3.11 наведена вона ж, але й нарізнихшвидкостях. Зазовнішнімвиглядом смердотіздаютьсяоднаковими, але й ізтимчасовоїшкалоюпомітновідмінність. Намалюнку 3.11такожпомітно щографікстаєгрубим черездужемалоїчастотидискретизації.

Малюнок 3.8 –Фонема “Р” пригучності 250%

Малюнок 3.9 –Фонема “Р” пришвидкості 50%


Малюнок 3.10 –Фонема “Р” пришвидкості 200%

Малюнок 3.11 –Фонема “Р” пришвидкості 500%

3.5Аналізрезультатівсинтезування

Дляаналізуякостісинтезуваннязвуків,найкращим методом якщопорівняннясинтезованоїмови ізоригінальною. Для цоговізьмемо паруслів,запишемо їхнього йсинтезуємо.Потімпорівняємографіки. Уякостітестовихсліввізьмемо "Мурка" й ">кактуси".Їхнізображеннянаведені намалюнках 3.12 - 3.15.


Малюнок 3.12 – Слово "мурко" (>оригінал)

Малюнок 3.13 – Слово "мурко" (>синтезоване)

як видно ізмалюнків 3.12 й 3.13,графікидоситьсхожі, завинятком цього уоригіналі, пере звуком "до",знаходиться пауза.Тривалістьпаузиприблизно 50 мкс.З'єднання "до" й "а" практичноідентичні,лише завинятком того, що звук "а" воригіналі голосніше. Звуки "мало" всинтезованомусловіємонолітними,тобтозаписанимивідразу разом.

>Щодо слова ">кактуси" (Малий. 3.14 й 3.15)простежуються тих жтенденції.Помічені 50мілісекундногопроміжки перед й после звуку "т". Отжеміжвибуховими звуками можнаспробувативставлятипази, щоможливопризведе дополіпшеннязвучання.


Малюнок 3.14 – Слово "кактуси" (>синтезоване)

Малюнок 3.15 – Слово "кактуси" (>оригінал)


4.ІНСТРУКЦІЯКОРИСТУВАЧА

4.1Опис головноговікнапрограми

>Інтерфейскористувачаявляє собоювікнопрограмизображене намалюнку 4.1. Уся роботаведетьсясаме вньому. Уверхнійчастинівікназнаходитьсяголовне меню (1), а под ним панельінструментів (2), Якаповністюдублює меню.Щенижчезнаходиться панельмодифікаторів (3).Частину, щозалишиласявікназаймаєтекстове полі, длявведення тексту,який якщопроговорюватися (4).

Малюнок 4.1 –Головневікнопрограми

4.2Відтвореннямови

Длявідтвореннямови,потрібно втекстове полі запровадити текст, чивідкрити файл,вибравши в менюФайл->Відкрити. Увікнівказати потрібен файл. Напоточний моментпідтримуютьсяформати.Txt й.Rtf. Длявідтворення звукунеобхідновибрати пункт менюПрогравач->Говорити. Дляприпинення,необхіднонатиснути до того жпунктівибрати пункт Пауза, азупинки Зачекайте.Усіціпунктипродубльовані впанеліінструментів.Якщонеобхідновідтворити не весь текст, а йогочастина, то можнавиділитичастину текстузапуститипрогравання, яквказано намалюнку 4.2.

Малюнок 4.2 –Відтвореннявиділеного тексту

4.3Модифікаціямови

Напанелімодифікаторівзнаходятьсяповзункишвидкості йгучності. При їхньогопересуваннязмінюютьсявідповідніпараметримови.Всізмінизастосовуютьсядинамічно,тобто ненепотрібноперезапускативідтворення.

4.4Збереженнямови

Длязбереженнямови в файл,необхідновибрати пункт менюФайл->Зберегти. Увікні,вказатимісцезбереження йзберегти. Зараздоступний лише формат.Wav. Звукзберігається ізурахуваннямположенняповзунків.

>СИСТЕМНІВИМОГИ

>Операційна система WindowsXP/Vista/7.

>НеобхіднаверсіяFramework 3.5/4.0

>Пристрійвиведення звуку.

Для установкипрограминеобхідно1Мбвільногомісця нажорсткому диску.


>ВИСНОВОК

>Створення синтезаторамовиєдоситьтрудомісткоюроботою. Астворення синтезаторарозбірливиммови,ще болеескладнимзавданням.Створити ж синтезатор, голосякого можна було б бвідрізнити відсправжнього,вимагаєвеликоїкількостідосліджень. Так саме йогодоцільностворювати іздопомогою синтезу за правилами, а чи неготовими фонемами. Уданій жкурсовоїроботі бувздійсненаспробастворення синтезатора,якийхоча бізадовольняввимогамчіткість. Длястворенняповноцінного синтезаторанеобхіднавеличезна базаслів,хоча б у тому, що б у словахвідтворюватинаголосу, атакожврахуванняособливостейвимовидеякихслів. Алідеякіособливостімови непіддаютьсяалгоритмізації аніякимишляхами.Приміромнаголосудеякихслівзалежить від контексту їхнівикористання. Одним із такихслівє замок.

>Створений уційкурсовоїроботі синтезатор,єдуженаближеноюмоделлю того,яким винен бутисправжній синтезатормови. Алі для розробки дійсностоїть синтезаторапотрібнозначнийпроміжок години й великакількістьдосліджень.


СПИСОКЛІТЕРАТУРИ

1. Синтезмови -ru.wikipedia.org/wiki/

2.ВинцюкТ.К. - Аналіз, розпізнавання і інтерпретація мовних сигналів, 1987, Київ -Наукова Думка

3.ФланаганДж.Л. - Аналіз, синтез і ставлення до промови, 1968, Зв'язок – Москва

4. Сорокін - Синтез промови, 1992, Зв'язок – Москва

5.Кучеров, Лобанов ->Синтезированная промову наСМО, 1983, Київ -Наукова Думка.


Схожі реферати:

Навігація