Реферати українською » Информатика, программирование » Градієнтний метод першого порядку


Реферат Градієнтний метод першого порядку

М починає рухатися вздовж кордону області.

Ефективність методу крутого сходження залежить від вибору масштабу змінних і виду поверхні відгуку. Поверхня зі сферичними контурами забезпечує швидке стягування до оптимуму.

До вад методу крутого сходження слід віднести:

1. Обмеженість екстраполяції. Рухаючись вздовж градієнта, ми опираємося на екстраполяції приватних похідних цільової функції відповідним змінним. Проте поверхні відгуку може змінюватися і потрібно швидко змінювати напрямок пошуку. Інакше кажучи, рух на площині може бути тривалим.

2. Складність пошуку глобального оптимуму. Метод застосуємо для відшукання лише локальних оптимумів.

Алгоритмградиентного методу

Уявімо послідовність розрахунку: розрахунок складових градієнта.

Практично розрахунок складових градієнта реалізується обчисленням творів коефіцієнтів регресії на відповідні інтервали варіювання значимих чинників.

Тоді рівняння

>пкфвн(Ч) = і1р1 + і2р2 + … + ітрт

набуде вигляду

>grad (X)= b1 + b2 + … + bn

тобто. як кроків крутого сходження вибираються інтервали варіювання чинників.

Вибір базового чинника:

Чинник, котрій твір коефіцієнта регресії на інтервал варіювання максимально, приймається базовим:

>max (bі) = a

Вибір кроку крутого сходження:

Для базового (чи іншого) чинника вибирають крок крутого сходження ha. Зазвичай його вибирають за порадою технологів чи з наявної апріорній інформації.

Перерахунок складових градієнта:

Тут використовується умова: множення складових градієнта будь-яку позитивне число дає точки, також що лежать наградиенте.

Складові градієнта перераховують по обраному кроку крутого сходження базового чинника:

hі=  (*)

Коефіцієнти bі у натуральному вираженні (*) беруться відносини із своїми знаками, кроки hі округляють.

Прийняття рішень після крутого сходження:

Потому, як експериментальна перевірка визначила деяку оптимальну точку, круте сходження вважається завершеним. Тут, як й раніше, необхідно ухвалити рішення, які залежать, передусім, від ефективності крутого сходження. Вплинув на результати прийняття рішень надає інформація про адекватність чи неадекватності лінійної моделі про становище області оптимуму. Звісно, інформацію про становищі області оптимуму мають досить невизначений характері і залежить від конкретного завдання, де змінна стану – наприклад, міцність матеріалу на розрив. Однак точно можна безпомилково оцінити становище оптимуму, якщо змінна стану - вихід цільового продукту відсотках.

 

Математичне опис системи та значення змінних

У нашому випадку маємо:

При побудові математичну модель певного в умови технологічного процесу одночасно вирішується завдання оптимізації поверхні відгуку , тобто визначаються значення чинників, у яких , що означає, що . Відомо, що з найефективніших методіврешеня завдання єградиентний метод. Відповідно до нього у разі (з умов завдання) з кожної точки собі напрямок руху ввозяться бік, протилежну самому градієнту. Звідси кожній точці необхідно провести розрахунок градієнта наступного виду:

, де і іk – поодинокі орти

Зазвичай, визначити всю математичну модель процесу дуже складно, тому тут потрібно скористатися наступній процедурою:

1. У околиці початковій точки

 

виробляється повний факторний експеримент чи дробовий факторний експеримент. Ми використовуватимемо повний факторний експеримент.

Слід охарактеризувати загальних положень проведення повного факторного експерименту:

Застосування повного факторного експерименту дозволяє знайти оптимальне розташування точок вфакторном просторі і зробити лінійне перетворення координат, завдяки чому забезпечується можливість подолати недоліки класичного регресійного аналізу, зокрема кореляцію між коефіцієнтами рівняння регресії.

Деякі позначення задля її подальшого розуміння викладу матеріалу:

>Xj-фактори;

>Рj- регресивні коефіцієнти системи;

Y- вихідна змінна (функція відгуку);

М [>f]- математичне очікування перешкоди;

D [>f] – дисперсія перешкоди;

l – число рівнів ;

>k – кількість чинників;

Рівень чинників – кордон дослідження області з даному параметру;

Крапка з координатами (Х0(1), Х0(2), …) - центр плану, чи основний рівень;

- одиниця варіювання, чи інтервал варіювання;

P.S – дисперсія;

вектор У - вектор коефіцієнтів регресії;

N - число дослідів у матриці планування;

Р - коефіцієнт взаємодії;

bj - незмішані оцінки;

 - генеральні коефіцієнти;

>S2>воспр - дисперсія відтворюваності;

>tj - критерійСтьюдента;

F – критерій Фішера.

Вибір плану дослідження експерименту визначається формулюванням завдання дослідження та особливостями об'єкта. Нехай маємо математичну модель системи:

Також ми знаємо характер перешкоди і статистичні параметри:М[f] = 0 іD[f] = 0,8. Слід зазначити, під перешкодами розуміють низка чинників, які деформують результати досвіду. Якщо існують певні апріорні відомостей про джерелі перешкод, можна побудувати оптимальні плани дослідження, враховують їхнього впливу, й тимчасово підвищити в такий спосіб точність аналізу результату.

У цьому завданню потрібно провести повний факторний експеримент.

Повний факторний експеримент, чи метод планування експерименту дозволяє мінімізувати число необхідних дослідів і водночас отримати оптимальні значення шуканих функцій. При плануванні експерименту, умови досвіду є фіксований число значень кожному за чинника. Повний факторний експеримент фактично є застосування класичних методу найменших квадратів і регресійного аналізу, які за визначеному плану.

Процес дослідження зазвичай розбивається деякі етапи. Інформація, отримана після кожного етапу, визначає подальшу стратегію експерименту. Так виникає можливість оптимального управління експериментом. Планування експерименту дозволяє одночасно варіювати все чинники та отримувати кількісних оцінок основних ефектів і ефектів взаємодії.

Композитори, які дослідника ефекти визначаються зі значно меншою помилкою, ніж те, яке характерне й інших методів дослідження.

У кінцевому підсумку, застосування методів планування експерименту значно підвищує ефективність експерименту.

Бо за плануванні за схемою повного факторного експерименту реалізуються всіх можливих комбінації чинників усім вибраних на дослідження рівнях, ота необхідна число дослідів N за повноїфакторном експерименті визначається за такою формулою:N=l>k.

Якщо експериментів здійснюються двома рівнях при двох значеннях факторів, і причому у процесі експерименту рухаються всі можливі комбінації зk чинників, такий план називається повний факторний експеримент типу 2>k.

Опис алгоритму моделювання зводиться ось до чого:

1. Визначається нічого для будь-якого чинника:

Х0 j = (Х j >max + Х j >min ) / 2,

 = (Х>jmax - Х>jmin) / 2, j =1,2,…..k ;

 

2. Від основний системи координат (Х1, Х2 , …Хn ) переходимо до безрозмірною системі координат (U1, U2 , …Un ) з допомогою формули переходу:

Uj = (Х j - Х j0 ) / , j =1,2,…..k;

У безрозмірною системі координат верхній рівень дорівнює +1, а нижній дорівнює –1, координати центру плану рівні нулю і збігаються з початком координат.

3. План експерименту:

У матрицю планування (>Табл. 1.1) записуються всіх можливих значення граничних величин в натуральному масштабі.

Таблиця 1.1

Номер досвіду Значення чинників в натуральному масштабі вихід

X1

X2

Xn

Y
1

X11

X 12

X 1 n

Y1

2

X 21

X2 2

X 2 n

Y2

…. ...
N

X >N1

X >N2

X>Nn

YN

4.Введем фіктивний стовпець U0 в матрицю і запишемо матрицю в безрозмірною формі (>Табл.1.2):

Таблиця 1.2

Номер досвіду фіктивний стовпець Значення чинників в безрозмірною системі координат Вихід

U0

U1

U2

Un

У
1 +1 +1 +1 +1

У1

2 +1 -1 +1 +1

У2

... ….
N +1 -1 -1 -1

УN

5. Наведемо повну матрицю планування (>Табл. 1.3.):

Таблиця 1.3

Номер

досвіду

Значення чинників Вихід
У натуральному масштабі У безрозмірною системі координат

X1

X2

Xn

U 0

U1

U2

Un

Y
1

X11

X12

X>1n

+1 +1 +1 +1

Y1

2

X21

X22

X2n

+1 -1 +1 +1

Y2

N

X>N1

X >N2

X>Nn

+1 -1 -1 -1

YN

Запропонований план експерименту має такими властивостями:

Властивість симетричності.


;

Властивістьнормировки.

;

Властивістьортогональности.

, ( lj ,l,i =1…k );

Слід зазначити, щоортогональние плани повний факторний експеримент ( для лінійних моделей ) мають такожрототабельностью. Останнє передбачає рівність і мінімальність дисперсій передбачених значень вихідний перемінної всім точок факторного простору. За законом накопичення помилок для дисперсії передбачених рівнянням регресії значень вихідний перемінної можна записати:

>s2y=s2b0 +s2b1U12 + … +s2>bnUn2

 

>Дисперсии коефіцієнтів регресії рівні собою, тому

>s2y =s2>bi

 

З огляду на те, що

,

Де - радіус сфери маємо

>s2y =s2 >bi.

Отже, що дисперсія пророкованого значення вихідний перемінної залежить від радіуса сфери. Це властивістьрототабельности еквівалентно незалежності дисперсії вихідний перемінної від обертання координат у центрі плану і виправдана у пошуку оптимумуградиентними методами. Інтуїтивно зрозуміло, що досліднику зручно поводитися з такою інформацією, котра міститься в рівнянні регресії, яка рівномірно «розмазана» по сфері радіусом . Справді таке становище можна вважати розумним, оскільки з допомогою рівняння регресії з'являться спроби передбачити становище ще невідомих ділянок факторного простору.Равноценность їх себто помилки передбачення, очевидно, є необхідною.

Властивістьортогональности істотно полегшує процес обчислення коефіцієнтів, оскільки кореляційна матриця (UТU)-1 стає діагональної, і коефіцієнти дорівнюватимуть1/N;

6. З урахуванням властивостіортогональности можна визначити вектор У коефіцієнтів регресії:

Отже, будь-який коефіцієнт рівняння регресіїbj визначається скалярним твором шпальти Y на відповідний стовпецьUj, діленим на число дослідів N в матриці планування:


>Вичислим коефіцієнти регресії лінійного рівняння :

Якщо розгляд запровадити повніше рівняння регресії з коефіцієнтами взаємодії Р, то використовуючи процедуру методу найменших квадратів , одержимо:

.

Користуючись планом, поданих у табл. 1.2, можна перерахувати коефіцієнти регресії та не записати втабл.1.4:

Y = Р0 + Р1U1 + Р2U2 + … + РnUn + … +

+…+ >P13U1U3 +P23U2U3 + … +P123U1U2U3

Таблиця 1.4

Номер досвіду

U0

U1

U2

Un

У
1 +1 +1 +1 +1

-1 +1 +1

У1

2 +1 -1 +1 +1

-1 -1 +1

У2

N +1 -1 -1 -1

-1 +1 +1

УN

>P12,P23 - ефекти подвійного взаємодії, аP123 - ефекти потрійного взаємодії. Ефекти взаємодії визначають аналогічно лінійним ефектів:

.

 

7. Перевірка однорідності дисперсії та значущості коефіцієнтів регресії.

Якщо додатково поставити паралельні досліди, можна визначитиs2>воспр -дисперсию відтворюваності, перевірити значимість коефіцієнтів регресії, а за наявності ступенів свободи – адекватність рівняння.

У зв'язку з тим, що кореляційна матриця (>U*U)-1 для спланованого експерименту є матриця діагональна

,

коефіцієнти рівняння регресіїнекоррелировани між собою. Значимість коефіцієнтів рівняння регресії можна перевіряти кожному за коефіцієнта окремо, користуючись критеріємСтьюдента : . Виняток із рівняння регресіїнезначимого коефіцієнта не позначиться значеннях інших коефіцієнтів. У цьому вибіркові коефіцієнти bj виявляються так званиминесмешанними оцінками для відповідних генеральних коефіцієнтівj:

bjj, т. е. величини коефіцієнтів рівняння регресії характеризують внесок кожного чинника в величину y.

>Диагональние елементи кореляційної матриці рівні між собою, тому всі коефіцієнти рівнянь

Y = і Y = Р0 + Р1U1 + Р2U2 + … + РnUn + … +

+ … +  

>oпределяются з однаковим точністю:

>s >bj=s2>воспр

 

8. Перевірка адекватності рівняння

Перевірка адекватності рівняння проходить за критерію Фішера:

>Рассчитивается значення

F=s2ост/s2>воспр ;s2ост ,

деm - число значимих коефіцієнтів в рівнянні регресії.

2. Після завершення повного факторного експерименту визначено коефіцієнти регресії

Тоді приватні похідні будуть пропорційні .

3. Роблячи, з урахуванням останнього висловлювання, крок у бік, протилежну середньому, визначаємо новий кут і знову проводимо експеримент.

4. Повторюємо перші три кроку, доки наблизимося до точкиекстремума. Аби наблизитися до точкиекстремума алгоритм починає працювати погано при близькості нанівець приватних похідних, тобто лінійна модель стає неадекватною і вимагає введенняквадратичних членів.

За умовою дано:


, T = 20,U(t) = 15 –0.1t, .

>Уравнение виходу системи:

 

, , .

Значення параметрів системи:

 

, .

Характер перешкоди і його статистичні параметри:

Нормальне розподіл

.

Тут - вектор стану системи; - вектор спостереження; - вектор перешкоди; А, У, З – матриці коефіцієнтів (параметрів) системи; [0, T] – інтервал визначення системи.

Необхідно

- скласти відповідно до математичним очікуванням системи її імітаційну модель на формування реалізації вектора і стан системи на інтервалі визначення;

- скласти алгоритм і програму виконання завдання побудови динамічної моделі у відповідність до заданим типом моделі методом ідентифікації і точністю виконання завдання;

- налагодити програму;

- провести розрахунки і аналіз отриманих результатів.

 

Побудова математичну модель

З огляду на характер перешкоди можна скласти таку імітаційну модель системи на формування реалізації вектора і стан системи на інтервалі визначення:

 

,

, ; .

Тут - вектор стану системи; - вектор стану моделі; - матриці коефіцієнтів моделі.

, T = 20,U(t) = 15 –0.1t, .

Тут [0, T] – інтервал визначення системи.

>Уравнение виходу системи:

, , .

Тут - вектор спостереження; - вектор перешкоди; З – матриця коефіцієнтів (параметрів) системи.

Значення параметрів системи:


, .

Тут А, У – матриці коефіцієнтів (параметрів) системи.

Характер перешкоди і його статистичні параметри:

Перешкода має нормальне розподіл з математичним очікуванням, рівним .

Алгоритм реалізації виконання завдання побудови динамічної моделі

Ідея побудови необхідної динамічної системи ось у чому: для заданого значення параметраt з його інтервалу визначенняградиентним методом першого порядку знаходимо відповідне значення параметра x, який змінюється динамічно. Тому необхідна за кожен моментtі знайти оптимальне відповідне значення чинника x і функції відгуку в, які найближче описували б вихідну систему. Перешкода має нормальне розподіл, тому включаємо їх у функцію відгуку в такий спосіб, як показано в вище запропонованих формулах.

Для пошуку рішення потрібно розрахувати оптимальний крок .

Це потрібно по вищезазначеної формулі ( 6 ) – пошук кроку варіювання. Саме так реалізуємо в програмному розв'язанні цієї завдання.

Для пошуку оптимального рішення використовуємо матриці коефіцієнтів моделі , з допомогою яких визначаємо відповідне значення функції відгуку. Усе вище сказане реалізовано запропонованої програмі, у якій реалізовано

Схожі реферати:

Навігація