Реферат Мультиколінеарності

Федеральне агентство за освітою й науці РФ

Костромської державний технологічний університет.

Кафедра вищої математики

>Реферат

поеконометрике на задану тему:

>Мультиколлинеарность

Виконала

студент 1 курсу

заочного факультету

>сп-ть «Бухгалтерський облік,

аналіз політики та аудит».

Перевірила

>КатержинаС.Ф.

 

Кострома 2008 р


>Мультиколлинеарность

Підмультиколлинеарностью розуміється висока взаємнакоррелированность пояснюють змінних.Мультиколлинеарность може виявлятися в функціональної (явною) істохастической (прихованої) формах.

При функціональної формімультиколлинеарности по крайнього заходу одне з парних перетинів поміж що пояснюють перемінними є лінійної функціональної залежністю. І тут матрицяX`X особлива, бо містить лінійно залежнівектори-столбци, і її визначник нульовий, тобто. порушується передумова регресійного аналізу, усе веде до неможливості рішення відповідної системи нормальних рівнянь й отримання оцінок параметрів регресійної моделі.

Однак у економічних дослідженняхмультиколлинеарность частіше проявляється устохастической формі, як між хоча двома що пояснюють перемінними існує тісний кореляційна зв'язок. МатрицяX`X у разі єнеособенной, та її визначник дуже малий.

У той самий час вектор оцінок b та їїковариционная матриця b пропорційні зворотної матриці (>X`X)-1, отже, їх елементи назад пропорційні величині означника |>X`X|. Через війну виходять значні середніквадратические відхилення (стандартні помилки) коефіцієнтів регресії b0, b1,…,b>p і - оцінка їхньої значимості поt-критерию втрачає сенс, хоча здебільшогорегрессионная модель може бути значимої поF-критерию.

Оцінки стають дуже чутливими до незначному зміни результатів спостережень і обсягу вибірки. Рівняння регресії у разі, зазвичай, немає реального сенсу, бо окремі з його коефіцієнтів може мати неправильні з погляду економічної теорії знаки та невиправдано великі значення.

Точних кількісних критеріїв визначення наявності або відсутністьмультиколлинеарности немає. Проте, є певні евристичні підходи по її виявлення.

Одне з таких підходів залежить від аналізі кореляційної матриці між що пояснюють перемінними X1,X2,…,X>p і виявленні пар змінних, мають високі перемінні кореляції (зазвичай більше 0,8). Якщо такі перемінні існують, говорять промультиколлинеарности з-поміж них. Корисно також знаходити множинні коефіцієнти детермінації між одній з пояснюють змінних і відзначався певною групою їх. Наявність високого множинного коефіцієнта детермінації (зазвичай більше 0,6) свідчить промультиколлинеарности.

Інший підхід полягає у дослідженні матриціX`X. Якщо визначник матриціX`X або її мінімальне власне значення>min близькі нанівець ( наприклад однотипні з які накопичувались помилками обчислень), це свідчить про наявністьмультиколлинеарности. про те саме може засвідчувати й значне відхилення максимального власного значення>max матриціX`X від її мінімального власного значення>min.

Для усунення чи зменшеннямультиколлинеарности використовується ряд методів. Найпростіший їх (проте який завжди можливий) у тому, що з цих двох пояснюють змінних, мають високий коефіцієнт кореляції (більше 0,8), одну зміну виключають із розгляду. У цьому, яку зміну залишити, а яку видалити з аналізу, вирішують насамперед виходячи з економічних міркувань. Якщо з економічної погляду жодній із змінних не можна віддавати перевагу, то залишають ту з цих двох змінних, має більший коефіцієнт кореляції з залежною перемінної.

Інший метод усунення чи зменшеннямультиколлинеарности залежить від переході віднесмещенних оцінок, певних методом найменших квадратів, досмещенним оцінкам, які мають, проте, меншим розсіюванням щодо що оцінюється параметра, тобто. меншим математичним очікуванням квадрата відхилення оцінки bj від параметраj чи M (bj -j)2.

Оцінки, зумовлені вектором, мають відповідно до теоремоюГаусса-Маркова мінімальнимидисперсиями у п'ятому класі всіх лінійнихнесмещенних оцінок, та за наявностімультиколлинеарности ці дисперсії може стати завеликими, і звернення до відповіднимсмещенним оцінкам може підвищити точність оцінювання параметрів регресії. На малюнку показаний випадок, колисмещенная оцінкаj^, вибіркове розподіл якої ставиться щільністю (j^).

Справді, нехай максимально припустимий за величиною довірчий інтервал для що оцінюється параметраj є (>j->,j+>). Тоді довірча ймовірність, чи надійність оцінки, обумовлена площею під кривою розподілу на інтервалі (>j->,j+>), як неважко бачити з малюнка, буде зацікавлений у тому випадку більше з метою оцінкиj проти bj ( малюнку ці площі заштриховані). Відповідно середній квадрат відхилення оцінки що оцінюється параметра буде набагато меншою длясмещенной оцінки, тобто.:

M (j^-j )2 < M ( bj -j )2

 

З використанням «>ридж-регрессии» (чи «гребньовій регресії») замістьнесмещенних оцінок розглядають зміщені оцінки, поставлені вектором

>>^=(X`X+ E>p+1)-1 >X`Y,

де > – деяке позитивне число, зване «гребенем» чи «хребтом»,

E>p+1 – одинична матриця (>р+1) –го порядку.

Додавання > до діагональним елементам матриціX`X робить оцінки параметрів моделісмещенними, та заодно збільшується визначник матриці системи нормальних рівнянь – замість (>X`X) від дорівнюватиме

|>X`X+ E>p+1|

Отже, стає можливим винятокмультиколлинеарности у разі, коли визначник |>X`X| близький нанівець.

Для усуненнямультиколлинеарности можна використовувати перехід від вихідних пояснюють змінних X1,X2,…,Xn, пов'язаних між собою досить тісній кореляційної залежністю, до нових змінним, які представляють лінійні комбінації вихідних. У цьому нові перемінні повинні прагнути бути слабкокоррелированними або взагалінекоррелированними. Як таких змінних беруть, наприклад, звані головні компоненти вектора вихідних пояснюють змінних, студійовані вкомпонентном аналізі, і розглядають регресію на головних компонентах, у якій останні виступаютьобобщенних пояснюють змінних, що підлягають подальшому змістовної (економічної)интерпритации.

>Ортогональность головних компонент запобігає прояв ефектумультиколлинеарности. З іншого боку, застосовуваний метод дозволяє обмежитися малим числом головних компонент присранительно велику кількість вихідних пояснюють змінних.

>Мультиколлинеарность — це поняття, що використовується для описи проблеми, колинестрогая лінійна залежність між що пояснюють перемінними призводить до отриманню ненадійних оцінок регресії. Зрозуміло, така залежність зовсім необов'язково дає незадовільні оцінки. Якщо всі інші умови сприяють, т. е. якщо число спостережень і вибіркові дисперсії пояснюють змінних великі, а дисперсія випадкового члена —мала, то результаті можна було одержати цілком хороші оцінки.

Отже,мультиколлинеарность повинна викликатися поєднаннямнестрогой залежності і самого (чи більше) несприятливого умови, і це — питання

рівня вираження явища, а чи не види. Оцінка будь-який регресії страждатиме від неї у певної міри, за умови що все незалежні перемінні не виявляться абсолютнонекоррелированними. Розгляд цієї проблеми починається тільки тоді ми, коли це серйозно впливає результати оцінки регресії.

Проблема є прийнятою длярегрессий часових рядів, т. е. коли дані складаються з низки спостережень протягом якогось періоду часу. Якщо два чи більш незалежні перемінні мають яскраво виражений тимчасової тренд, вони будуть тіснокоррелировани, і це можуть призвести домультиколлинеарности.


Що зробити у разі?

 

Різні методи, які можна використовуватимуться пом'якшеннямультиколлинеарности, діляться на дві категорії: до першої категорії ставляться спроби підвищити рівень виконання чотирьох умов, які забезпечують надійність оцінок регресії; до другої категорії належить використання зовнішньої інформації. Якщо спочатку використовувати можливі безпосередньо одержувані дані, то, очевидно, було б корисним збільшити кількість спостережень.

Якщо ви іприменяете дані часових рядів, це можна зробити шляхом скорочення тривалості кожного періоду часу. Наприклад, при оцінюванні рівнянь функції попиту вправах 5.3 і 5.6 можна перейти з використання щорічних даних на поквартальні дані.

Після цього замість 25 спостережень їх стане 100. Це смішно настільки мабуть, і так усе просто зробити, більшість дослідників, використовують тимчасові ряди, майже автоматично застосовують поквартальні дані, якщо вони є, замість щорічних даних, навіть якщо проблемамультиколлинеарности годі, просто до відома до мінімуму теоретичних дисперсій коефіцієнтів регресії. У цьому підході існують, проте, й потенційні проблеми. Можна привнести чи посилитиавтокорреляцию, але вона може бути нейтралізована. З іншого боку, можна привнести (чи посилити) усунення, викликане помилками виміру, якщо поквартальні дані обмірювані з не меншою точністю, ніж відповідні щорічні дані. Ця проблема непросто вирішити, але вона може виявитися несуттєвою.

Якщо ви і використовуєте дані перехресною вибірки і перебуваєте на стадії планування дослідження, можна збільшити точність оцінок регресії і послабити проблемумультиколлинеарности за рахунок більшого витрати коштів у підвищення розміру вибірки. Але такий підхід має зменшувану граничну віддачу, оскільки стандартні відхилення коефіцієнтів регресії назад пропорційні величині7л > тоді як витрати прямо пропорційні п.

Так само важливо, коли ви використовуєте дані перехресною вибірки і перебуваєте на стадії планування дослідження, максимізуватидисперсию спостережень незалежних змінних в вибірці, наприклад шляхом розшарування вибірки.

Далі, можна скоротити величину а^. Випадковий член включає у собі об'єднаний ефект всіх змінних, що впливають на величину >уу які включені явно в рівняння регресії. Якщо ви хоч припускаєтеся думки у тому, що важлива змінна можна було опущене і, отже, впливає на і те можна скоротити величину а^, якщо додати цю зміну в рівняння регресії.

Якщо, проте, нова змінна лінійно пов'язані з одна чи кілька перемінними, вже включеними в рівняння, що його запровадження може більше погіршити проблемумультиколлинеарности. Ми повернемося до обговорення цього питання, що робить велику практичну важливість, наприкінці наступній глави після розгляду помилок специфікації.

Нарешті, про використання найпростішого методу. Якщо справді маєте можливість зібрати додаткові дані, потрібно постаратися отримати вибірку, у якій незалежні перемінні слабко зв'язані між собою.

Існують два типу зовнішньої інформації, яка може бути корисною: теоретичні обмеження і його зовнішні емпіричні оцінки. Теоретичне обмеження є припущення, що стосується величини коефіцієнта або певною зв'язок між коефіцієнтами. Пояснимо на прикладі.

При побудові виробничої функції з цих часових рядів (як це було зроблено на розділі 5.3) слід пам'ятати, що у випускати продукцію, поруч із змінами у капітальних і трудових витратах, мабуть, впливатиме технічний прогрес. Якщо вже ви маєте працювати загрегированними даними, то неможливо кількісно оцінити технічний прогрес, та простіше всього включити експонентний тимчасової тренд в рівняння, записавши функціюКобба—Дугласа, наприклад, як:

Р=AK«Lte«v, (5.47)

де Y, До і L мають самі визначення, що у розділі 5.3; / — час; р — темп

приросту випуску завдяки технічному прогресу. Оцінивши це співвідношення за даними табл. 5.1, одержимо (стандартні помилки зазначені у дужках):

>log У= 2,81 - 0,53log K+ 0,91log L + 0,047/; >R2 = 0,97; (5.48)

(1,38) (0,34) (0,14) (0,021) F= 189,8.

З усією очевидністю цей результат показує, що еластичність випуску продукції з затратам капіталу негативною, що означає зниження випуску зі збільшенням витрат капіталу.Уравнение також показує темп приросту випуску продукції з допомогою технічного прогресу порядку 4,7% на рік, що неправдоподібно високої оцінкою для аналізованого періоду.

Тут можна припустити, що у крайнього заходу почасти проблема пов'язані змультиколлинеарностью, оскільки коефіцієнт кореляції міжlog До іt становить 0,997, а стандартна помилка коефіцієнта приlog >Къ 5 разів більше, ніж у рівнянні без величини / (5.32).

Звідси хочеш запровадити обмеження на ефект від участі масштабу, розглядаючи його як постійну величину, що дозволить переписати рівняння лише двома незалежними перемінними, мають тимчасової тренд, замість трьох і на зкапиталовооруженностью праці як яка пояснюватиме перемінної замість витрат капіталу. Це як і тіснокоррелирован з часом (коефіцієнт кореляції становить 0,96), але ступінькоррелированности вже не гранично висока. Оцінивши рівняння (5.28) з експонентним тимчасовим трендом, ми матимемо (стандартні помилки зазначені у дужках):

>log >Y/L = -0,11 + 0,11log >K/L +0,006f; >R2 = 0,65; (5.49)

(0,03) (0,15) (0,006)F=19,5.

Оцінки величин чи р, хоч і незначимо від нуля, тепер більш реалістичні, ніж раніше, а стандартні помилки — значно менше, ніж у рівнянні (5.48). Факт, що обсяг р незначимо відрізняється від нуля, підтверджує висновок Ч.Кобба і П. Дугласа у тому, що темп збільшення загальної продуктивності чинників у розглянутий період було дуже низьким. Вочевидь, що обгрунтованість цієї процедури залежить від правильності введеного обмеження, тому спочатку потрібно статистично перевірити обмеження, що у наступному розділі.

Нарешті, можна використовувати зовнішні оцінки. Припустимо, що вам закортіло скористатися рівнянням (5.24) як формули для функції попиту, але є проблемамультиколлинеарности, оскількирасполагаемий особистий прибуток і ціна мають яскраво виражені тимчасові тренди, отже, тіснокоррелировани. Припустимо, проте, що ви маєте перехресні статистичні дані для у і x, отримані з іншої вибірки. Якщо припустити, що це домогосподарства в проведеному аналізі платили за даний товар однакову ціну, то модель набуде вигляду:

>log/=loga' +p*logx' + w'. (5.50)

Отримавши оцінку для р при оцінюванні регресійної залежності у від x ви можете підставити їх у рівняння (5.24). Тепер визначається нова зміннаlogy, рівна (>log у — >6',log x), яка описувала попит, скоригований зміни доходу. Після цього рівняння (5.25) набирає вигляду:

>logy =log a+p2log/J +w. (5.51)

>Рассчитавlogy кожному за спостереження, ви оцінюєте йогорегрессионную залежність відlog >p, й, оскільки тут є лише одне незалежна змінна,мультиколлинеарность автоматично виключається.

З використанням цього виникатимуть дві проблеми, які треба враховувати. По-перше, оцінка величиниР2 залежить від точності оцінки величиниР'р яка, безумовно, схильна до впливу помилки вибірки.

По-друге, ви припускаєте, що коефіцієнт при доході має однаковий сенс для випадків часових рядів і перехресних вибірок, що, звісно, може бути негаразд. Більшість товарів короткострокова і довгострокова еластичність попиту по прибутку може значно різнитися. Один із цього у тому, що характер витрат піддається впливу інерції, що у короткостроковому періоді може перевершити ефекти доходу.

Інша причина у тому, зміна рівня доходу може надати на витрати як безпосереднє (як зміни бюджетного обмеження), і опосередкований вплив (з допомогою зміни життя), причому опосередкований вплив відбувається набагато повільніше, ніж пряме. Як першого наближення зазвичай вважається, що регресії для часових рядів, особливо з невеликими періодами вибірки, дають показники короткостроковій еластичності, тоді як регресії з цих перехресних вибірок дають показники довгострокової еластичності.


Список використовуваної літератури:

1.Н.Ш. Кремер,Б.А.Путко «>Эконометрика», Москва, 2005

2. До.Доугерти «Введення ЄІАС уеконометрику», Москва, 1999


Схожі реферати:

Навігація