Реферати українською » Экономико-математическое моделирование » Виконання кореляційного і регресійного аналізу


Реферат Виконання кореляційного і регресійного аналізу

Страница 1 из 2 | Следующая страница

Контрольна робота

з дисципліни ">Эконометрика"

студента грн.ВФ-108

>Звягиной Марії Михайлівни


Розділ I. Практична частина

Зміст завдань.

 

Завдання 1

1. По вихідним даним виконати кореляційний аналіз:

Таблиця 9

Основні показники роботи вантажних автомобілів великих і середніх організацій автомобільного транспорту 2006 року

>Перевезено вантажів, тис. тонн Витрати, млн, крб
Володимирська 594,6 258,3
Брянська 3178,9 656,5
Білгородська 523,8 824,4
Воронезьку 2572,3 220,1
Івановська 308,5 73,8
Костромська 580,5 82,7
>Рязанская 203,7 65,4
Смоленська 389,3 86,6
>Тульская 225,8 36,5
Ярославська 693,4 279,9

Основне завдання кореляційного аналізу є - виявлення зв'язок між випадковими перемінними і - оцінка її тісноти. Показником тісноти лінійної зв'язку є коефіцієнт кореляції >r.

1.1. Побудуватикорреляционное полі, і запропонувати гіпотезу зв'язок досліджуваних чинників

Для трактування лінійної зв'язок між перемінної X (">Перевезено вантажів") і Y ("Витрати") з допомогою вбудованих можливостей Microsoft Excel побудуємо полі кореляції заданої вибірки спостережень (діаграма 1).

кореляційний регресійний аналіз

Характер розташування точок з діаграми дозволяє: зробити попередній висновок у тому, що зв'язок між перемінними пряма, тобто. збільшення одній з змінних веде збільшення умовної (груповий) середньої інший.

Зв'язок між перемінними буде в діапазоні досить тісний, однак у діапазоні є точки викиду, тобто. точки, що перебувають у досить віддаленому відстані від загального масиву точок. Їм відповідають дані про Брянській, Бєлгородської та Воронезької областям.

Діаграма 1.

Зробимо припущення, що:

1. дані про Брянській областях є точкою викиду;

2. дані про Білгородської області є точкою викиду;

3. дані про Воронезької області є точкою викиду;

4. дані про Брянській й Бєлгородської областям є точками викиду;

5. дані про Брянській і Воронезької областям є точками викиду;

6. дані про Бєлгородської та Воронезької областям є точками викиду

7. дані про Брянській, Бєлгородської та Воронезької областям є точками викиду.

1.2. Визначити коефіцієнти кореляції

Для заданого масиву змінних коефіцієнт кореляції >r = 0,454 (розрахований з допомогою функції Microsoft ExcelКОРРЕЛ).

Коефіцієнт кореляції >r > 0, отже, кореляційна зв'язок між перемінними пряма, що підтверджує попередній висновок, зроблений п.1.1.

Коефіцієнт кореляції >r прийняв значення на відрізку [-1; 1], отже, ми можемо оцінити тісноту зв'язку випадкових величин, заданих масивами, з допомогою шкалиЧеддока:

Тіснота зв'язку Значення коефіцієнта кореляції за наявності:
прямого зв'язку зворотний зв'язок
Слабка 0,1 - 0,3  (-0,1) - (-0,3)
Помірна 0,3 - 0,5  (-0,3) - (-0,5)
Помітна 0,5 - 0,7  (-0,5) - (-0,7)
Висока 0,7 - 0,9  (-0,7) - (-0,9)
Дуже висока 0,9 - 0,99  (-0,9) - (-0,99)

Коефіцієнт кореляції >r належить інтервалу (0,3; 0,5), отже, зв'язок між перемінними помірна.

>Рассчитаем коефіцієнти кореляції, виключаючи дані про суб'єктам РФ відповідно до висунутим припущенням:

>r = 0,116

>r = 0,821

>r = 0,578

>r = 0,511

>r = 0,455

>r = 0,949

>r = 0,824

Аналіз отриманих коефіцієнтів показує, що припущення 5 вірно, тобто. дані про Брянській й Бєлгородської областям є точками викиду (виняток точок, відповідних зазначеним суб'єктам РФ, з кореляційного поля не призвело до у себе значного зміни коефіцієнта кореляції). Решта припущення вважаємо невірними. З іншого боку, спостерігається значне збільшення тісноти зв'язок між перемінними при виключення з кореляційного поля точок, відповідних даним по Бєлгородської та Воронезької областям (припущення 6), і її значне зменшення при виключення даних із Брянській областях.

1.3. Оцінити статистичну значимість вирахуваних коефіцієнтів кореляції

Оцінку статистичну значимість коефіцієнтів кореляції проводитимемо з допомогоюt-критерияСтьюдента лише на рівні значимості = 0,05.

Подвійнийдвухвиборочнийt-тест для середніх

>r = 0,454

 

>Переменная 1

>Переменная 2

Середнє 927,08 258,42
>Дисперсия 1101362,746 73524,47289
Спостереження 10 10
Кореляція Пірсона 0,454062283
Гіпотетична різницю середніх 0
>df 9
>t-статистика 2, 208751921
>P (>T<=t) одностороннє 0,027278104
>t критичне одностороннє 1,833112923
>P (>T<=t) двостороннє 0,054556208
>t критичне двостороннє 2,262157158  

Розрахунковий значення критеріюСтьюдента >tр = 2,21 менше критичного >t>КРИТ = 2,306 (взяте з таблиціt-распределенийСтьюдента при числі ступенів свободи n-2 = 8 і величиною похибки = 0,05), із чого бачимо про незначущості коефіцієнта кореляції.

Оскільки виняток даних із Брянській й Бєлгородської областям відповідно до раніше проведеного аналізу не значно впливає коефіцієнт кореляції, то, при перебуванняt-критерияСтьюдента для вибірки вихідних даних при припущенні 5 одержимо практично аналогічний результат.

Подвійнийдвухвиборочнийt-тест для середніх

>r = 0,455

 

>Переменная 1

>Переменная 2

Середнє 696,0125 137,9125
>Дисперсия 607399,8755 9534,678393
Спостереження 8 8
Кореляція Пірсона 0,510547416
Гіпотетична різницю середніх 0
>df 7
>t-статистика 2,149664636
>P (>T<=t) одностороннє 0,034323806
>t критичне одностороннє 1,894578604
>P (>T<=t) двостороннє 0,068647613
>t критичне двостороннє 2,364624251  

Розрахунковий значення критеріюСтьюдента >tр = 2,15 менше критичного >t>КРИТ = 2,45 (взяте з таблиціt-распределенийСтьюдента при числі ступенів свободи n-2 = 6 і величиною похибки = 0,05). Коефіцієнт кореляціїнезначим.

1.4. Зробити підсумкові висновки.

Між показниками роботи вантажних автомобілів великих і середніх організацій автомобільного транспорту 2006 року існує помірна статистична взаємозв'язок. Для проведення аналізу дані про Брянській й Бєлгородської областям годі й враховувати.


Завдання 2

2. По вихідним даним виконати регресійний аналіз:

2.1.Рассчитать параметри рівняння лінійної парній регресії;

>Линейное рівняння парної регресії має вигляд:

,

де - оцінка умовного математичного очікування y;

b0, b1 - емпіричні коефіцієнти регресії, підлягають визначенню.

Емпіричні коефіцієнти регресії b0, b1 визначатимемо з допомогою інструментаРегрессия MS Excel.

>ВЫВОДИТОГОВ

 

 

>Регрессионная статистика

 

>Множественний R 0,454062283

 

>R-квадрат 0, 206172557

 

>НормированнийR-квадрат 0,106944127

 

Стандартна помилка 991,7552465

 

Спостереження 10

 

 

>Дисперсионний аналіз

 

>df

SS

MS

F

Значимість F

>Регрессия 1 2043636,965 2043636,965 2,078 0,187 Залишок 8 7868627,751 983578,469 Разом 9 9912264,716      

 

Коефіцієнти

Стандартна помилка

 

>Y-пересечение 472,939 444,546

 

>Переменная X 1 1,757 1,219

 

Отже, емпіричні коефіцієнти регресії відповідно рівні b0 = 472,94, b1 = 1,76.

Тоді рівняння парної лінійної регресії, яка зв'язує обсяги перевезених вантажними автомобілями великих і середніх організацій автомобільного транспорту 2006 року, y з величиною витрат на перевезення x, має вигляд:

2.2. Дати з допомогою загального (середнього) коефіцієнта еластичності порівняльну оцінку сили зв'язку чинника результат

Оцінимо тісноту статистичної зв'язок між видатками на перевезення, вироблені вантажними автомобілями великих і середніх організацій 2006 року, x та його обсягами y. Ця оцінку проводиться за допомогою коефіцієнта кореляції >r>xy.

Розмір цього коефіцієнта розрахована в п.1.2 і дорівнює >r = 0,454. Як зазначалося вище, зв'язок між перемінними помірна пряма.

>ПараметрR-квадрат є квадрат коефіцієнта кореляції >r>xy2 і називається коефіцієнтом детермінації. Величина даного коефіцієнта характеризує частку дисперсії залежною перемінної y,объясненную регресією (яка пояснюватиме перемінної x).

Відповідно величина 1 - >r>xy2 характеризує частку дисперсії перемінної y, викликану впливом решти, неврахованих веконометрической моделі пояснюють змінних.

Отже, частка всіх неврахованих в отриманоїеконометрической моделі пояснюють змінних приблизно становить: 1 - 0, 206 = 0,794 чи 79,4%. Ступінь зв'язку яка пояснюватиме перемінної x з залежною перемінної y визначається з допомогою коефіцієнта еластичності, який моделі парної лінійної регресії визначається вигляді:

.

Тоді

Отже, за зміни величини витрат на вантажоперевезення на 1% їх обсяг змінюється на 0,49%.

2.3. Оцінити якість рівняння з допомогою середньої помилки апроксимації.

Середня помилка апроксимації оцінюється по залежності:

І тому вихідну таблицю доповнюємо двома колонками, у яких визначаємо значення, розраховані з допомогою залежності і значення різниці .

 

>Перевезено вантажів, тис. тонн

Витрати, млн, крб

Володимирська 594,6 258,3 926,869 0,559
Брянська 3178,9 656,5 1626,656 0,488
Білгородська 523,8 824,4 1921,720 2,669
Воронезьку 2572,3 220,1 859,737 0,666
Івановська 308,5 73,8 602,633 0,953
Костромська 580,5 82,7 618,274 0,065
>Рязанская 203,7 65,4 587,871 1,886
Смоленська 389,3 86,6 625,128 0,606
>Тульская 225,8 36,5 537,083 1,379
Ярославська 693,4 279,9 964,828 0,391
сума = 9,662

Середня помилка апроксимації становить:

Практично вважають, що значення середньої помилки апроксимації на повинен перевищувати 12-15% для грубого наближення регресії до реального залежності. У нашому випадку помилка надмірна велика.

Скористаємося результатами дослідження, проведеного на п.1, т. е виключимо з аналізованої вибірки дані про Брянській й Бєлгородської областям.

І тут рівняння парної регресії набуде вигляду:

.

Частка неврахованих в отриманоїеконометрической моделі пояснюють змінних становитиме: 1 - 0,260 = 0,74 чи 74%.

Коефіцієнт еластичності становитиме:

,

сама ж середня помилка апроксимації:

Виняток точок викиду з аналізованої вибірки знизило помилку апроксимації, проте її значення перевищує дозволене значення.

2.4. Оцінити статистичну надійність результатів регресійного моделювання з допомогою критеріюСтъюдента іF-критерия Фішера.

Проведемо більш сувору оцінку статистичної надійності моделювання з допомогоюF-критерия Фішера.

І тому перевіримо нульову гіпотезу H0 про статистичної незначущості отриманого рівняння регресії за умовою: якщо заданому рівні значимості = 0,05 теоретичне (розрахункове) значенняF-критерия (F) більше його не критичної позначки (F>КРИТ), то нульова гіпотеза відхиляється й отримане рівняння регресії приймається значимим.

Розрахунковий значення F, певне з допомогою інструментаРегрессия MS Excel, становило F = 2,078.

Критичний значення F>КРИТ визначимо з допомогою статистичної функціїFРАСПОБР.Входними параметрами функції є державний рівень значимості (ймовірність) і кількість ступенів свободи 1 і 2. Для моделі парної регресії число ступенів свободи відповідно одно 1 (одна пояснює змінна) і n - 2 = 10 - 2 = 8.

 

F>КРИТ = 5,318.

Розрахунковий значення F = 2,078 менше критичного F>КРИТ = 5,318, тому нульова гіпотеза H0 про статистичної незначущості рівняння регресії приймається, що підтверджує висновок, зробленийп.2.3.

При розрахунку критеріїв Фішера для скороченою вибірки (виключаючи дані про Брянській й Бєлгородської областям) отримуємо аналогічний результат.

 

F =

Страница 1 из 2 | Следующая страница

Схожі реферати:

Навігація