Контрольна робота
з дисципліни ">Эконометрика"
студента грн.ВФ-108
>Звягиной Марії Михайлівни
Зміст завдань.
1. По вихідним даним виконати кореляційний аналіз:
Таблиця 9
Основні показники роботи вантажних автомобілів великих і середніх організацій автомобільного транспорту 2006 року
>Перевезено вантажів, тис. тонн | Витрати, млн, крб | |
Володимирська | 594,6 | 258,3 |
Брянська | 3178,9 | 656,5 |
Білгородська | 523,8 | 824,4 |
Воронезьку | 2572,3 | 220,1 |
Івановська | 308,5 | 73,8 |
Костромська | 580,5 | 82,7 |
>Рязанская | 203,7 | 65,4 |
Смоленська | 389,3 | 86,6 |
>Тульская | 225,8 | 36,5 |
Ярославська | 693,4 | 279,9 |
Основне завдання кореляційного аналізу є - виявлення зв'язок між випадковими перемінними і - оцінка її тісноти. Показником тісноти лінійної зв'язку є коефіцієнт кореляції >r.
1.1. Побудуватикорреляционное полі, і запропонувати гіпотезу зв'язок досліджуваних чинників
Для трактування лінійної зв'язок між перемінної X (">Перевезено вантажів") і Y ("Витрати") з допомогою вбудованих можливостей Microsoft Excel побудуємо полі кореляції заданої вибірки спостережень (діаграма 1).
кореляційний регресійний аналіз
Характер розташування точок з діаграми дозволяє: зробити попередній висновок у тому, що зв'язок між перемінними пряма, тобто. збільшення одній з змінних веде збільшення умовної (груповий) середньої інший.
Зв'язок між перемінними буде в діапазоні досить тісний, однак у діапазоні є точки викиду, тобто. точки, що перебувають у досить віддаленому відстані від загального масиву точок. Їм відповідають дані про Брянській, Бєлгородської та Воронезької областям.
Діаграма 1.
Зробимо припущення, що:
1. дані про Брянській областях є точкою викиду;
2. дані про Білгородської області є точкою викиду;
3. дані про Воронезької області є точкою викиду;
4. дані про Брянській й Бєлгородської областям є точками викиду;
5. дані про Брянській і Воронезької областям є точками викиду;
6. дані про Бєлгородської та Воронезької областям є точками викиду
7. дані про Брянській, Бєлгородської та Воронезької областям є точками викиду.
1.2. Визначити коефіцієнти кореляції
Для заданого масиву змінних коефіцієнт кореляції >r = 0,454 (розрахований з допомогою функції Microsoft ExcelКОРРЕЛ).
Коефіцієнт кореляції >r > 0, отже, кореляційна зв'язок між перемінними пряма, що підтверджує попередній висновок, зроблений п.1.1.
Коефіцієнт кореляції >r прийняв значення на відрізку [-1; 1], отже, ми можемо оцінити тісноту зв'язку випадкових величин, заданих масивами, з допомогою шкалиЧеддока:
Тіснота зв'язку | Значення коефіцієнта кореляції за наявності: | |
прямого зв'язку | зворотний зв'язок | |
Слабка | 0,1 - 0,3 | (-0,1) - (-0,3) |
Помірна | 0,3 - 0,5 | (-0,3) - (-0,5) |
Помітна | 0,5 - 0,7 | (-0,5) - (-0,7) |
Висока | 0,7 - 0,9 | (-0,7) - (-0,9) |
Дуже висока | 0,9 - 0,99 | (-0,9) - (-0,99) |
Коефіцієнт кореляції >r належить інтервалу (0,3; 0,5), отже, зв'язок між перемінними помірна.
>Рассчитаем коефіцієнти кореляції, виключаючи дані про суб'єктам РФ відповідно до висунутим припущенням:
>r = 0,116 |
>r = 0,821 |
>r = 0,578 |
>r = 0,511 |
>r = 0,455 |
>r = 0,949 |
>r = 0,824 |
Аналіз отриманих коефіцієнтів показує, що припущення 5 вірно, тобто. дані про Брянській й Бєлгородської областям є точками викиду (виняток точок, відповідних зазначеним суб'єктам РФ, з кореляційного поля не призвело до у себе значного зміни коефіцієнта кореляції). Решта припущення вважаємо невірними. З іншого боку, спостерігається значне збільшення тісноти зв'язок між перемінними при виключення з кореляційного поля точок, відповідних даним по Бєлгородської та Воронезької областям (припущення 6), і її значне зменшення при виключення даних із Брянській областях.
1.3. Оцінити статистичну значимість вирахуваних коефіцієнтів кореляції
Оцінку статистичну значимість коефіцієнтів кореляції проводитимемо з допомогоюt-критерияСтьюдента лише на рівні значимості = 0,05.
Подвійнийдвухвиборочнийt-тест для середніх | ||
>r = 0,454 |
||
|
>Переменная 1 |
>Переменная 2 |
Середнє | 927,08 | 258,42 |
>Дисперсия | 1101362,746 | 73524,47289 |
Спостереження | 10 | 10 |
Кореляція Пірсона | 0,454062283 | |
Гіпотетична різницю середніх | 0 | |
>df | 9 | |
>t-статистика | 2, 208751921 | |
>P (>T<=t) одностороннє | 0,027278104 | |
>t критичне одностороннє | 1,833112923 | |
>P (>T<=t) двостороннє | 0,054556208 | |
>t критичне двостороннє | 2,262157158 |
Розрахунковий значення критеріюСтьюдента >tр = 2,21 менше критичного >t>КРИТ = 2,306 (взяте з таблиціt-распределенийСтьюдента при числі ступенів свободи n-2 = 8 і величиною похибки = 0,05), із чого бачимо про незначущості коефіцієнта кореляції.
Оскільки виняток даних із Брянській й Бєлгородської областям відповідно до раніше проведеного аналізу не значно впливає коефіцієнт кореляції, то, при перебуванняt-критерияСтьюдента для вибірки вихідних даних при припущенні 5 одержимо практично аналогічний результат.
Подвійнийдвухвиборочнийt-тест для середніх | ||
>r = 0,455 |
||
|
>Переменная 1 |
>Переменная 2 |
Середнє | 696,0125 | 137,9125 |
>Дисперсия | 607399,8755 | 9534,678393 |
Спостереження | 8 | 8 |
Кореляція Пірсона | 0,510547416 | |
Гіпотетична різницю середніх | 0 | |
>df | 7 | |
>t-статистика | 2,149664636 | |
>P (>T<=t) одностороннє | 0,034323806 | |
>t критичне одностороннє | 1,894578604 | |
>P (>T<=t) двостороннє | 0,068647613 | |
>t критичне двостороннє | 2,364624251 |
Розрахунковий значення критеріюСтьюдента >tр = 2,15 менше критичного >t>КРИТ = 2,45 (взяте з таблиціt-распределенийСтьюдента при числі ступенів свободи n-2 = 6 і величиною похибки = 0,05). Коефіцієнт кореляціїнезначим.
1.4. Зробити підсумкові висновки.
Між показниками роботи вантажних автомобілів великих і середніх організацій автомобільного транспорту 2006 року існує помірна статистична взаємозв'язок. Для проведення аналізу дані про Брянській й Бєлгородської областям годі й враховувати.
2. По вихідним даним виконати регресійний аналіз:
2.1.Рассчитать параметри рівняння лінійної парній регресії;
>Линейное рівняння парної регресії має вигляд:
,
де - оцінка умовного математичного очікування y;
b0, b1 - емпіричні коефіцієнти регресії, підлягають визначенню.
Емпіричні коефіцієнти регресії b0, b1 визначатимемо з допомогою інструментаРегрессия MS Excel.
>Регрессионная статистика
>df
SS
MS
F
Значимість F
Коефіцієнти
Стандартна помилка
Отже, емпіричні коефіцієнти регресії відповідно рівні b0 = 472,94, b1 = 1,76.
Тоді рівняння парної лінійної регресії, яка зв'язує обсяги перевезених вантажними автомобілями великих і середніх організацій автомобільного транспорту 2006 року, y з величиною витрат на перевезення x, має вигляд:
2.2. Дати з допомогою загального (середнього) коефіцієнта еластичності порівняльну оцінку сили зв'язку чинника результат
Оцінимо тісноту статистичної зв'язок між видатками на перевезення, вироблені вантажними автомобілями великих і середніх організацій 2006 року, x та його обсягами y. Ця оцінку проводиться за допомогою коефіцієнта кореляції >r>xy.
Розмір цього коефіцієнта розрахована в п.1.2 і дорівнює >r = 0,454. Як зазначалося вище, зв'язок між перемінними помірна пряма.
>ПараметрR-квадрат є квадрат коефіцієнта кореляції >r>xy2 і називається коефіцієнтом детермінації. Величина даного коефіцієнта характеризує частку дисперсії залежною перемінної y,объясненную регресією (яка пояснюватиме перемінної x).
Відповідно величина 1 - >r>xy2 характеризує частку дисперсії перемінної y, викликану впливом решти, неврахованих веконометрической моделі пояснюють змінних.
Отже, частка всіх неврахованих в отриманоїеконометрической моделі пояснюють змінних приблизно становить: 1 - 0, 206 = 0,794 чи 79,4%. Ступінь зв'язку яка пояснюватиме перемінної x з залежною перемінної y визначається з допомогою коефіцієнта еластичності, який моделі парної лінійної регресії визначається вигляді:
.
Тоді
Отже, за зміни величини витрат на вантажоперевезення на 1% їх обсяг змінюється на 0,49%.
2.3. Оцінити якість рівняння з допомогою середньої помилки апроксимації.
Середня помилка апроксимації оцінюється по залежності:
І тому вихідну таблицю доповнюємо двома колонками, у яких визначаємо значення, розраховані з допомогою залежності і значення різниці .
>Перевезено вантажів, тис. тонн |
Витрати, млн, крб |
|
|
|
Володимирська | 594,6 | 258,3 | 926,869 | 0,559 |
Брянська | 3178,9 | 656,5 | 1626,656 | 0,488 |
Білгородська | 523,8 | 824,4 | 1921,720 | 2,669 |
Воронезьку | 2572,3 | 220,1 | 859,737 | 0,666 |
Івановська | 308,5 | 73,8 | 602,633 | 0,953 |
Костромська | 580,5 | 82,7 | 618,274 | 0,065 |
>Рязанская | 203,7 | 65,4 | 587,871 | 1,886 |
Смоленська | 389,3 | 86,6 | 625,128 | 0,606 |
>Тульская | 225,8 | 36,5 | 537,083 | 1,379 |
Ярославська | 693,4 | 279,9 | 964,828 | 0,391 |
сума = 9,662 |
Середня помилка апроксимації становить:
Практично вважають, що значення середньої помилки апроксимації на повинен перевищувати 12-15% для грубого наближення регресії до реального залежності. У нашому випадку помилка надмірна велика.
Скористаємося результатами дослідження, проведеного на п.1, т. е виключимо з аналізованої вибірки дані про Брянській й Бєлгородської областям.
І тут рівняння парної регресії набуде вигляду:
.
Частка неврахованих в отриманоїеконометрической моделі пояснюють змінних становитиме: 1 - 0,260 = 0,74 чи 74%.
Коефіцієнт еластичності становитиме:
,
сама ж середня помилка апроксимації:
Виняток точок викиду з аналізованої вибірки знизило помилку апроксимації, проте її значення перевищує дозволене значення.
2.4. Оцінити статистичну надійність результатів регресійного моделювання з допомогою критеріюСтъюдента іF-критерия Фішера.
Проведемо більш сувору оцінку статистичної надійності моделювання з допомогоюF-критерия Фішера.
І тому перевіримо нульову гіпотезу H0 про статистичної незначущості отриманого рівняння регресії за умовою: якщо заданому рівні значимості = 0,05 теоретичне (розрахункове) значенняF-критерия (F) більше його не критичної позначки (F>КРИТ), то нульова гіпотеза відхиляється й отримане рівняння регресії приймається значимим.
Розрахунковий значення F, певне з допомогою інструментаРегрессия MS Excel, становило F = 2,078.
Критичний значення F>КРИТ визначимо з допомогою статистичної функціїFРАСПОБР.Входними параметрами функції є державний рівень значимості (ймовірність) і кількість ступенів свободи 1 і 2. Для моделі парної регресії число ступенів свободи відповідно одно 1 (одна пояснює змінна) і n - 2 = 10 - 2 = 8.
F>КРИТ = 5,318.
Розрахунковий значення F = 2,078 менше критичного F>КРИТ = 5,318, тому нульова гіпотеза H0 про статистичної незначущості рівняння регресії приймається, що підтверджує висновок, зробленийп.2.3.
При розрахунку критеріїв Фішера для скороченою вибірки (виключаючи дані про Брянській й Бєлгородської областям) отримуємо аналогічний результат.
F =