Реферати українською » Экономико-математическое моделирование » Багатомірний статистичний аналіз в системі SPSS


Реферат Багатомірний статистичний аналіз в системі SPSS

Страница 1 из 2 | Следующая страница

>Оглавление

Запровадження

Глава 1.Множественний регресійний аналіз

Глава 2.Кластерний аналіз

Глава 3. Факторний аналіз

Глава 4.Дискриминантний аналіз

Список використовуваної літератури


Запровадження

Вихідна інформація в соціально-економічних дослідженнях представляється переважно у вигляді набору об'єктів, кожен із яких характеризується поруч ознак (показників). Оскільки число таких об'єктів і ознак може становити десятків і сотень, і візуальний аналіз цих даних малоефективний, то виникають завдання зменшення, концентрації вихідних даних, виявлення структури та взаємозв'язку з-поміж них з урахуванням побудови узагальнених характеристик безлічі ознак і багатьох об'єктів. Такі завдання можуть наважитися методами багатовимірного статистичного аналізу.

>Многомерний статистичний аналіз - розділ математичної статистики, присвячений математичним методам, спрямованим на виявлення характеру і структури взаємозв'язків між компонентами досліджуваного багатовимірного ознаки і призначеним щоб одержати наукових кадрів і практичних висновків.

Чільну увагу в багатомірному статистичному аналізі приділяється математичним методам побудови оптимальних планів збору, систематизації і методи обробки даних, спрямованим на виявлення характеру і структури взаємозв'язків між компонентами досліджуваного багатовимірного ознаки і призначеним щоб одержати наукових закладів та практичних висновків.

Вихідним масивом багатомірних даних щодо багатовимірного аналізу зазвичай служать результати виміру компонент багатовимірного ознаки кожного з об'єктів досліджуваної сукупності, тобто. послідовність багатомірних спостережень.Многомерний ознака найчастіше інтерпретується як величина випадкова, а послідовність спостережень як вибірка з генеральної сукупності. І тут вибір методу обробки вихідних статистичних даних виготовляють основі чи інших допущень щодо природи закону розподілу досліджуваного багатовимірного ознаки.

За вмістом багатомірний статистичний аналіз то, можливо умовно розбитий втричі основних підрозділу:

1.Многомерний статистичний аналіз багатомірних розподілів та його основних характеристик охоплює ситуації, коли оброблювані спостереження мають імовірнісного природу, тобто. інтерпретуються як вибірка з відповідної генеральної сукупності. До основних завдань цього підрозділу ставляться: оцінювання статистичне досліджуваних багатомірних розподілів та його основних параметрів; дослідження властивостей використовуваних статистичних оцінок; дослідження розподілів ймовірностей для низки статистик, з допомогою яких будуються статистичні критерії перевірки різних гіпотез провероятностной природі аналізованих багатомірних даних.

2.Многомерний статистичний аналіз характеру і структури взаємозв'язків компонент досліджуваного багатовимірного ознаки об'єднує поняття й одержують результати, властиві таких методів і моделям, як регресійний аналіз,дисперсионний аналіз,ковариационний аналіз, факторний аналіз політики та т.д. Методи, належать до цій групі, включають як алгоритми, засновані на припущенні провероятностной природі даних, і методи, не вкладаються до рамок будь-якоївероятностной моделі (останні частіше належать до методами аналізу даних).     

>3.Многомерний статистичний аналіз геометричній структури досліджуваної сукупності багатомірних спостережень об'єднує поняття і вивести результати, властиві таким моделям і методам, якдискриминантний аналіз, кластерний аналіз, багатомірнешкалирование. Вузловим тих моделей є поняття відстані, або заходи близькості міжанализируемими елементами як точками деякого простору. У цьому аналізуватися можуть як об'єкти (як точки, поставлені впризнаковом просторі), і ознаки (як точки, поставлені в об'єктному просторі).

>Прикладное значення багатовимірного статистичного аналізу складається переважно у вирішенні наступних трьох завдань:

· завдання статистичного дослідження залежностей між розглянутими показниками;

· завдання класифікації елементів (об'єктів чи ознак);

· завдання зниження розмірності аналізованогопризнакового простору й відбору найбільш інформативних ознак.

>Множественний регресійний аналіз призначений для побудови моделі, що дозволяє по значенням незалежних змінних отримувати оцінки значень залежною перемінної.

Логістична регресія на вирішення завдання класифікації. Це різновид множинної регресії, призначення якого у аналізі зв'язок між кількома незалежними перемінними і більш залежної перемінної.

Факторний аналіз займається визначенням щодо небагатьох прихованих (латентних) чинників, мінливістю яких пояснюється мінливість всіх можна побачити показників. Факторний аналіз спрямовано зниження розмірності аналізованої завдання.

>Кластерний ідискриминантний аналіз призначені потреби ділити сукупностей об'єктів на класи, у кожний із яких мають входити об'єкти у певному сенсі однорідні чи близькі. При кластерному аналізі заздалегідь невідомо, скільки вийде груп об'єктів і якої вони будуть обсягу.Дискриминантний аналіз поділяє об'єкти за тим самим існуючим класам.


Глава 1.Множественний регресійний аналіз

Завдання: Дослідження ринку житла в Орлі (Радянський і Північний райони).

У таблиці наведено дані про ціні квартир в Орлі різноманітні чинникам, її яке обумовлює:

· ціна;

· загальна площа;

· площа кухні;

· житлова площа;

· район;

· поверх;

· тип вдома;

· кількість кімнат. (Мал.1)

>Рис. 1 Вихідні дані

У графі «Район» використані позначення:

3 – Радянський (елітний, належить до центральним районам);

4 – Північний.

У графі «Тип вдома»:

1 – цегельний;

0 – панельний.

Потрібна:

1. Проаналізувати зв'язок всіх згаданих чинників який з показником «Ціна» і. Забрати чинники, найбільш підходящі для побудови регресійної моделі;

2. Сконструювати фіктивну зміну,отображающую приналежність квартири до центральним і периферійним районам міста;

3. Побудувати лінійну модель регресії всім чинників, включивши до неї фіктивну зміну. Пояснити економічний сенс параметрів рівняння. Оцінити якість моделі, статистичну значимість рівняння та її параметрів;

4. Розподілити чинники (крім фіктивної перемінної) за силою впливу на показник «Ціна»;

5. Побудувати лінійну модель регресії для найвпливовіших чинників, залишивши в рівнянні фіктивну зміну. Оцінити якість і статистичну значимість рівняння та її параметрів;

6. Створити доцільність чи недоцільність включення до рівняння п. 3 і п'яти фіктивної перемінної;

7. Оцінитиинтервальние оцінки параметрів рівняння з імовірністю 95%;

8. Визначити, скільки це коштуватиме квартира загальною площею 74,5м в елітному (периферійному) районі.

Виконання:

1. Проаналізувавши зв'язок всіх згаданих чинників який з показником «Ціна» і, відібрали чинники, найбільш підходящі для побудови регресійної моделі, використовуючи метод включення «>Forward»:

А) загальна площа;

Б) район;

У) кількість кімнат.

>Включенние/исключенниепеременние(a)

Модель Включені перемінні >Исключенние перемінні Метод
1 Загальна площа . Включення (критерій: ймовірністьF-включения >= ,050)
2 Район . Включення (критерій: ймовірністьF-включения >= ,050)
3 >Кол-во кімнат . Включення (критерій: ймовірністьF-включения >= ,050)

a Залежна змінна: Ціна

2.ПеременнаяХ4 «Район» фіктивна перемінної, оскільки має 2 значення:3-принадлежность до центрального району «Радянський», 4- до периферійному району «Північний».

3. Побудуємо лінійну модель регресії всім чинників (включаючи фіктивну змінуХ4).

Отримана модель:

У = 348,349 + 35,788Х1 -217,075Х4 +305,687Х7

Оцінка якості моделі.

Коефіцієнт детермінаціїR2 = 0,807

Показує частку варіації результативного ознаки під впливом досліджуваних чинників. Отже, близько 89% варіації залежною перемінної враховано й зумовлено в моделі впливом включених чинників.

Коефіцієнт множинної кореляції R = 0,898

Показує тісноту зв'язок між залежною перемінної У з усіма включеними в модель що пояснюють чинниками.

Стандартна помилка = 126,477

КоефіцієнтДарбина - Вотсона = 2,136

Перевірка значимості рівняння регресії

Значення критеріюF-Фишера = 41,687

>Уравнение регресії можна припустити адекватним, модель вважається значимої.

Найбільш значимий чинник – кількість кімнат (>F=41,687)

Другий за значимістю чинник- загальна площа (F= 40,806)

Третій за значимістю чинник- район (F= 32,288)

4. Побудуємо лінійну модель регресію з усіма чинниками (крім фіктивної перемінноїХ4)

За ступенем впливу на показник «Ціна» розподілили:

Найбільш значимий чинник – загальна площа (F= 40,806)

Другий за значимістю чинник- кількість кімнат (F= 29,313)

5.Включенние/исключенние перемінні

Модель Включені перемінні >Исключенние перемінні Метод
1 Загальна площа . Включення (критерій: ймовірністьF-включения >= ,050)
2 Район . Включення (критерій: ймовірністьF-включения >= ,050)
3 >Кол-во кімнат . Включення (критерій: ймовірністьF-включения >= ,050)

a Залежна змінна: Ціна

6. Побудуємо лінійну модель регресії для найвпливовіших чинників з фіктивної перемінної, у разі вона є однією з впливових чинників.

Отримана модель:

У = 348,349 + 35,788Х1 -217,075Х4 +305,687Х7

Оцінка якості моделі.

Коефіцієнт детермінаціїR2 = 0,807

Показує частку варіації результативного ознаки під впливом досліджуваних чинників. Отже, близько 89% варіації залежною перемінної враховано й зумовлено в моделі впливом включених чинників.

Коефіцієнт множинної кореляції R = 0,898

Показує тісноту зв'язок між залежною перемінної У з усіма включеними в модель що пояснюють чинниками.

Стандартна помилка = 126,477

КоефіцієнтДарбина - Вотсона = 2,136

Перевірка значимості рівняння регресії

Значення критеріюF-Фишера = 41,687

>Уравнение регресії можна припустити адекватним, модель вважається значимої.

Найбільш значимий чинник – кількість кімнат (>F=41,687)

Другий за значимістю чинник- загальна площа (F= 40,806)

Третій за значимістю чинник- район (F= 32,288)

7.Фиктивная зміннаХ4 є значимим чинником, тому доцільно вводити її в рівняння.

>Интервальние оцінки параметрів рівняння показують результати прогнозування за моделлю регресії.

З імовірністю 95% реалізацію в прогнозованому місяці становитиме від 540,765 до 1080,147 млн. крб.

8. Визначення вартості квартири елітному районі

Для 1комн У = 348,349 + 35,788 * 74, 5 - 217,075 * 3 + 305,687 * 1

Для 2комн У = 348,349 + 35,788 * 74, 5 - 217,075 * 3 + 305,687 * 2

Для 3комн У = 348,349 + 35,788 * 74, 5 - 217,075 * 3 + 305,687 * 3

в периферійному

Для 1комн У = 348,349 + 35,788 * 74, 5 - 217,075 * 4 + 305,687 * 1

Для 2комн У = 348,349 + 35,788 * 74, 5 - 217,075 * 4 + 305,687 * 2

Для 3комн У = 348,349 + 35,788 * 74, 5 - 217,075 * 4 + 305,687 * 3

Глава 2.Кластерний аналіз

Завдання: Дослідження структури грошових витрат і заощаджень населення.

У таблиці представлена структура грошових витрат і заощаджень населення за регіонам Центрального федерального округу Російської Федерації 2003 р. Для наступних показників:

·ПТиОУ – купівля товарів хороших і послуги;

·ОПиВ – обов'язкових платежів і внески;

·ПН – придбання нерухомості;

·ПФА – приріст фінансових активів;

·ДР – приріст (зменшення) грошей на руках населення.


>Рис. 8 Вихідні дані

Потрібна:

1) визначити оптимальне кількість кластерів для розбивки регіонів на однорідні групи з всімгруппировочним ознаками одночасно;

2) провести класифікацію областей ієрархічним методом з алгоритмом міжгрупових зв'язків і відобразити результати якдендрограмми;

3) проаналізувати основні пріоритети грошових витрат і заощаджень укластерах;

4) порівняти отриману класифікацію з результатами застосування алгоритму внутрішньогрупових зв'язків.

Виконання:

1) Визначити оптимальне кількість кластерів для розбивки регіонів на однорідні групи з всімгруппировочним ознаками одночасно;

Для визначення оптимального кількості кластерів потрібно скористатисяИерархическимкластерним аналізом і звернутися до таблиці «Кроки агломерації» до стовпцю «Коефіцієнти».

Ці коефіцієнти розуміють відстань між двома кластерами, визначене підставі обраної дистанційної заходи (>Евклидово відстань). З тих етапі, коли міра відстані між двома кластерами збільшується стрибкоподібно, процес об'єднання нові кластери необхідно зупинити.

У результаті, оптимальним вважається число кластерів, однакову різниці кількості спостережень (17) і номери кроку (>14),после якого коефіцієнт збільшується стрибкоподібно. Отже, оптимальне кількість кластерів одно 3. (>Рис.9)

статистичний математичний аналіз кластерний

>Рис. 9 Таблиця «Кроки агломерації»

2) Провести класифікацію областей ієрархічним методом з алгоритмом міжгрупових зв'язків і відобразити результати якдендрограмми;

Тепер, використовуючи оптимальне кількість кластерів, проводимо класифікацію областей ієрархічним методом. І на вихідних даних звертаємося до таблиці «Належність до кластерам». (>Рис.10)


>Рис. 10 Таблиця «Належність до кластерам»

НаРис. 10 чітко видно, що у 3 кластер потрапили 2 області (>Калужская, Московська) і 2002 р. Москва, у 2 кластер дві (Брянська, Воронезька, Івановська,Липецкая, Орловська,Рязанская, Смоленська,Тамбовская, Тверська), один кластер – Білгородська, Володимирська, Костромська, Курська,Тульская, Ярославська.


>Рис. 11Дендрограмма

3) проаналізувати основні пріоритети грошових витрат і заощаджень, укластерах;

Для аналізу кластерів ми мусимо провести «Порівняння середніх». У вихідному вікні виводиться наступна таблиця (>Рис. 12)

>Рис. 12 Середні значення змінних

У таблиці «>Средних значень» ми можемо простежити, яким структурам віддається найбільший пріоритет у розподілі грошових витрат і заощаджень населення.

Передусім слід зазначити, що високий пріоритет у всіх галузях віддається купівлі товарів хороших і оплаті послуг. Більше значення параметр приймає в 3 кластері.

2 його місце займає приріст фінансових активів. Найбільше значення один кластері.

Найменший коефіцієнт один і 2кластерах у «придбання нерухомості», а 3 кластері виявлено помітне зменшення грошей на руках населення.

У цілому нині особливе значення населенню має купівля товарів хороших і послуги і не дуже купівля нерухомості.

4) порівняти отриману класифікацію з результатами застосування алгоритму внутрішньогрупових зв'язків.

У аналізі міжгрупових зв'язків ситуація мало змінилася, крім Тамбовської області, що з 2 кластера потрапила до1.(Рис.13)

>Рис. 13 Аналіз внутрішньогрупових зв'язків

У таблиці «>Средних значень» жодних змін цього не сталося.

Глава 3. Факторний аналіз

Завдання: Аналіз підприємств легку промисловість.

Є дані обстежень 20 підприємств легку промисловість (>Рис. 14) за такими характерним ознаками:

·Х1 – рівень фондовіддачі;

· Х2 – трудомісткість одиниці виробленої продукції;

· Х3 – питому вагу закупівельних матеріалів загальних витратах;

·Х4 – коефіцієнт змінності устаткування;

· Х5 – премії і винагороди одному працівникові;

·Х6 – питому вагу збитків шлюбу;

·Х7 – середньорічна вартість основних виробничих фондів;

·Х8 – середньорічний фонд зарплати;

·Х9 – рівень можливості бути реалізованим продукції;

·Х10 – індекс постійного активу (ставлення основних засобів та іншівнеоборотних активів до власним засобам);

·Х11 – оборотність оборотних засобів;

·Х12 – невиробничі витрати.


>Рис.14 Вихідні дані

Потрібна:

1. провести факторний аналіз наступних змінних: 1,3,5-7, 9, 11,12, виявити й інтерпретувати факторні ознаки;

2. вказати найблагополучніші і перспективні підприємства.

Виконання:

1. Провести факторний аналіз наступних змінних: 1,3,5-7, 9, 11,12, виявити й інтерпретувати факторні ознаки.

Факторний аналіз – це сукупність методів, котрі з основі реальних зв'язків об'єктів (ознак) дозволяють виявити латентні (неявні) узагальнюючі характеристики організаційної структури.

У діалоговому вікні факторного аналізу вибираємо наші перемінні, указуємо необхідні параметри.


>Рис. 15 Повна пояснена дисперсія

По таблиці «Цілковитою поясненої дисперсії» видно, що виділені 3 чинника, в яких розтлумачувалося 74,8 % варіацій змінних – побудована модель досить хороша.

Тепер інтерпретуємо факторні ознаки по «Матриці повернених компонент»: (>Рис.16).

>Рис. 16 Матриця повернених компонент

Чинник 1 найтісніше пов'язані з рівнем реалізації продуктів і має протилежну залежність від невиробничих витрат.

Чинник 2 найтісніше пов'язані з питому вагу закупівельних матеріалів загальних витратах і питому вагу збитків шлюби й має протилежну залежність від премій і винагород одному працівникові.

Чинник 3 найтісніше пов'язані з рівнем фондовіддачі і оборотність обігових коштів та

Страница 1 из 2 | Следующая страница

Схожі реферати:

Нові надходження

Замовлення реферату

Реклама

Навігація