Реферат Кореляційний аналіз

Страница 1 из 3 | Следующая страница

>КУРСОВАЯ РОБОТА

 

Тема: Кореляційний аналіз

Завдання:Рассчитать повнимфакторним експериментом вплив тиску, жирності і кислотності на якість продукції


>СОДЕРЖАНИЕ

 

Запровадження

1. Кореляційний аналіз

1.1 Поняття кореляційної зв'язку

1.2 Загальна класифікація кореляційних зв'язків

1.3Корреляционние поля і чітку мету їх побудови

1.4 Етапи кореляційного аналізу

1.5 Коефіцієнти кореляції

1.6Нормированний коефіцієнт кореляціїБраве-Пирсона

1.7 Коефіцієнт ранговій кореляціїСпирмена

1.8 Основні властивості коефіцієнтів кореляції

1.9 Перевірка значимості коефіцієнтів кореляції

1.10 Критичні значення коефіцієнта парної кореляції

2. Планування багаточинникового експерименту

2.1 Умова завдання

2.2 Визначення центр плану (основний рівень) й досяг рівня варіювання чинників

2.3 Побудова матриці планування

2.4 Перевірка однорідності дисперсії іравноточности виміру перетворилася на різних серіях

2.5 Коефіцієнти рівняння регресії

2.6Дисперсия відтворюваності

2.7 Перевірка значимості коефіцієнтів рівняння регресії

2.8 Перевірка адекватності рівняння регресії

Укладання

Список літератури


ЗАПРОВАДЖЕННЯ

 

Планування експерименту - математико-статистична дисципліна, вивчає методи раціональної організації експериментальних досліджень — від оптимального вибору досліджуваних факторів, і визначення власне плану експерименту відповідно до метою до методів аналізу результатів. Початок планування експерименту поклали праці англійського статистика Р.Фішера (1935),подчеркнувшего, раціональне планування експерименту дає щонайменше суттєву перевагу з точністю оцінок, ніж оптимальна обробка результатів вимірів. У 60-ті роки 20 століття склалася сучасна теорія планування експерименту. Її методи тісно пов'язані з теорією наближення функцій і математичним програмуванням. Побудовано оптимальні плани й досліджувано їх властивості для широкого класу моделей.

Планування експерименту – вибір плану експерименту, задовольняючого заданим вимогам, сукупність дій вкладених у розробку стратегії експериментування (від отримання апріорній інформації до отримання працездатною математичну модель чи визначення оптимальних умов). Це цілеспрямоване управління експериментом, реалізоване за умов неповного знання механізму досліджуваного явища.

У процесі вимірів, наступної обробки даних, і навіть формалізації успіхів у вигляді математичну модель, виникають похибки і втрачається частина інформації, котра міститься у вихідних даних. Застосування методів планування експерименту дозволяє визначити похибка математичну модель і будувати висновки про її адекватності. Якщо точність моделі виявляється недостатньою, застосування методів планування експерименту дозволяє модернізувати математичну модель одночасно з проведенням додаткових дослідів без втрати попередньої інформації та з мінімальними витратами.

Мета планування експерименту – перебування таких умов і здійснення дослідів у яких вдасться одержати надійну і достовірну інформацію об'єкт з найменшою витратою праці, і навіть зміг уявити цю інформацію в компактній й дорогими зручними формі з кількісної оцінкою точності.

Серед основних методів планування, застосовуваних різними етапах дослідження, використовують:

- планування відсіює експерименту, основне значення виділення із усієї сукупності чинників групи істотних чинників, які підлягають подальшому детальному вивченню;

- планування експерименту длядисперсионного аналізу, тобто. складання планів для об'єктів із якісними чинниками;

- планування регресійного експерименту, що дозволяє отримувати регресивні моделі (>полиномиальние й інші);

- планування екстремального експерименту, у якому головним завданням – експериментальна оптимізація об'єкта дослідження;

- планування щодо динамічних процесів тощо.

Метою вивчення дисципліни є підготування студентів до виробничо-технічної діяльності з спеціальності із застосуванням методів теорії планування і сучасних інформаційних технологій.

Завдання дисципліни: вивчення сучасних методів планування, організації та оптимізації наукового і промислового експерименту, проведення і методи обробки отриманих результатів.


1.КОРРЕЛЯЦИОННЫЙ АНАЛІЗ

 

1.1 Поняття кореляційної зв'язку

 

>Исследователя нерідко цікавить, як пов'язані між собою два чи більше змінних лише у чи навіть кількох досліджуваних вибірках. Наприклад, чи може зростання проводити вагу людини чи чи може тиск проводити якість продукції?

Такі залежність між перемінними величинами називається кореляційної, чи кореляцією.Корреляционная зв'язок - це узгоджене зміна двох ознак, що відбиває те що, що мінливість одного ознаки перебуває у відповідність до мінливістю іншого.

Відомо, наприклад, що у середньому між зростанням покупців, безліч їх вагою спостерігається позитивна зв'язок, і такі, чим більше зростання, то більше вписувалося вагу людини. Проте від цього правила є винятку, коли щодо низькі люди мають зайва вага, і, навпаки,астеники, за високого зросту мають малу. Причиною подібних винятків і те, кожен біологічний, фізіологічний чи психологічний ознака визначається впливом багатьох чинників:средових, генетичних, соціальних, екологічних та т.д.

>Корреляционние зв'язку - це імовірнісні зміни, які можна вивчати лише з представницьких вибірках методами математичної статистики. Обидва терміна - кореляційна зв'язок і кореляційна залежність - часто використовують як синоніми. Залежність передбачає вплив, зв'язок - будь-які узгоджені зміни, які можуть опинитися пояснюватися сотнями причин.Корреляционние зв'язку що неспроможні розглядатися провісниками причинно-наслідкової залежності, вони свідчать лише у тому, що змін одного ознаки, зазвичай, супроводжують певні зміни щодо іншого.

>Корреляционная залежність - це зміни, які роблять значення одного ознаки у можливість появи різних значень іншого ознаки.

Завдання кореляційного аналізу зводиться до встановлення напрями (позитивне чи негативне) і форми (лінійна, нелінійна) зв'язок міжварьирующими ознаками, виміру її тісноти, і, нарешті, до перевірки рівня значимості отриманих коефіцієнтів кореляції.

>Корреляционние зв'язку різняться формою, напрямку і рівня (силі).

За формою кореляційна зв'язок то, можливо прямолінійною чи криволінійної.Прямолинейной то, можливо, наприклад, зв'язок між кількістю тренувань на тренажері і пишатися кількістю правильно розв'язуваних завдань у контрольній сесії.Криволинейной то, можливо, наприклад, зв'язок між рівнем мотивації і ефективністю виконання завдання (малюнок 1). При підвищенні мотивації ефективність виконання завдання спочатку зростає, потім досягається оптимальний рівень мотивації, якому відповідав би максимальна ефективність виконання завдання; подальшого підвищення мотивації супроводжує вже зниження ефективності.

Малюнок 1 - Зв'язок між ефективністю виконання завдання і силою мотиваційної тенденції

По напрямку кореляційна зв'язок то, можливо позитивної ("прямий") й негативним ("зворотної"). При позитивної прямолінійною кореляції вищим значенням одного ознаки відповідають вищі значення іншого, причому більше низьким значенням одного ознаки - низькі значення іншого (малюнок 2). При негативною кореляції співвідношення зворотні (малюнок 3). При позитивної кореляції коефіцієнт кореляції має позитивний знак, при негативною кореляції - негативнийзнак[1].

Малюнок 2 – Пряма кореляція

 

Малюнок 3 – Зворотний кореляція


Малюнок 4 – Відсутність кореляції

Ступінь, сила чи тіснота кореляційної зв'язку визначається за величиною коефіцієнта кореляції. Сила зв'язку залежить від її спрямованості й з абсолютного значенням коефіцієнта кореляції.

1.2 Загальна класифікація кореляційних зв'язків

 

Залежно від коефіцієнта кореляції розрізняють такі кореляційні зв'язку:

- сильна, чи тісний при коефіцієнті кореляціїr>0,70;

- середня (при0,50<r<0,69);

- помірна (при0,30<r<0,49);

- слабка (при0,20<r<0,29);

- дуже слабка (приr<0,19).

 

1.3Корреляционние поля і чітку мету їх побудови

Кореляція вивчається виходячи з експериментальних даних, що становлять обмірювані значення (xі, yі) двох ознак. Якщо експериментальних даних трохи, то двовимірне емпіричне розподіл представляється як подвійного низки значень xі і yі. У цьому кореляційну залежність між ознаками можна описувати у різний спосіб. Відповідність між аргументом і функцією то, можливо поставлено таблицею, формулою, графіком тощо. буд.

Кореляційний аналіз, як та інші статистичні методи, грунтується на використанні ймовірнісних моделей, що описують поведінка досліджуваних ознак у певній генеральної сукупності, з якої отримані експериментальні значення xі і yі. Коли досліджується кореляція між кількісними ознаками, значення яких не складно виміряти в одиницях метричних шкал (метри, секунди, кілограми тощо.), тут ми дуже часто приймається модельдвумерной нормально розподіленої генеральної сукупності. У такій моделі відображає залежність між перемінними величинами xі і yі графічно як геометричного місця точок у системі прямокутних координат. Цю графічну залежність називаються також діаграмою розсіювання чикорреляционним полем.
Ця модельдвумерного нормального розподілу (>корреляционное полі) дозволяє дати наочну графічну інтерпретацію коефіцієнта кореляції,т.к. розподіл разом залежить від п'яти параметрів:x,y – середні значення (математичні очікування);x,>y – стандартні відхилення випадкових величин Х і Y і р – коефіцієнт кореляції, що є мірою зв'язок між випадковими величинами Х і Y.
Якщо р = 0, то значення, xі, yі, отримані здвумерной нормальної сукупності, розташовуються на графіці в координатах x, у не більше області, обмеженою окружністю (малюнок 5, а). І тут між випадковими величинами Х і Y відсутня кореляція і вони називаютьсянекоррелированними. Длядвумерного нормального розподілунекоррелированность означає це й незалежність випадкових величин Х і Y.


Малюнок 5 - Графічна інтерпретація взаємозв'язку між показниками

Якщо р = 1 чи р = -1, то між випадковими величинами Х і Y існує лінійна функціональна залежність (Y = з +dX). І тут говорять про повної кореляції. При р = 1 значення xі, yі визначають точки, що лежать на прямий лінії, має позитивний нахил (зі збільшенням xі значення yі також збільшуються), при р = -1 пряма має негативний нахил (малюнок 5, б). У проміжних випадках (-1 <p < 1) точки, відповідні значеннямxi, yі, потрапляють у область, обмежену деякимеллипсом (малюнок 5, в, р), причому приp > 0 має місце позитивна кореляція (зі збільшенням xі значення yі мають тенденцію до зростання), приp < 0 кореляція негативна. Чим ближче до р до , тим вже еліпс і тих тісніше експериментальні значення групуються близько прямий лінії. Тут же звернути увагу, що лінію, вздовж якої групуються точки, може бути лише прямою, а мати будь-яку іншу форму: парабола, гіпербола тощо. буд. У таких випадках ми розглядали б отак звану, нелінійну (чикриволинейную) кореляцію (>риунок 5, буд).

Отже, візуальний аналіз кореляційного поля допомагає виявити як наявності статистичної залежності (лінійну чи нелінійну) між досліджуваними ознаками, але її тисняву форму. Це має важливе значення у наступний крок в аналізіѕ вибору і обчислення відповідного коефіцієнта кореляції.

>Корреляционную залежність між ознаками можна описувати у різний спосіб. Зокрема, будь-яка форма зв'язку має рівнянням загального виду Y =f(X), де ознака Y – залежна змінна, чи функція від незалежної перемінної X, званої аргументом. Відповідність між аргументом і функцією то, можливо поставлено таблицею, формулою, графіком тощо.д.[2]

1.4Етапи кореляційного аналізу

 

Практична реалізація кореляційного аналізу входять такі етапи:

а) завдання і вибір ознак;

б) збирання інформації та її первинна обробка (угруповання, виняток аномальних спостережень, перевірка нормальності одномірного розподілу);

в) попередня характеристика взаємозв'язків (аналітичні угруповання, графіки);

р) усуненнямультиколлинеарности (взаємозалежності чинників) і уточнення набору показників шляхом розрахунку парних коефіцієнтів кореляції;

буд) дослідженняфакторной залежності і перевірка її значимості;

е) оцінка результатів аналізу та підготовка рекомендацій з їхньої практичномуиспользованию[3].


1.5Коефіцієнти кореляції

 

Коефіцієнти кореляції усталена в математичної статистиці характеристикою зв'язок між двома випадковими величинами. Коефіцієнт кореляції - показник ступеня взаємозалежності, статистичної зв'язку двох змінних; змінюється не більше від -1 до +1. Значення коефіцієнта кореляції 0 свідчить про можливе відсутність залежності, значення +1 свідчить про узгодженості змінних.

Розрізняють такі коефіцієнти кореляції:

-дихотомический - показник зв'язку ознак (змінних) вимірюваних подихотомическим шкалам найменувань;

- Пірсона (Pearsonproduct-momentcorrelation) - коефіцієнт кореляції, використовуваний дляконтинуальних змінних;

- ранговій кореляціїСпирмена (>Spearmen'srank-ordercorrelation) - коефіцієнт кореляції для змінних, вимірюваних в порядкових (рангових) шкалах;

-точечно-бисериальной кореляції (>point-biserialcorrelation) - коефіцієнт кореляції, застосовуваний у разі аналізу відносини змінних, одній із яких виміряти в континуальної шкалою, іншу - у суворо дихотомічної шкалою найменувань;

- j - коефіцієнт кореляції, вживаний у разі, якщо обидві перемінні обмірювані в дихотомічної шкалою найменувань.

-тетрахорический (>четирехпольний) (>tetrachoric) - коефіцієнт кореляції, вживаний у разі, якщо обидві перемінні обмірювані вконтинуальнихшкалах[4].

>Линейная зв'язок між перемінними Xі і Xj оцінюється коефіцієнтом кореляції:

,


де Xі і Xj – досліджувані перемінні;mXі іmXj – математичні очікування змінних;X іX – дисперсії змінних.

Вибірковий коефіцієнт кореляції визначають за такою формулою:

,

чи з реформованій формулі:

,

де і =1, 2, ..., n, j = 1, 2, ...,m, u = 1, 2, ..., N; N – числоопитов(объем вибірки); xі, xj – оцінки математичних очікувань; P.S>Xi, P.S>Xj – оцінкисреднеквадратических відхилень.

Тільки за спільної нормальноїраспределенности досліджуваних випадкових величин Xі і Xj коефіцієнт кореляції існує певна сенс зв'язок між перемінними. Інакше коефіцієнт кореляції може лише побічно характеризувати цюсвязь[5].

1.6>Нормированний коефіцієнт кореляціїБраве-Пирсона

 

Як оцінки генерального коефіцієнта кореляції р використовується коефіцієнт кореляціїrБраве-Пирсона. На його визначення приймається припущення щодо двовимірному нормальному розподілі генеральної сукупності, з якої отримані експериментальні дані. Це перевірене з допомогою відповідних критеріїв значимості. Слід зазначити, що й окремо одномірні емпіричні розподілу значень xі і yі узгоджуються з розподілом, те з цього ще слід, що двовимірне розподіл буде нормальним. Для такого укладання потрібен ще перевірити припущення щодо лінійності зв'язок між випадковими величинами Х і Y. У принципі, для обчислення коефіцієнта кореляції достатньо тільки прийняти припущення щодо лінійності зв'язок між випадковими величинами, і розрахована коефіцієнт кореляції буде мірою цієї лінійної зв'язку.
 Коефіцієнт кореляціїБраве–Пирсона () належить допараметрическим коефіцієнтам й у практичних розрахунків обчислюється за такою формулою:

З формули видно, що з обчислення необхідно знайти середні значення ознак Х і Y, і навіть відхилення кожного статистичного даного з його середнього . Знаючи цих значень, перебувають суми . Потім, зрозумівши значення , необхідно визначити достовірність знайденого коефіцієнта кореляції, порівнявши його фактичне значення зтабличним дляf = n –2. Якщо , можна говорити, що ознаками спостерігається достовірна взаємозв'язок. Якщо , то між ознаками спостерігається недостовірна кореляційнавзаимосвязь[2].

Приклад 1. 10 студентам було дано тести на наочно-образне і вербальне мислення. Вимірювалося середнє час вирішення завдань тесту в секундах.Исследователя цікавить питання: може бути взаємозв'язок між часом вирішення завдань?Переменная X — позначає середнє час вирішеннянаглядно-образних, а змінна Y— середнє час вирішення вербальних завдань тестів.

Рішення. Уявімо вихідні дані як таблиці 4, у якій запроваджені додаткові стовпчики, необхідних розрахунку за такою формулою.

Таблиця 1 – Умови завдання

№ піддослідних

x

Страница 1 из 3 | Следующая страница

Схожі реферати:

Навігація