- Огляд функції CORREL
- Функція CORREL Синтаксис та входи:
- Що таке функція CORREL?
- Що таке коефіцієнт кореляції?
- Позитивна кореляція
- Негативна кореляція
- Немає кореляції
- Співвідношення - це не причинно -наслідковий зв'язок
- Як користуватися CORREL
- Функція CORREL у Google Таблицях
- додаткові нотатки
- Приклади CORREL у VBA
Завантажте зразок робочої книги
Цей підручник демонструє, як користуватися Функція Excel CORREL в Excel для розрахунку кореляції.
Огляд функції CORREL
Функція CORREL Обчислює кореляцію двох рядів чисел.
Щоб скористатися функцією робочого аркуша Excel CORREL, виберіть клітинку та введіть:
(Зверніть увагу, як виглядають вхідні дані формул)
Функція CORREL Синтаксис та входи:
1 | = CORREL (масив1, масив2) |
масив1 - масиви чисел.
Що таке функція CORREL?
Функція Excel CORREL повертає коефіцієнт кореляції (Пірсона r) двох діапазонів даних.
Що таке коефіцієнт кореляції?
Коефіцієнт кореляції, який зазвичай називають коефіцієнтом Пірсона r (названа на честь Карла Пірсона, людини, яка її розробила) - це статистика, яка розповідає вам, наскільки міцно пов'язані дві змінні.
Пірсона r -це цифра між -1 і 1, що може привести до трьох можливих інтерпретацій: позитивна кореляція, негативна кореляція та відсутність кореляції.
Позитивна кореляція
Позитивна кореляція (r > 0) означає, що коли дві змінні перебувають у тандемі - коли ви спостерігаєте високий бал в одній змінній, ви, як правило, також спостерігаєте високу оцінку в іншій. Так само, коли одна змінна низька, інша також має тенденцію бути низькою.
Наприклад, зростання і вага мають позитивну кореляцію. Дивіться таблицю нижче, на якій зображено зріст і вагу невеликої вибірки бейсболістів:
The r цієї невеликої вибірки становить 0,73 - дуже сильна позитивна кореляція. Це має логічний сенс - в середньому високі люди мають тенденцію бути важчими, оскільки цей додатковий зріст складається з кісток і м’язів та інших тканин, які все важать.
Але кореляція не є ідеальною (у ідеальній кореляції з r з 1, усі оцінки будуть падати на лінію тренду). Деякі низькі люди можуть бути важчими - можливо, вони несуть трохи зайвого жиру або займаються у тренажерному залі. Подібним чином, деякі високі люди можуть бути дуже худими і насправді важать менше, ніж багато низьких людей.
Кореляція тут, ймовірно, настільки висока, тому що ми маємо справу зі спортсменами, вона була б нижчою у загальній популяції. Пам’ятайте про це під час використання CORREL - r отримане вами не є остаточним - вам потрібно подумати про те, які у вас дані та як ви їх отримали, коли робите свої інтерпретації.
Негативна кореляція
Негативна кореляція (r <0) означає, що коли ви спостерігаєте високу оцінку в одній змінній, ви, як правило, спостерігаєте низьку оцінку в іншій змінній, і навпаки.
Наприклад, результати тестів учнів та кількість пропусків навчання у школі негативно корелюють. Тобто, чим більше днів вони пропускають, тим нижчі їхні бали. Чим менше днів вони пропускають, тим вищими є бали:
Знову ж таки, кореляція не є ідеальною (як вони майже ніколи не бувають). У нас тут один студент, який пропустив 5 днів, але все ж зумів набрати 85%. У нас також є той, хто набрав 52%, незважаючи на те, що пропустив лише два дні.
У нас все ще є чітка негативна тенденція. Але є ще багато відмінностей у результатах тестування, які неможливо пояснити лише відсутністю. Це може бути пов'язано з іншими змінами, такими як здатність, мотивація, здоров'я та багато інших потенційних факторів.
Тож, коли ви використовуєте CORREL, пам’ятайте, що існує більша картина, яку ваші дані можуть не повністю пояснити.
Немає кореляції
Немає кореляції (r = 0 або близький до 0) означає, що ви не можете передбачити оцінку однієї змінної на основі іншої. Якщо ви побудуєте дані, ви не побачите помітної тенденції, а лінія тренда буде рівною або майже плоскою.
Ось деякі дані про довжину безіменного пальця та IQ:
Як бачите, у цій вибірці немає зв’язку між цими двома змінними, тому ми можемо припустити, що вони не пов’язані між собою.
На практиці ви навряд чи отримаєте її r рівно 0. Пам’ятайте, що під час збору даних часто виникають певні відхилення через помилку, можливо, при вимірюванні чи звітності. Тому просто тому, що ти r не точно 0, це не означає, що ви щось знайшли.
Співвідношення - це не причинно -наслідковий зв'язок
Важливо мати на увазі, що CORREL не може сказати вам, яка змінна впливає на іншу - або навіть якщо взагалі існує якийсь причинно -наслідковий зв'язок між змінними. Наприклад, була виявлена кореляція між наступними змінними:
- Кількість проданого морозива та кількість насильницьких злочинів
- Наскільки ви щасливі та успішні у своїй кар’єрі
- Кількість людей, які потонули в басейні, і кількість фільмів, які Ніколас Кейдж з'являвся на рік
Перший приклад - це третя змінна проблема. Звичайно, морозиво не робить людей жорстокими, а також насильство не викликає тягу до замороженого молока та цукру. Третя змінна - погода. У спекотну погоду люди просто більше виходять на вулицю - між людьми стає більше контактів, а отже, збільшується ймовірність конфлікту. У спекотну погоду люди також купують більше морозива. Тож продажі морозива та насильницькі злочини корелюють лише тому, що обидва вони пов’язані з третьою змінною.
Другий може бути прикладом подвійна причинність. Успіх на роботі може бути корисним для вашого щастя - ви заробите більше грошей і загалом матимете більше контролю над тим, якою роботою ви займаєтесь і з ким її виконуєте. Але щастя також може бути корисним для успіху, можливо, щасливішим людям легше порозумітися і налагодити міцніші робочі стосунки, або, можливо, вони більш розумово стійкі до невдач. У цьому випадку обидві змінні впливають одна на одну.
Третій - це просто а хибна кореляція. Те, що дві змінні співвідносяться у ваших даних, не означає, що вони взаємодіють у реальному житті.
Суть полягає в тому, що кореляція не може сказати вам, чи є дві змінні причинно пов'язаними.
Як користуватися CORREL
Використовуйте функцію Excel CORREL так:
1 | = CORREL (B3: B15, C3: C15) |
За допомогою CORREL ви визначаєте два аргументи - два діапазони даних, які потрібно співвідносити.
Ось кілька ключових моментів, які слід пам’ятати про CORREL:
- Текстові, логічні (TRUE/FALSE) та порожні клітинки ігноруються.
- Обидва діапазони даних повинні мати рівну кількість точок даних, інакше ви отримаєте помилку #Н/Д
- Якщо один із діапазонів даних порожній, якщо у даних взагалі немає змін (тобто, якщо всі точки даних однакові), ви отримаєте #DIV/0! Помилка
Функція CORREL у Google Таблицях
Функція CORREL працює точно так само в Google Таблицях, як і в Excel:
додаткові нотатки
Приклади CORREL у VBA
Ви також можете використовувати функцію CORREL у VBA. Тип:application.worksheetfunction.correl (масив1, масив2)
Для аргументів функції (масив1 тощо) ви можете або ввести їх безпосередньо у функцію, або визначити змінні для використання замість них.
Повернення до списку всіх функцій Excel