Вивчаєте статистику? Тоді ви, мабуть, чули фразу «нормальний розподіл» під час опису даних. Але як щодо фрази «перекошено вправо»? Як виглядає праворуч гістограма? І що це викликає?
У цій статті ми наводимо вам приклади гістограм зі зміщенням вправо та пояснюємо, чим вони відрізняються від графіків звичайного розподілу.
Основне зображення: Моніка Плейс /Wikimedia Commons
Що таке нормальний розподіл?
Перш ніж пояснювати, що означає правильний перекіс даних, давайте розглянемо визначення нормального розподілу.
При нормальному розподілі, дві або більше змінних мають прямий зв’язок, щоб зробити a симетричний набір даних , на якому ліва половина відображає праву половину. Ці графіки називаються дзвонові криві завдяки чітко вираженій дзвоноподібній формі:
На нормальному графіку розподілу середнє (середнє), медіана та мода рівні . Усі ці точки представляють центр даних або вершину графіка.
Що означає перекіс праворуч?
Хоча нормальний розподіл є однією з найпоширеніших форм розподілу, не всі набори даних відповідають цій базовій кривій. Іншими словами, деякі гістограми зміщені вправо або вліво .
За правого викривленого розподілу (також відомого як «позитивно викривлений» розподіл) більшість даних потрапляє праворуч або додатну сторону від піку графіка. Таким чином, гістограма перекошується таким чином, що її права сторона (або «хвіст») довша за ліву.
Приклад правосторонньої гістограми.
На правій гістограмі середнє значення, медіана та мода різні. У цьому випадку мода є найвищою точкою гістограми, тоді як медіана і середнє розташовуються праворуч від неї (або, візуально, праворуч від піку). Зауважте, що середня воля завжди бути праворуч від медіани .
Графік A зміщений вправо, а графік B зміщений вліво. На праворуч нахилених графіках середнє значення завжди знаходиться праворуч від моди (тобто піку). ( Asitgoes /Wikimedia Commons) )
Ці особливості в кінцевому підсумку роблять це важко призначити типове значення оскільки на правому графіку немає чіткої центральної точки. Навпаки, за нормального розподілу, оскільки середнє, медіана та мода однакові та знаходяться в центрі набору даних, ви можете легко використовувати це значення для більш точного узагальнення даних.
Що викликає гістограму з викривленням вправо?
Зазвичай дані перекошені вправо результат нижньої межі в наборі даних (тоді як дані, зміщені вліво, є результатом вищої межі). Отже, якщо нижні межі набору даних надзвичайно низькі відносно решти даних, це спричинить перекіс даних управо.
Ще однією причиною перекосу є ефекти запуску . Наприклад, якщо процедура спочатку має багато успіхів протягом тривалого періоду запуску, це може створити позитивну диспропорцію в даних. (З іншого боку, період запуску з кількома початковими відмовами може негативно спотворити дані.)