logo

Дисперсія

Дисперсія це значення вимірювання, яке використовується для визначення того, як дані розподіляються відносно середнього або середнього значення набору даних. Він використовується для визначення того, як розподілені дані відносно середнього або середнього значення. Символом, який використовується для визначення дисперсії, є σ2. Це квадрат стандартного відхилення.

У статистиці використовуються два типи дисперсії:



  • Дисперсія вибірки
  • Дисперсія популяції

Дисперсія сукупності використовується для визначення того, як кожна точка даних у конкретній генеральній сукупності коливається або розподіляється, тоді як дисперсія вибірки використовується для визначення середнього квадратичного відхилення від середнього значення.

У цій статті ми дізнаємося про Дисперсія (вибірка, сукупність), їх формули, властивості та ін.

Зміст



Що таке дисперсія?

Ми вимірюємо різні значення даних, і ці значення використовуються для різних цілей. Дані можуть надаватися як згруповані дані двох типів або незгруповані (дискретні) дані. Якщо дані подано у формі інтервалів класу, це називається згрупованими даними, тоді як якщо дані подано у формі однієї точки даних, їх називають дискретною або незгрупованою точкою даних. Дисперсія – це міра дисперсії даних щодо середнього значення даних. Він повідомляє нам, як дані розподілені в даному значенні даних. Ми можемо легко обчислити дисперсію вибірки та дисперсію сукупності як для згрупованих, так і для незгрупованих даних.

Визначення дисперсії

Дисперсія це статистичний показник, який кількісно визначає розкид або дисперсію набору точок даних. Він вказує, наскільки окремі точки даних у наборі даних відрізняються від середнього (середнього) набору даних

Типи дисперсії

Ми можемо визначити дисперсію наведених даних двома типами,



  • Дисперсія популяції
  • Дисперсія вибірки

Тепер дізнаємося про них докладніше.

Дисперсія популяції

Дисперсія сукупності використовується для визначення поширення даної генеральної сукупності. Населення визначається як група людей, і всі люди в цій групі є частиною населення. Він говорить нам про те, як чисельність групи змінюється відносно середньої чисельності.

Усі члени групи називаються населенням. Коли ми хочемо знайти, як кожна точка даних у певній генеральній сукупності змінюється або розподіляється, ми використовуємо дисперсію генеральної сукупності. Він використовується для визначення квадрата відстані кожної точки даних від середнього значення сукупності.

Дисперсія вибірки

Якщо дані про сукупність дуже великі, стає важко обчислити дисперсію сукупності набору даних. У такому випадку ми беремо вибірку даних із заданого набору даних і знаходимо дисперсію цього набору даних, яка називається дисперсією вибірки. Під час обчислення вибіркового середнього значення ми обов’язково обчислюємо вибіркове середнє, тобто середнє значення вибіркового набору даних, а не середнє значення сукупності. Ми можемо визначити вибіркову дисперсію як середнє квадрата різниці між точкою вибіркових даних і вибірковим середнім.

Символ дисперсії

Символ дисперсії зазвичай позначається грецькою літерою сигма в квадраті (σ²), коли йдеться про дисперсію сукупності. Для дисперсії вибірки її часто позначають s².

Приклад дисперсії

Ми можемо зрозуміти концепцію дисперсії за допомогою прикладу, розглянутого нижче.

Знайдіть дисперсію сукупності даних {4,6,8,10}

рішення:

Середнє = (4+6+8+10)/4 = 7

4 (4-7)2 9
6 (6-7)2 1
8 (8-7)2 1
10 (10-7)2 9

Дисперсія = (9+1+1+9)/4 = 20/4 = 5

Таким чином, дисперсія даних дорівнює 5

Формула дисперсії

Дисперсія для набору даних позначається символом σ2. Для даних про населення його формула дорівнює сумі квадратів різниць записів даних від середнього значення, поділених на кількість записів. Тоді як для зразкових даних ми ділимо значення чисельника на різницю між кількістю записів і одиницею.

Зразок формули дисперсії

Якщо набір даних є вибіркою, формула дисперсії визначається як

стор 2 = ∑ (x i – x̄) 2 /(n – 1)

де,

  • х є середнім значенням вибіркового набору даних
  • п – загальна кількість спостережень

Формула дисперсії населення

Якщо у нас є набір даних про населення, формула записується так:

стор 2 = ∑ (x i – x̄) 2

де,

  • х це середнє значення набору даних про населення
  • п – загальна кількість спостережень

Ми також можемо обчислити дисперсію для згрупованих і незгрупованих наборів даних. Різні формули для дисперсії:

що таке awt

Формула дисперсії для згрупованих даних

Для згрупованих даних формула дисперсії обговорюється нижче,

Зразкова формула дисперсії для згрупованих даних (σ 2 ) = ∑ f(m i – x̄) 2 /(n-1)

Формула дисперсії сукупності для згрупованих даних (стор 2 ) = ∑ f(m i – x̄) 2

де,

  • f є частотою кожного інтервалу
  • м i є серединою iтисінтервал
  • х є середнім значенням згрупованих даних

Для згрупованих даних середнє значення обчислюється як

Середнє = ∑ (f i х i ) / ∑ f i

Формула дисперсії для незгрупованих даних

Для незгрупованих даних формула дисперсії обговорюється нижче,

  • Зразок формули дисперсії для незгрупованих даних (стор 2 ) = ∑ (x i – x̄) 2 /(n-1)
  • Формула дисперсії сукупності для незгрупованих даних (стор 2 ) = ∑ (x i – x̄) 2

де х є середнім значенням згрупованих даних

Формула для обчислення дисперсії

Формула, яка використовується для обчислення дисперсії, обговорюється на зображенні нижче,

Формула дисперсії

Як обчислити дисперсію?

Загалом дисперсія означає стандартну дисперсію сукупності. Етапи обчислення дисперсії заданого набору значень:

Крок 1: Обчисліть середнє значення спостереження за формулою (середнє значення = сума спостережень/кількість спостережень)

Крок 2: Обчисліть квадрат різниці значень даних від середнього. (Значення даних – середнє)2

крок 3: Обчисліть середнє квадратів різниць заданих значень, які називаються дисперсією набору даних.

(Відхилення = сума квадратів різниць / кількість спостережень)

Дисперсія та стандартне відхилення

Дисперсія і Стандартне відхилення обидва є показниками центральної тенденції, яка використовується для того, щоб повідомити нам про ступінь відхилення значень набору даних відносно центрального або середнього значення набору даних.

Для будь-якого заданого набору даних існує певний зв’язок між дисперсією та стандартним відхиленням.

Дисперсія = (стандартне відхилення) 2

Дисперсія визначається як квадрат стандартного відхилення, тобто взяття квадрата стандартного відхилення для будь-якої групи даних дає нам дисперсію цього набору даних. дисперсія визначається за допомогою символу стор 2 тоді як стор використовується для визначення стандартного відхилення набору даних. Дисперсія набору даних виражається в квадратичних одиницях, тоді як стандартне відхилення набору даних виражається в одиницях, подібних до середнього значення набору даних.

Вивчайте більше: Дисперсія та стандартне відхилення

Дисперсія біноміального розподілу

Біноміальний розподіл це дискретний розподіл ймовірностей, який повідомляє нам кількість позитивних результатів у біноміальному експерименті, виконаному n кількість разів. Результатом біноміального експерименту є 0 або 1, тобто позитивний або негативний.

У біноміальному експерименті п випробувань і де вказано ймовірність кожного випробування стор , тоді дисперсія біноміального розподілу визначається за допомогою

стор 2 = np (1 – p)

де 'наприклад' визначається як середнє значення біноміального розподілу.

Дисперсія розподілу Пуассона

Поширення отрути визначається як дискретний розподіл ймовірностей, який використовується для визначення ймовірності «n» кількості подій, що відбуваються протягом періоду «x». Середнє в розподілі Пуассона визначається символом л.

У розподілі Пуассона середнє значення та дисперсія даного набору даних рівні. Дисперсія розподілу Пуассона визначається за формулою

стор 2 = λ

Дисперсія рівномірного розподілу

У рівномірному розподілі дані розподілу ймовірностей є безперервними. Результат цих експериментів знаходиться в діапазоні між певною верхньою межею та конкретною нижньою межею, тому ці розподіли також називаються прямокутними розподілами. Якщо верхня межа або максимальна межа b і нижня межа або мінімальна межа є a, тоді дисперсія рівномірного розподілу обчислюється за формулою,

стор 2 = (1/12)(b – a) 2

Середнє значення рівномірного розподілу визначається за формулою

Середнє = (b + a) / 2

де,

  • b є верхньою межею рівномірного розподілу
  • a є нижньою межею рівномірного розподілу

Дисперсія та коваріація

Дисперсія набору даних визначає мінливість усіх значень набору даних відносно середнього значення набору даних. Коваріація говорить нам, як випадкові величини пов’язані одна з одною, і як зміна однієї змінної впливає на зміну інших змінних.

Коваріація може бути позитивною або негативною, позитивна коваріація означає, що обидві змінні рухаються в одному напрямку відносно середнього значення, тоді як негативна коваріація означає, що обидві змінні рухаються в протилежних напрямках відносно середнього значення.

Для двох випадкових величин x і y, де x є залежною змінною, а y є незалежною змінною, коваріація обчислюється за формулою, згаданою на зображенні нижче.

Формула коваріації

Властивості дисперсії

Дисперсія широко використовується в математиці, статистиці та інших галузях науки для різноманітних цілей. Дисперсія має різні властивості, які широко використовуються для вирішення різноманітних задач. Деякі з основних властивостей дисперсії:

  • Дисперсія набору даних є невід’ємною величиною, а нульове значення дисперсії означає, що всі значення набору даних рівні.
  • Більше значення дисперсії говорить нам про те, що всі значення даних набору даних широко розсіяні, тобто вони далеко від середнього значення набору даних.
  • Менше значення дисперсії говорить нам, що всі значення даних набору даних близькі одне до одного, тобто вони дуже близькі від середнього значення набору даних.

Для будь-якої константи 'c'

  • Var(x + c) = Var(x)

де х є випадковою величиною

  • Var(cx) = c2

де х є випадковою величиною

Крім того, якщо a і b є постійною величиною і х тоді є випадковою величиною,

  • Var(ax + b) = a2

Для незалежних змінних x1, х2, х3…,xпми це знаємо,

  • Де (x1+ х2+……+ хп) = Var(x1) + де (x2) +……..+Де(xп)

Люди також читають:

  • Середній
  • Режим
  • Різниця між дисперсією та стандартним відхиленням

Приклади формули дисперсії

Приклад 1: обчисліть дисперсію даних вибірки: 7, 11, 15, 19, 24.

рішення:

лямбда-функція java

У нас є дані 7, 11, 15, 19, 24

Знайти середнє значення даних.

x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2

Використовуючи формулу дисперсії, ми отримуємо,

стор2= ∑ (xi– x̄)2/(n – 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5 – 1)
= 176,8/4
= 44,2

Приклад 2: обчисліть кількість спостережень, якщо дисперсія даних дорівнює 12, а сума квадратів відмінностей даних від середнього становить 156.

рішення:

Ми маємо,

i– x̄)2= 156

стор2= 12

Використовуючи формулу дисперсії, ми отримуємо,

стор2= ∑ (xi– x̄)2

12 = 156/н

n = 156/12

n = 13

Приклад 3: обчисліть дисперсію для заданих даних

хi

fi

10 1
4 3
6 5
8 1

рішення:

Середнє (x̄) = ∑(fiхi)/∑(fi)

= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6

n = ∑(fi) = 1+3+5+1 = 10

хi

fi

fiхi

i– x̄)

i– x̄)2

fii– x̄)2

10 1 10 4 16 16
4 3 12 -2 4 12
6 5 30 0 0 0
8 1 8 2 4 8

тепер,

стор 2 = (∑ i п f i i – x̄) 2 /n)

= [(16 + 12 + 0 +8)/10]
= 3,6

Дисперсія (σ2) = 3,6

Приклад 4: Знайдіть дисперсію наступної таблиці даних

Клас

Частота

0-10 3
10-20 6
20-30 4
30-40 2
40-50 1

рішення:

Клас

Xi

fi

f×Xi

Xi – μ

(Xi – μ)2

f×(Xi – μ)2

0-10

5

3

п'ятнадцять

- п'ятнадцять

225

675

10-20

п'ятнадцять

6

імпорт сканера java

90

-5

25

150

20-30

25

4

100

5

25

100

30-40

35

2

70

п'ятнадцять

225

450

40-50

Чотири

1

Чотири

25

625

625

Всього

16

320

2000 рік

Середнє (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20

стор 2 = (∑ i п f i i – м) 2 /n)

= [(2000)/(16)]
= (125)

Дисперсія заданого набору даних становить 125.

Підсумок – відхилення

Дисперсія – це статистичний показник, який показує, наскільки значення в наборі даних відрізняються від середнього. Це допомагає нам зрозуміти поширення чи розсіювання точок даних. Є два основних типи дисперсії: дисперсія генеральної сукупності, яка вимірює, як розподіляються точки даних у цілій сукупності, і дисперсія вибірки, яка визначає, як розподіляються точки даних у вибірці. Дисперсія позначається σ² і є квадратом стандартного відхилення. Щоб обчислити дисперсію, ви знаходите середнє значення даних, віднімаєте середнє від кожної точки даних, зводите різниці в квадрат, а потім усереднюєте ці квадрати різниць. Розбіжність важлива, оскільки вона допомагає нам зрозуміти мінливість у наборі даних. Висока дисперсія вказує на те, що точки даних розкидані широко, тоді як низька дисперсія вказує на те, що вони близькі до середнього. Дисперсія завжди є невід’ємною, оскільки вона передбачає зведення різниць у квадрат.

Поширені запитання щодо Variance

Що таке дисперсія в статистиці?

Дисперсія визначається як розкид значень набору даних відносно середнього значення набору даних. Дисперсія набору даних показує, наскільки значення в певному наборі даних відрізняються від середнього значення.

Що таке символ дисперсії?

Використовуємо символи σ2, s2 і Var(x) для позначення дисперсії набору даних.

Що таке формула дисперсії?

Дисперсія набору даних обчислюється за формулою

стор 2 = E[( X – m ) 2 ]

Що говорить Variance?

Дисперсія використовується для визначення ступеня розкиду даних, тобто вона повідомляє нам, як значення в наборі даних розподіляються відносно середнього значення. Для більшого значення дисперсії значення мають широкий розкид відносно середнього значення, тоді як щодо меншого значення дисперсії значення мають близький розкид відносно середнього значення

Яке співвідношення між дисперсією та стандартним відхиленням?

Для заданого набору даних дисперсія набору даних є квадратом стандартного відхилення цього набору даних. Це відношення виражається як

Дисперсія = (стандартне відхилення) 2

Як обчислити дисперсію?

Щоб обчислити дисперсію, ви спочатку знаходите середнє (середнє) набору даних. Потім відніміть середнє від кожної точки даних і зведіть результат у квадрат. Нарешті, усередніть ці квадрати різниць.

Чому дисперсія важлива?

Дисперсія має вирішальне значення для розуміння розподілу даних у наборі даних. Це допомагає визначити, наскільки точки даних відрізняються від середнього значення, вказуючи на мінливість або узгодженість даних.

Яка різниця між дисперсією та стандартним відхиленням?

Хоча як дисперсія, так і стандартне відхилення вимірюють дисперсію даних, стандартне відхилення є квадратним коренем із дисперсії. Стандартне відхилення виражається в тих самих одиницях, що й дані, що робить його більш зручним для вказівки розкиду.

Чи може дисперсія бути негативною?

Ні, дисперсія не може бути негативною. Оскільки воно обчислюється як середнє квадратів різниць із середнім значенням, отримане значення завжди невід’ємне.