logo

Середнє значення, дисперсія та стандартне відхилення

Середнє значення, дисперсія та стандартне відхилення є життєво важливими статистичними показниками. Дисперсія кількісно визначає відхилення точки даних від середнього, тоді як стандартне відхилення вимірює розподіл даних. Ключова відмінність полягає в тому, що стандартне відхилення вимірюється в тих самих одиницях, що й середнє, тоді як дисперсія виражається в квадратичних одиницях. Пориньте глибше в ці концепції з визначеннями, формулами та наочним прикладом.

Середній

Середній є середнім для заданого набору даних. Розглянемо наведений нижче приклад



2, 4, 4, 4, 5, 5, 7, 9

Ці вісім точок даних мають середнє (середнє) значення 5:

frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5.

Формула: mu=frac{sum_{i=1}^{N} x_{i}}{N}

Де? є середнім і х1, х2, х3…., хiє елементами. Також зауважте, що середнє іноді позначається egin{масив}{lll} (2-5)^2 = (-3)^2 = 9 && (5-5)^2 = 0^2 = 0  (4-5)^2 = (- 1)^2 = 1 && (5-5)^2 = 0^2 = 0  (4-5)^2 = (-1)^2 = 1 && (7-5)^2 = 2^2 = 4  (4-5)^2 = (-1)^2 = 1 && (9-5)^2 = 4^2 = 16.  end{array}

Дисперсія

Дисперсія це сума квадратів різниць між усіма числами та середніми значеннями.
Відхилення для прикладу вище. Спочатку обчисліть відхилення кожної точки даних від середнього значення та зведіть результат для кожного:

Формула: sigma^{2}= frac { sum_{i=1}^{N} (x_{i}-mu)^{2}}{N}

дисперсія = 	extup{Коефіцієнт варіації} =frac{ 	extup{Стандартне відхилення}}{Середнє}*100= 4.



Де? є середнім, N є загальною кількістю елементів або частотою розподілу.


Стандартне відхилення

Стандартне відхилення є квадратним коренем з дисперсії. Це міра, до якої дані відрізняються від середнього.

Стандартне відхилення (для даних вище) = = 2

Чому математики вибрали квадрат, а потім квадратний корінь, щоб знайти відхилення, чому б просто не взяти різницю значень?
Однією з причин є те, що сума різниць стає 0 згідно з визначенням середнього. Сума абсолютних різниць може бути варіантом, але з абсолютними різницями було важко довести багато хороших теорем. [Джерело: Відеолекція MIT о 1:19]



  1. Значення стандартного відхилення дорівнює 0, якщо всі записи у вхідних даних однакові.
  2. Якщо ми додаємо (або віднімаємо) число, наприклад 7, до всіх значень у вхідному наборі, середнє значення збільшується (або зменшується) на 7, але стандартне відхилення не змінюється.
  3. Якщо ми помножимо всі значення у вхідному наборі на число 7, і середнє, і стандартне відхилення буде помножено на 7. Але якщо ми помножимо всі вхідні значення на від’ємне число, скажімо на -7, середнє значення помножиться на -7, але стандартне відхилення множиться на 7.
  4. Стандартне відхилення та дисперсія – це міра, яка показує, наскільки розкидані числа. У той час як дисперсія дає вам приблизне уявлення про поширення, стандартне відхилення є більш конкретним, дає вам точні відстані від середнього.
  5. Середнє значення, медіана та мода є мірою центральної тенденції даних (згрупованих чи незгрупованих).

перевірити:

  • Дисперсія та стандартне відхилення
  • Застосування стандартного відхилення в реальному житті
  • Різниця між дисперсією та стандартним відхиленням

Нижче наведено запитання, які ставилися на іспитах GATE попереднього року Література:
https://en.wikipedia.org/wiki/Standard_deviation
http://staff.argyll.epsb.ca/jreed/math30p/statistics/standardDeviation.htm

Середнє значення, дисперсія та стандартне відхилення – поширені запитання

Яка різниця між стандартним відхиленням і дисперсією?

Стандартне відхилення та дисперсія вимірюють розкид точок даних у наборі даних відносно середнього значення. Ключова відмінність полягає в тому, що дисперсія вимірює середнє квадратичних відхилень від середнього, тоді як стандартне відхилення є квадратним коренем із дисперсії, забезпечуючи міру розповсюдження в тих самих одиницях, що й дані.



Як обчислити середнє значення, дисперсію та стандартне відхилення?

  • Середнє: додайте всі числа разом і поділіть на кількість чисел.
  • Дисперсія: обчисліть середнє значення, відніміть середнє від кожного числа, зведіть результат у квадрат, підсумуйте ці результати в квадраті та поділіть на кількість чисел мінус один.
  • Стандартне відхилення: витягніть квадратний корінь із дисперсії.

Чому середнє значення, дисперсія та стандартне відхилення важливі?

Ці статистичні показники мають вирішальне значення для розуміння розподілу даних. Середнє значення забезпечує центральне значення, тоді як дисперсія та стандартне відхилення дають уявлення про мінливість або розповсюдження даних, вказуючи на узгодженість або мінливість набору даних.

Чи можуть дисперсія та стандартне відхилення бути від’ємними?

Ні, дисперсія та стандартне відхилення не можуть бути від’ємними. Дисперсія розраховується як середнє квадратів відмінностей від середнього, що призводить до невід’ємного значення. Оскільки стандартне відхилення є квадратним коренем із дисперсії, воно також не може бути від’ємним.

Як викиди впливають на середнє значення, дисперсію та стандартне відхилення?

Викиди можуть значно вплинути на середнє, підтягуючи його до значення викиду, таким чином не точно відображаючи центральну тенденцію набору даних. Дисперсія та стандартне відхилення також впливають, оскільки вони збільшаться, вказуючи на більший розкид даних через викид(и).