Python є чудовою мовою для аналізу даних, насамперед через фантастичну екосистему, орієнтовану на дані Python пакети. панди є одним із таких пакетів і значно полегшує імпортування та аналіз даних.
Pandas DataFrame mean()
панди dataframe.mean() функція повертає середнє значення для запитуваної осі. Якщо метод застосовано до об’єкта серії pandas, тоді метод повертає скалярне значення, яке є середнім значенням усіх спостережень у Pandas Data Frame . Якщо метод застосовано до об’єкта Pandas Dataframe, тоді метод повертає a Серія панд об'єкт, який містить середнє значення по вказаній осі.
Синтаксис: DataFrame.mean(axis=0, skipna=True, level=None, numeric_only=False, **kwargs)
Параметри:
- вісь: {індекс (0), стовпці (1)}
- замовлення: Виключити значення NA/null під час обчислення результату
- рівень: Якщо вісь є MultiIndex (ієрархічна), підрахунок уздовж певного рівня, згортаючись у ряд
- тільки числове: Включати лише стовпці float, int, boolean. Якщо None, спробує використати все, а потім використовувати лише числові дані. Не реалізовано для серії.
Повернення: mean : Series або DataFrame (якщо вказано рівень)
приклади програм на python
Приклади Pandas DataFrame.mean().
приклад 1:
Використовуйте функцію mean(), щоб знайти середнє значення всіх спостережень на осі індексів.
Python # importing pandas as pd import pandas as pd # Creating the dataframe df = pd.DataFrame({'A':[12, 4, 5, 44, 1], 'B':[5, 2, 54, 3, 2], 'C':[20, 16, 7, 3, 8], 'D':[14, 3, 17, 2, 6]}) # Print the dataframe df>
Давайте скористаємося функцією Dataframe.mean(), щоб знайти середнє значення по осі індексу.
Python
# Even if we do not specify axis = 0, # the method will return the mean over # the index axis by default df.mean(axis = 0)>
Вихід:
приклад 2:
Використовуйте функцію mean() у Dataframe, який має значення None. Також знайдіть середнє значення по осі стовпця.
Python # importing pandas as pd import pandas as pd # Creating the dataframe df = pd.DataFrame({'A':[12, 4, 5, None, 1], 'B':[7, 2, 54, 3, None], 'C':[20, 16, 11, 3, 8], 'D':[14, 3, None, 2, 6]}) # skip the Na values while finding the mean df.mean(axis = 1, skipna = True)> Вихід: