logo

Метод Pandas DataFrame corr().

панди dataframe.corr() використовується для пошуку попарної кореляції всіх стовпців у Pandas Dataframe у Python. Будь-який NaN значення автоматично виключаються. Щоб ігнорувати будь-які нечислові значення, використовуйте параметр numeric_only = True. У цій статті ми дізнаємося про метод DataFrame.corr(). Python .

Синтаксис методу Pandas DataFrame corr().

Синтаксис: DataFrame.corr(self, method=’pearson’, min_periods=1, numeric_only = False)



Параметри:

  • метод:
    • Пірсона: стандартний коефіцієнт кореляції
    • kendall: коефіцієнт кореляції Kendall Tau
    • списоносець: кореляція рангу списоносця
  • min_periods : Мінімальна кількість спостережень, необхідних для кожної пари стовпців, щоб отримати дійсний результат. Наразі доступно лише для кореляції Пірсона та Спірмена
  • numeric_only : чи потрібно оперувати лише числовими значеннями. За замовчуванням встановлено значення False.

Повернення: count :y : DataFrame

Метод кореляції даних Pandas corr().

Хороша кореляція залежить від використання, але можна з упевненістю сказати, що у вас є принаймні 0,6 (або -0,6), щоб назвати це хорошою кореляцією. Простий приклад, щоб показати, як працює кореляція Python .



Python3




10 у степені 6



import> pandas as pd> df>=> {> >'Array_1'>: [>30>,>70>,>100>],> >'Array_2'>: [>65.1>,>49.50>,>30.7>]> }> data>=> pd.DataFrame(df)> print>(data.corr())>

>

>

Вихід

 Array_1 Array_2 Array_1 1.000000 -0.990773 Array_2 -0.990773 1.000000>

Створення зразка кадру даних

Друк перших 10 рядків Dataframe.

Примітка: Кореляція змінної з самою собою дорівнює 1. Щоб отримати посилання на файл CSV, який використовується в коді, натисніть тут

Python3




не дорівнює mysql
# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # Printing the first 10 rows of the data frame for visualization> df[:>10>]>

>

>

Вихід

Кореляції даних Pandas

Приклади методу Python Pandas DataFrame corr().

Знайдіть кореляцію між стовпцями за допомогою методу Пірсона

Тут ми використовуємо функцію corr(), щоб знайти кореляцію між стовпцями в Dataframe за допомогою методу Пірсона. Ми маємо лише чотири числових стовпці у Dataframe. Вихідний фрейм даних можна інтерпретувати як для будь-якої клітинки, кореляція змінної рядка зі змінною стовпця є значенням клітинки. Як згадувалося раніше, кореляція змінної з самою собою дорівнює 1. З цієї причини всі діагональні значення дорівнюють 1,00.

Python3




# To find the correlation among> # the columns using pearson method> df.corr(method>=>'pearson'>)>

>

>

список ініціалізації python

Вихід

Кореляції даних Pandas

Знайдіть кореляцію між стовпчиками за допомогою методу Кендалла

Використовуйте функцію Pandas df.corr(), щоб знайти кореляцію між стовпцями в Dataframe за допомогою методу «kendall». Вихідний фрейм даних можна інтерпретувати як для будь-якої клітинки, кореляція змінної рядка зі змінною стовпця є значенням клітинки. Як згадувалося раніше, кореляція змінної з самою собою дорівнює 1. З цієї причини всі діагональні значення дорівнюють 1,00.

Python3




# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # To find the correlation among> # the columns using kendall method> df.corr(method>=>'kendall'>)>

приховані програми
>

>

Вихід

dataframe.corr