МЕТОД PANDAS DATAFRAME CORR() - TECHCODEVIEW.COM

панди dataframe.corr() використовується для пошуку попарної кореляції всіх стовпців у Pandas Dataframe у Python. Будь-який NaN значення автоматично виключаються. Щоб ігнорувати будь-які нечислові значення, використовуйте параметр numeric_only = True. У цій статті ми дізнаємося про метод DataFrame.corr(). Python .

Синтаксис методу Pandas DataFrame corr().

Синтаксис: DataFrame.corr(self, method=’pearson’, min_periods=1, numeric_only = False)

Параметри:

метод:

Пірсона: стандартний коефіцієнт кореляції

kendall: коефіцієнт кореляції Kendall Tau

списоносець: кореляція рангу списоносця

min_periods : Мінімальна кількість спостережень, необхідних для кожної пари стовпців, щоб отримати дійсний результат. Наразі доступно лише для кореляції Пірсона та Спірмена

numeric_only : чи потрібно оперувати лише числовими значеннями. За замовчуванням встановлено значення False.

Повернення: count :y : DataFrame

Метод кореляції даних Pandas corr().

Хороша кореляція залежить від використання, але можна з упевненістю сказати, що у вас є принаймні 0,6 (або -0,6), щоб назвати це хорошою кореляцією. Простий приклад, щоб показати, як працює кореляція Python .

Python3

10 у степені 6

import> pandas as pd> df>=> {> >'Array_1'>: [>30>,>70>,>100>],> >'Array_2'>: [>65.1>,>49.50>,>30.7>]> }> data>=> pd.DataFrame(df)> print>(data.corr())>

Вихід

 Array_1 Array_2 Array_1 1.000000 -0.990773 Array_2 -0.990773 1.000000>

Створення зразка кадру даних

Друк перших 10 рядків Dataframe.

Примітка: Кореляція змінної з самою собою дорівнює 1. Щоб отримати посилання на файл CSV, який використовується в коді, натисніть тут

Python3

не дорівнює mysql

# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # Printing the first 10 rows of the data frame for visualization> df[:>10>]>

Вихід

Кореляції даних Pandas

Приклади методу Python Pandas DataFrame corr().

Знайдіть кореляцію між стовпцями за допомогою методу Пірсона

Тут ми використовуємо функцію corr(), щоб знайти кореляцію між стовпцями в Dataframe за допомогою методу Пірсона. Ми маємо лише чотири числових стовпці у Dataframe. Вихідний фрейм даних можна інтерпретувати як для будь-якої клітинки, кореляція змінної рядка зі змінною стовпця є значенням клітинки. Як згадувалося раніше, кореляція змінної з самою собою дорівнює 1. З цієї причини всі діагональні значення дорівнюють 1,00.

Python3

# To find the correlation among> # the columns using pearson method> df.corr(method>=>'pearson'>)>

список ініціалізації python

Вихід

Кореляції даних Pandas

Знайдіть кореляцію між стовпчиками за допомогою методу Кендалла

Використовуйте функцію Pandas df.corr(), щоб знайти кореляцію між стовпцями в Dataframe за допомогою методу «kendall». Вихідний фрейм даних можна інтерпретувати як для будь-якої клітинки, кореляція змінної рядка зі змінною стовпця є значенням клітинки. Як згадувалося раніше, кореляція змінної з самою собою дорівнює 1. З цієї причини всі діагональні значення дорівнюють 1,00.

Python3

# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # To find the correlation among> # the columns using kendall method> df.corr(method>=>'kendall'>)>

приховані програми

Вихід

dataframe.corr

TechCodeview

Метод Pandas DataFrame corr().

Синтаксис методу Pandas DataFrame corr().

Метод кореляції даних Pandas corr().

Python3

Створення зразка кадру даних

Python3

Приклади методу Python Pandas DataFrame corr().

Знайдіть кореляцію між стовпцями за допомогою методу Пірсона

Python3

Знайдіть кореляцію між стовпчиками за допомогою методу Кендалла

Python3