logo

Групуйте за функцією в R за допомогою Dplyr

Функція Group_by() належить пакету dplyr мовою програмування R, який групує кадри даних. Функція Group_by() сама по собі не дасть результату. За ним має слідувати функція summarise() із відповідною дією для виконання. Він працює подібно до GROUP BY у SQL і зведеної таблиці в Excel.

Синтаксис:



group_by(col,…)

Синтаксис:

group_by(col,..) %>% summarise(action)



Набір даних, що використовується:

Зразок_супермагазин

Group_by() увімкнено a одна колонка

Це найпростіший спосіб згрупувати стовпець. Просто передайте ім’я стовпця, який потрібно згрупувати, у функцію group_by(), а дію, яку потрібно виконати над цим згрупованим стовпцем, – у функцію summarise().



приклад: Групування одного стовпця за допомогою group_by()

що таке об'єкт java

Р




library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_region = df %>%>group_by>(Region) %>%> >summarise>(total_sales =>sum>(Sales),> >total_profits =>sum>(Profit),> >.groups =>'drop'>)> View>(df_grp_region)>

>

>

Вихід:

Group_by() для кількох стовпців

Функцію Group_by() також можна виконати для двох або більше стовпців, назви стовпців мають бути в правильному порядку. Групування відбуватиметься відповідно до імені першого стовпця у функції group_by, а потім групування здійснюватиметься відповідно до другого стовпця.

приклад: Групування кількох стовпців

Р




library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_reg_cat = df %>%>group_by>(Region, Category) %>%> >summarise>(total_Sales =>sum>(Sales),> >total_Profit =>sum>(Profit),> >.groups =>'drop'>)> View>(df_grp_reg_cat)>

>

>

Вихід:

Ми також можемо обчислити середнє значення, кількість, мінімум або максимум, замінивши суму у функції підсумовування чи агрегування. Наприклад, ми знайдемо середні продажі та прибутки для тієї самої групи_за прикладом вище.

приклад:

Р




library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_reg_cat = df %>%>group_by>(Region, Category) %>%> >summarise>(mean_Sales =>mean>(Sales),> >mean_Profit =>mean>(Profit),> >.groups =>'drop'>)> View>(df_grp_reg_cat)>

>

>

регулярний вираз у java

Вихід: