Функція Group_by() належить пакету dplyr мовою програмування R, який групує кадри даних. Функція Group_by() сама по собі не дасть результату. За ним має слідувати функція summarise() із відповідною дією для виконання. Він працює подібно до GROUP BY у SQL і зведеної таблиці в Excel.
Синтаксис:
group_by(col,…)
Синтаксис:
group_by(col,..) %>% summarise(action)
Набір даних, що використовується:
Зразок_супермагазин
Group_by() увімкнено a одна колонка
Це найпростіший спосіб згрупувати стовпець. Просто передайте ім’я стовпця, який потрібно згрупувати, у функцію group_by(), а дію, яку потрібно виконати над цим згрупованим стовпцем, – у функцію summarise().
приклад: Групування одного стовпця за допомогою group_by()
що таке об'єкт java
Р
library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_region = df %>%>group_by>(Region) %>%> >summarise>(total_sales =>sum>(Sales),> >total_profits =>sum>(Profit),> >.groups =>'drop'>)> View>(df_grp_region)> |
>
>
Вихід:
Group_by() для кількох стовпців
Функцію Group_by() також можна виконати для двох або більше стовпців, назви стовпців мають бути в правильному порядку. Групування відбуватиметься відповідно до імені першого стовпця у функції group_by, а потім групування здійснюватиметься відповідно до другого стовпця.
приклад: Групування кількох стовпців
Р
library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_reg_cat = df %>%>group_by>(Region, Category) %>%> >summarise>(total_Sales =>sum>(Sales),> >total_Profit =>sum>(Profit),> >.groups =>'drop'>)> View>(df_grp_reg_cat)> |
>
>
Вихід:
Ми також можемо обчислити середнє значення, кількість, мінімум або максимум, замінивши суму у функції підсумовування чи агрегування. Наприклад, ми знайдемо середні продажі та прибутки для тієї самої групи_за прикладом вище.
приклад:
Р
library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_reg_cat = df %>%>group_by>(Region, Category) %>%> >summarise>(mean_Sales =>mean>(Sales),> >mean_Profit =>mean>(Profit),> >.groups =>'drop'>)> View>(df_grp_reg_cat)> |
>
>
регулярний вираз у java
Вихід: