logo

Python | Pandas DataFrame.set_index()

У цій статті ми обговоримо Pandas DataFrame.set_index() у Python. Python виділяється як чудова мова для аналізу даних, головним чином завдяки своїй видатній екосистемі пакетів, орієнтованих на дані. Серед цих пакетів, панди відіграє важливу роль у спрощенні імпорту та аналізу даних.

Синтаксис Pandas DataFrame.set_index().

Синтаксис: DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)

Параметри:



  • ключі: Назва стовпця або список імен стовпців.
  • падіння: Логічне значення, яке, якщо True, видаляє стовпець, який використовується для індексу.
  • додати: Якщо True, додає вказаний стовпець до існуючого стовпця індексу.
  • на місці: Якщо True, зміни вносяться в сам DataFrame.
  • verify_integrity: Якщо True, перевіряє новий стовпець індексу на наявність дублікатів.

Що таке Pandas DataFrame.set_index()?

Фрейм даних Pandas. set_index() метод використовується для призначення списку, серії або іншого кадру даних як індексу даного кадру даних. Це особливо корисно під час об’єднання кількох кадрів даних, що дозволяє легко модифікувати індекс. Хоча стовпець індексу можна вказати під час створення кадру даних, set_index() забезпечує гнучкий спосіб змінити індекс пізніше. По суті, це дозволяє встановити список, серію або кадр даних як індекс кадру даних. Але іноді кадр даних складається з двох або більше кадрів даних, і, отже, пізніше індекс можна змінити за допомогою цього методу.

Щоб завантажити використаний файл CSV, натисніть тут

Pandas DataFrame.set_index() Приклади

Нижче наведено відповідні ілюстрації прикладів для Pandas DataFrame.set_index().

  • Pandas Установіть для індексу стовпець
  • Стовпець із кількома індексами
  • Встановлення одиночного Поплавковий стовпець як індекс
  • Налаштування три колонки як Мультиіндекс
  • Pandas встановлює індекс певного стовпця

Pandas Установіть для індексу стовпець

У цьому прикладі ми змінюємо стовпець індексу, стовпець імені було зроблено стовпцем індексу кадру даних.

Python3




# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index(>'First Name'>, inplace>=> True>)> # display> data.head()>

>

>

Вихід : Перед операцією –

перетворення рядка на дату

Після операції –

Як показано на вихідних зображеннях, раніше стовпець індексу був серією чисел, але пізніше його було замінено на ім’я.

Панди встановлюють для індексу значення кількох стовпців індексів

У цьому прикладі два стовпці будуть створені як індексний стовпець. Параметр Drop використовується для видалення стовпця, а параметр append використовується для додавання переданих стовпців до вже існуючого стовпця індексу.

Python3




# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index([>'First Name'>,>'Gender'>], inplace>=> True>,> >append>=> True>, drop>=> False>)> # display> data.head()>

>

>

Вихід:

Як показано на вихідному зображенні, дані мають 3 стовпці індексу.

Pandas Dataframe Index Налаштування єдиного Поплавковий стовпець як індекс

У цьому прикладі наведений нижче фрагмент коду використовує бібліотеку Pandas для створення DataFrame під назвою «df» із вкладеного списку даних студентів. Він встановлює стовпець «Agg_Marks» як індекс і відображає отриманий DataFrame зі стовпцями «Name», «Age», «City» та «Country».

Python3




# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # here we set Float column 'Agg_Marks' as index of data frame> # using dataframe.set_index() function> df>=> df.set_index(>'Agg_Marks'>)> # Displaying the Data frame> df>

>

>

Вихід:

 Name Age City Country Agg_Marks 85.96 jack 34 Sydeny Australia 95.20 Riti 30 Delhi India 85.25 Vansh 31 Delhi India 74.21 Nanyu 32 Tokyo Japan 99.63 Maychan 16 New York US 47.28 Mike 17 las vegas US>

У наведеному вище прикладі ми встановили стовпець ' Agg_Marks як індекс кадру даних.

Налаштування індексу фрейму даних Pandas три колонки як Мультиіндекс

У цьому прикладі наведений нижче код використовує Pandas для створення DataFrame «df» із даних студента зі стовпцями «Name», «Age», «City», «Country», «Agg_Marks» і «ID». Він використовує функцію `set_index()` для встановлення багаторівневого індексу за допомогою «Назви», «Міста» та «Ідентифікатора», а потім відображає результуючий DataFrame.

Python3




# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>,>400>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>,>750>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>,>101>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>,>900>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>,>420>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>,>555>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>,>'ID'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # Here we pass list of 3 columns i.e 'Name', 'City' and 'ID'> # to dataframe.set_index() function> # to set them as multiIndex of dataframe> df>=> df.set_index([>'Name'>,>'City'>,>'ID'>])> # Displaying the Data frame> df>

>

>

Вихід:

 Age Country Agg_Marks Name City ID jack Sydeny 400 34 Australia 85.96 Riti Delhi 750 30 India 95.20 Vansh Delhi 101 31 India 85.25 Nanyu Tokyo 900 32 Japan 74.21 Maychan New York 420 16 US 99.63 Mike las vegas 555 17 US 47.28>

У наведеному вище прикладі ми встановили стовпці ' Ім'я ', ' місто 'і' ID як multiIndex кадру даних.

Pandas встановлює індекс певного стовпця

У цьому прикладі наведений нижче код демонструє, як використовувати Pandas для створення DataFrame, встановити певний стовпець (у цьому випадку «Назва») як індекс за допомогоюset_index()>метод, а потім відображає як оригінальний, так і модифікований DataFrames. Theinplace=True>гарантує, що зміни застосовуються безпосередньо до DataFrame без необхідності повторного призначення.

Python3




знайти в рядку c++

import> pandas as pd> # Creating a sample DataFrame> data>=> {>'Name'>: [>'Geek1'>,>'Geek2'>,>'Geek3'>],> >'Age'>: [>25>,>30>,>35>],> >'City'>: [>'New York'>,>'San Francisco'>,>'Los Angeles'>]}> df>=> pd.DataFrame(data)> # Displaying the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Using set_index() to set 'Name' column as the index> df.set_index(>'Name'>, inplace>=>True>)> # Displaying the DataFrame after setting the index> print>(>' DataFrame after set_index:'>)> print>(df)>

>

>

Вихід:

Original DataFrame: Name Age City 0 Geek1 25 New York 1 Geek2 30 San Francisco 2 Geek3 35 Los Angeles DataFrame after set_index: Age City Name Geek1 25 New York Geek2 30 San Francisco Geek3 35 Los Angeles>