logo

Різні способи створення Pandas Dataframe

Pandas DataFrame це двовимірна структура даних із мітками, наприклад таблиця з рядками та стовпцями. Розмір і значення DataFrame є змінними, тобто їх можна змінювати.

DataFrame здебільшого використовується для аналізу та обробки даних. Це дозволяє зберігати дані в табличній формі, як-от база даних SQL, MS Excel або Google Sheets, що полегшує виконання арифметичних операцій з даними.



Це найбільш часто використовуваний об'єкт Pandas. The Функція DataFrame(). використовується для створення DataFrame в Pandas. Ви також можете створити Pandas DataFrame різними способами.

Синтаксис Pandas Dataframe().

pandas.DataFrame(дані, індекс, стовпці)

що робить комп'ютер швидким

Параметри:

  • даних : Це набір даних, з якого має бути створений DataFrame. Це може бути список, словник, скалярне значення, ряди та масиви тощо.
  • індекс : це необов’язково, за замовчуванням індекс DataFrame починається з 0 і закінчується останнім значенням даних (n-1). Він явно визначає мітку рядка.
  • колонки : цей параметр використовується для надання імен стовпців у DataFrame. Якщо назва стовпця не визначена за замовчуванням, воно прийматиме значення від 0 до n-1.

Повернення:

  • Об'єкт DataFrame

Тепер, коли ми обговорили функцію DataFrame(), давайте розглянемо різні способи створення DataFrame:



Різні способи створення фрейму даних у Python

Існує кілька способів створення a Pandas Data Frame в Python . Ви можете створити DataFrame за допомогою таких методів:

  • Створіть Pandas DataFrame за допомогою функції DataFrame().
  • Створіть Pandas DataFrame зі списку списків
  • Створіть Pandas DataFrame зі словника ndarray/list
  • Створіть Pandas DataFrame зі списку словників
  • Створіть Pandas DataFrame зі словника Series
  • Створення DataFrame за допомогою функції zip().
  • Створення DataFrame шляхом явного підтвердження мітки індексу

Створіть порожній DataFrame за допомогою методу DataFrame().

DataFrame у Python може бути створений за допомогою функції DataFrame(). Бібліотека панд . Просто викличте функцію з конструктором DataFrame, щоб створити DataFrame.

приклад : Створення порожнього DataFrame за допомогою функції DataFrame() у Python



Python3




# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df>=> pd.DataFrame()> # Printing Empty DataFrame> print>(df)>

>

>

Вихід:

Empty DataFrame Columns: [] Index: []>

Створіть DataFrame зі списків списків

Щоб створити Pandas DataFrame з a список списків, ви можете використовувати функцію pd.DataFrame(). Ця функція приймає список списків як вхідні дані та створює DataFrame з такою ж кількістю рядків і стовпців, як і вхідний список.

приклад : Створення DataFrame зі списків списків за допомогою методу DataFrame().

Python3




# Import pandas library> import> pandas as pd> # initialize list of lists> data>=> [[>'tom'>,>10>], [>'nick'>,>15>], [>'juli'>,>14>]]> # Create the pandas DataFrame> df>=> pd.DataFrame(data, columns>=>[>'Name'>,>'Age'>])> # print dataframe.> print>(df)>

>

>

Вихід:

 Name Age 0 tom 10 1 nick 15 2 juli 14>

Створіть DataFrame зі словника ndArray/Lists

Щоб створити DataFrame з a словник з ndarrays /lists, усі масиви мають бути однакової довжини. Якщо передається індекс, то індекс довжини має дорівнювати довжині масивів.

Якщо індекс не передано, то за замовчуванням індекс буде діапазоном (n), де n — довжина масиву.

приклад : Створення DataFrame зі словника ndarray/lists

Python3


ddl проти dml



# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data>=> {>'Name'>: [>'Tom'>,>'nick'>,>'krish'>,>'jack'>],> >'Age'>: [>20>,>21>,>19>,>18>]}> # Create DataFrame> df>=> pd.DataFrame(data)> # Print the output.> print>(df)>

>

>

Вихід:

 Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>

Примітка: Під час створення DataFrame за допомогою словника ключами словника за замовчуванням будуть імена стовпців. Ми також можемо надати назви стовпців явно за допомогою параметра стовпця.

Створіть DataFrame зі списку словників

Pandas DataFrame можна створити шляхом передачі списки словників як вхідні дані. За замовчуванням ключі словника будуть прийняті як стовпці.

Python3


Команда linux для zip



# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data>=> [{>'a'>:>1>,>'b'>:>2>,>'c'>:>3>},> >{>'a'>:>10>,>'b'>:>20>,>'c'>:>30>}]> # Creates DataFrame.> df>=> pd.DataFrame(data)> # Print the data> print>(df)>

>

>

Вихід:

a b c 0 1 2 3 1 10 20 30>

Іншим прикладом є створення Pandas DataFrame шляхом передачі списків словників і індекси рядків .

Python3




# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data>=> [{>'b'>:>2>,>'c'>:>3>}, {>'a'>:>10>,>'b'>:>20>,>'c'>:>30>}]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df>=> pd.DataFrame(data, index>=>[>'first'>,>'second'>])> # Print the data> print>(df)>

>

>

Вихід:

b c a first 2 3 NaN second 20 30 10.0>

Створіть DataFrame зі словника Series

Щоб створити DataFrame зі словника серії , можна передати словник для формування DataFrame. Результуючий індекс є об'єднанням усіх серій пройдених індексованих.

приклад: Створення DataFrame зі словника серій.

Python3


невизначений нахил



# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d>=> {>'one'>: pd.Series([>10>,>20>,>30>,>40>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>]),> >'two'>: pd.Series([>10>,>20>,>30>,>40>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>])}> # creates Dataframe.> df>=> pd.DataFrame(d)> # print the data.> print>(df)>

>

>

Вихід:

 one two a 10 10 b 20 20 c 30 30 d 40 40>

Створіть DataFrame за допомогою функції zip().

Два списки можна об’єднати за допомогою функція zip(). . Тепер створіть Pandas DataFrame, викликавши функцію pd.DataFrame().

приклад: Створення DataFrame за допомогою функції zip().

Python3




# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name>=> [>'tom'>,>'krish'>,>'nick'>,>'juli'>]> # List2> Age>=> [>25>,>30>,>26>,>22>]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples>=> list>(>zip>(Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df>=> pd.DataFrame(list_of_tuples,> >columns>=>[>'Name'>,>'Age'>])> # Print data.> print>(df)>

>

>

Вихід:

 Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>

Створіть DataFrame, явно підтвердивши мітку індексу

Щоб створити DataFrame, явно надаючи мітку індексу, ви можете використовувати параметр index конструктора pd.DataFrame(). Параметр index приймає список міток індексу як вхідні дані, і DataFrame використовуватиме ці мітки для рядків DataFrame.

приклад: Створення DataFrame шляхом явного підтвердження мітки індексу

Python3




масив додавання елементів java
# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data>=> {>'Name'>: [>'Tom'>,>'Jack'>,>'nick'>,>'juli'>],> >'marks'>: [>99>,>98>,>95>,>90>]}> # Creates pandas DataFrame.> df>=> pd.DataFrame(data, index>=>[>'rank1'>,> >'rank2'>,> >'rank3'>,> >'rank4'>])> # print the data> print>(df)>

>

>

Вихід:

 Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>

Висновок

Python Pandas DataFrame схожий на таблицю з рядками та стовпцями. Це двовимірна структура даних, яка дуже корисна для аналізу та обробки даних.

У цьому посібнику ми обговорили кілька способів створення Pandas DataFrame. За допомогою цього підручника ви зможете впоратися з будь-якою складною вимогою створення DataFrame.