logo

Серія Python Pandas

Серію Pandas можна визначити як одновимірний масив, який здатний зберігати різні типи даних. Ми можемо легко перетворити список, кортеж і словник на ряди за допомогою ' серії ' метод. Мітки рядків серій називаються індексами. Серія не може містити кілька стовпців. Він має наступний параметр:

    дані:Це може бути будь-який список, словник або скалярне значення.індекс:Значення індексу має бути унікальним і хешованим. Він має бути такої ж довжини, що й дані. Якщо ми не передаємо жодного індексу, за замовчуванням np.arrange(n) буде використано.dtype:Це відноситься до типу даних ряду.копія:Використовується для копіювання даних.

Створення серії:

Серію можна створити двома способами:

  1. Створіть порожню серію
  2. Створіть ряд, використовуючи вхідні дані.

Створіть порожню серію:

Ми можемо легко створити порожню серію в Pandas, що означає, що вона не матиме жодної цінності.

Синтаксис, який використовується для створення порожнього ряду:

 = pandas.Series() 

У наведеному нижче прикладі створюється об’єкт типу Empty Series, який не має значень і має тип даних за замовчуванням, тобто float64 .

приклад

 import pandas as pd x = pd.Series() print (x) 

Вихід

 Series([], dtype: float64) 

Створення серії за допомогою вхідних даних:

Ми можемо створювати ряди, використовуючи різні вхідні дані:

підручник з реагування на js
  • Масив
  • Dict
  • Скалярне значення

Створення серії з масиву:

Перш ніж створити серію, по-перше, ми маємо імпортувати numpy модуль, а потім використайте функцію array() у програмі. Якщо дані є ndarray, то переданий індекс повинен мати таку саму довжину.

Якщо ми не передаємо індекс, то за умовчанням індекс діапазон (n) передається, де n визначає довжину масиву, тобто [0,1,2,.... діапазон(len(масив))-1 ].

приклад

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Вихід

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Створіть серію з dict

Ми також можемо створити серію з dict. Якщо словниковий об’єкт передається як вхід, а індекс не вказано, тоді для створення індексу ключі словника беруться у відсортованому порядку. .

Якщо передано індекс, значення, які відповідають певній мітці в індексі, будуть витягнуті з словник .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Вихід

 x 0.0 y 1.0 z 2.0 dtype: float64 

Створіть ряд за допомогою Scalar:

Якщо ми беремо скалярні значення, то потрібно надати індекс. Скалярне значення буде повторено для відповідності довжині індексу.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Вихід

 0 4 1 4 2 4 3 4 dtype: int64 

Доступ до даних із серій із позицією:

Створивши об’єкт типу Series, ви зможете отримати доступ до його індексів, даних і навіть окремих елементів.

Доступ до даних у серії можна отримати так само, як і в ndarray.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Вихід

 1 

Атрибути об’єкта серії

Атрибут Series визначається як будь-яка інформація, пов’язана з об’єктом Series, наприклад розмір, тип даних. тощо. Нижче наведено деякі з атрибутів, які можна використовувати для отримання інформації про об’єкт Series:

Атрибути опис
Серія.індекс Визначає індекс серії.
Серія.форма Він повертає кортеж форми даних.
Series.dtype Він повертає тип даних.
Серія.розмір Він повертає розмір даних.
Серія.порожній Він повертає True, якщо об’єкт Series порожній, інакше повертає false.
Серія.hasnans Він повертає True, якщо є значення NaN, інакше повертає false.
Series.nbytes Він повертає кількість байтів у даних.
Серія Я Він повертає кількість вимірів у даних.
Series.itemsize Він повертає розмір типу даних елемента.

Отримання масиву індексу та масиву даних об’єкта серії

Ми можемо отримати масив індексів і масив даних існуючого об’єкта Series за допомогою атрибутів index і values.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Вихід

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Отримання типів (dtype) і розміру типу (itemsize)

Ви можете використовувати атрибут dtype з об’єктом Series як dtype для отримання типу даних окремого елемента об’єкта серії, ви можете використовувати розмір предметів атрибут, щоб показати кількість байтів, виділених кожному елементу даних.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Вихід

 int64 8 float64 8 

Отримання форми

Форма об’єкта Series визначає загальну кількість елементів, включаючи відсутні або порожні значення (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Вихід

 (4,) (3,) 

Отримання розмірності, розміру та кількості байтів:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Вихід

 1 1 4 3 32 24 

Перевірка порожнечі та наявності NaN

Щоб перевірити, чи об’єкт Series порожній, можна скористатися порожній атрибут . Подібним чином, щоб перевірити, чи об’єкт серії містить деякі значення NaN чи ні, ви можете використовувати хасан атрибут.

приклад

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Вихід

генератор випадкових чисел у c
 False False True True False False 4 3 3 3 

Функції серії

У серії використовуються такі функції:

Функції опис
Pandas Series.map() Зіставте значення з двох рядів, які мають спільний стовпець.
Pandas Series.std() Обчисліть стандартне відхилення заданого набору чисел, DataFrame, стовпця та рядків.
Pandas Series.to_frame() Перетворіть об’єкт серії на фрейм даних.
Pandas Series.value_counts() Повертає ряд, який містить кількість унікальних значень.