Pandas este o bibliotecă Python open-source folosită în principal pentru manipularea și analiza datelor. Este construit pe baza bibliotecii NumPy și oferă structuri de date de înaltă performanță, ușor de utilizat și instrumente de analiză a datelor pentru limbajul de programare Python.

În acest articol, veți învăța cum să efectuați 6 operațiuni de bază folosind Pandas.

Folosind exemple de panda

Puteți rula exemplele din acest articol folosind notebook-uri de calcul precum Caietul Jupyter, Google Colab, etc. De asemenea, puteți rula exemplele introducând codul direct în interpretul Python în modul interactiv.

Dacă doriți să aruncați o privire la codul sursă complet folosit în acest articol, puteți accesa fișierul Python Notebook din acest Depozitul GitHub.

1. Cum să importați panda ca pd și să imprimați numărul versiunii

Trebuie să utilizați import cuvânt cheie pentru a importa orice bibliotecă în Python. Pandas este de obicei importat sub pd alias. Cu această abordare, vă puteți referi la pachetul Pandas ca pd in loc de panda.

instagram viewer
importa panda ca pd
tipărire (pd.__versiunea__)

Ieșire:

1.2.4

2. Cum se creează o serie în Pandas

Seria Pandas este o matrice unidimensională care deține date de orice tip. Este ca o coloană într-un tabel. Puteți crea o serie folosind matrice numpy, funcții numpy, liste, dicționare, valori scalare etc.

Valorile seriei sunt etichetate cu numărul lor de index. În mod implicit, prima valoare are indicele 0, a doua valoare are indicele 1 și așa mai departe. Pentru a vă denumi propriile etichete, trebuie să utilizați index argument.

Cum se creează o serie goală

s = pd. Seria (dtype='float64')
s

Ieșire:

Seria([], dtype: float64)

În exemplul de mai sus, o serie goală cu pluti este creat tipul de date.

Cum se creează o serie folosind NumPy Array

importa panda ca pd
import numpy ca np
d = np.array([1, 2, 3, 4, 5])
s = pd. Seria (d)
s

Ieșire:

0 1
1 2
2 3
3 4
4 5
dtype: int32

Legate de: Operații NumPy pentru începători

Cum se creează o serie folosind lista

d = [1, 2, 3, 4, 5]
s = pd. Seria (d)
s

Ieșire:

0 1
1 2
2 3
3 4
4 5
dtype: int64

Cum se creează o serie cu index

Pentru a crea o serie cu un index, trebuie să utilizați index argument. Numărul de indici trebuie să fie egal cu numărul de elemente din serie.

d = [1, 2, 3, 4, 5]
s = pd. Seria (d, index=[„unu”, „două”, „trei”, „patru”, „cinci”])
s

Ieșire:

unul 1
doi 2
trei 3
patru 4
cinci 5
dtype: int64

Cum se creează o serie folosind dicționar

Cheile dicționarului devin etichetele seriei.

d = {"unul": 1,
„doi”: 2,
„trei”: 3,
„patru”: 4,
„cinci”: 5}
s = pd. Seria (d)
s

Ieșire:

unul 1
doi 2
trei 3
patru 4
cinci 5
dtype: int64

Cum se creează o serie folosind valoarea scalară

Dacă doriți să creați o serie folosind o valoare scalară, trebuie să furnizați index argument.

s = pd. Seria (1, index = ["a", "b", "c", "d"])
s

Ieșire:

a 1
b 1
c 1
d 1
dtype: int64

3. Cum se creează un cadru de date în Pandas

Un DataFrame este o structură de date bidimensională în care datele sunt aliniate sub formă de rânduri și coloane. Un DataFrame poate fi creat folosind dicționare, liste, o listă de dicționare, matrice numpy etc. În lumea reală, DataFrames-urile sunt create folosind stocarea existentă, cum ar fi fișiere CSV, fișiere Excel, baze de date SQL etc.

Obiectul DataFrame acceptă o serie de atribute și metode. Dacă doriți să aflați mai multe despre ele, puteți consulta documentația oficială a cadru de date panda.

Cum se creează un cadru de date gol

df = pd. DataFrame()
imprimare (df)

Ieșire:

DataFrame gol
Coloane: []
Index: []

Cum se creează un cadru de date folosind Listă

listObj = ["MUO", "tehnologie", "simplificat"]
df = pd. DataFrame (listObj)
imprimare (df)

Ieșire:

 0
0 MUO
1 tehnologie
2 simplificat

Cum se creează un cadru de date folosind dicționarul de ndarray/liste

batmanData = {'Numele filmului': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
„Anul lansării”: [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
imprimare (df)

Ieșire:

 Numele filmului Anul lansării
0 Batman Begins 2005
1 Cavalerul Întunecat 2008
2 The Dark Knight Rises 2012

Cum se creează un cadru de date utilizând Lista de liste

date = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (date, coloane = ['Nume', 'Nr. rolă'])
imprimare (df)

Ieșire:

 Nume Roll Nr.
0 Alex 601
1 Bob 602
2 Cataline 603

Cum se creează un cadru de date folosind lista de dicționare

date = [{'Nume': 'Alex', 'Nr. rol': 601},
{„Nume”: „Bob”, „Nr. rolă”: 602},
{„Nume”: „Cataline”, „Nr. rolă”: 603}]
df = pd. DataFrame (date)
imprimare (df)

Ieșire:

 Nume Roll Nr.
0 Alex 601
1 Bob 602
2 Cataline 603

Legate de: Cum se transformă o listă într-un dicționar în Python

Cum se creează un cadru de date folosind funcția zip().

Folosește zip() funcția de îmbinare a listelor în Python.

Nume = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = listă (zip (Nume, RollNo))
df = pd. DataFrame (listOfTuples, coloane = ['Nume', 'Nr. rolă'])
imprimare (df)

Ieșire:

 Nume Roll Nr.
0 Alex 601
1 Bob 602
2 Cataline 603

4. Cum să citiți datele CSV în Pandas

Un fișier „valori separate prin virgulă” (CSV) este un fișier text delimitat care folosește o virgulă pentru a separa valorile. Puteți citi un fișier CSV folosind read_csv() metoda la panda. Dacă doriți să imprimați întregul DataFrame, utilizați to_string() metodă.

În acest exemplu și în următoarele, aceasta fișier CSV va fi folosit pentru efectuarea operațiunilor.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.to_string())

Ieșire:

5. Cum să analizați cadrele de date folosind metodele head(), tail() și info().

Cum să vizualizați datele folosind metoda head().

The cap() metoda este una dintre cele mai bune modalități de a obține o privire de ansamblu rapidă asupra DataFrame. Această metodă returnează antetul și numărul specificat de rânduri, începând de sus.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimare (df.head (10))

Ieșire:

Dacă nu specificați numărul de rânduri, primele 5 rânduri vor fi returnate.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimare (df.head())

Ieșire:

Cum să vizualizați datele folosind metoda tail().

The coadă() metoda returnează antetul și numărul specificat de rânduri, începând de jos.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimare (df.tail (10))

Ieșire:

Dacă nu specificați numărul de rânduri, vor fi returnate ultimele 5 rânduri.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimare (df.tail())

Ieșire:

Cum să obțineți informații despre date

The info() metodele returnează un scurt rezumat al unui DataFrame, inclusiv indexul dtype și coloana dtypes, valori non-nule și utilizarea memoriei.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimare (df.info())

Ieșire:

6. Cum să citiți datele JSON în Pandas

JSON (JavaSscript Oobiect Notation) este un format ușor de schimb de date. Puteți citi un fișier JSON folosind read_json() metoda la panda. Dacă doriți să imprimați întregul DataFrame, utilizați to_string() metodă.

În exemplul de mai jos, aceasta Fișier JSON este folosit pentru efectuarea operațiunilor.

Legate de: Ce este JSON? Prezentare generală a unui profan

df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
print (df.to_string())

Ieșire:

Reîmprospătați-vă cunoștințele Python cu funcții și metode încorporate

Funcțiile ajută la scurtarea codului și la îmbunătățirea eficienței acestuia. Funcții și metode precum reduce(), Despică(), enumera(), eval(), rundă(), etc. poate face codul dvs. robust și ușor de înțeles. Este întotdeauna bine să știți despre funcțiile și metodele încorporate, deoarece acestea vă pot simplifica într-o mare măsură sarcinile de programare.

AcțiuneTweetE-mail
20 de funcții Python pe care ar trebui să le cunoașteți

Biblioteca standard Python conține multe funcții pentru a vă ajuta cu sarcinile de programare. Aflați despre cel mai util și creați cod mai robust.

Citiți în continuare

Subiecte asemănătoare
  • Programare
  • Piton
  • Dezvoltare web
  • Programare
  • Analiza datelor
Despre autor
Yuvraj Chandra (69 articole publicate)

Yuvraj este un student de licență în informatică la Universitatea din Delhi, India. Este pasionat de Full Stack Web Development. Când nu scrie, explorează profunzimea diferitelor tehnologii.

Mai multe de la Yuvraj Chandra

Aboneaza-te la newsletter-ul nostru

Alăturați-vă buletinului nostru informativ pentru sfaturi tehnice, recenzii, cărți electronice gratuite și oferte exclusive!

Click aici pentru a te abona