Pandas este o bibliotecă Python open-source folosită în principal pentru manipularea și analiza datelor. Este construit pe baza bibliotecii NumPy și oferă structuri de date de înaltă performanță, ușor de utilizat și instrumente de analiză a datelor pentru limbajul de programare Python.
În acest articol, veți învăța cum să efectuați 6 operațiuni de bază folosind Pandas.
Folosind exemple de panda
Puteți rula exemplele din acest articol folosind notebook-uri de calcul precum Caietul Jupyter, Google Colab, etc. De asemenea, puteți rula exemplele introducând codul direct în interpretul Python în modul interactiv.
Dacă doriți să aruncați o privire la codul sursă complet folosit în acest articol, puteți accesa fișierul Python Notebook din acest Depozitul GitHub.
1. Cum să importați panda ca pd și să imprimați numărul versiunii
Trebuie să utilizați import cuvânt cheie pentru a importa orice bibliotecă în Python. Pandas este de obicei importat sub pd alias. Cu această abordare, vă puteți referi la pachetul Pandas ca pd in loc de panda.
importa panda ca pd
tipărire (pd.__versiunea__)
Ieșire:
1.2.4
2. Cum se creează o serie în Pandas
Seria Pandas este o matrice unidimensională care deține date de orice tip. Este ca o coloană într-un tabel. Puteți crea o serie folosind matrice numpy, funcții numpy, liste, dicționare, valori scalare etc.
Valorile seriei sunt etichetate cu numărul lor de index. În mod implicit, prima valoare are indicele 0, a doua valoare are indicele 1 și așa mai departe. Pentru a vă denumi propriile etichete, trebuie să utilizați index argument.
Cum se creează o serie goală
s = pd. Seria (dtype='float64')
s
Ieșire:
Seria([], dtype: float64)
În exemplul de mai sus, o serie goală cu pluti este creat tipul de date.
Cum se creează o serie folosind NumPy Array
importa panda ca pd
import numpy ca np
d = np.array([1, 2, 3, 4, 5])
s = pd. Seria (d)
s
Ieșire:
0 1
1 2
2 3
3 4
4 5
dtype: int32
Legate de: Operații NumPy pentru începători
Cum se creează o serie folosind lista
d = [1, 2, 3, 4, 5]
s = pd. Seria (d)
s
Ieșire:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Cum se creează o serie cu index
Pentru a crea o serie cu un index, trebuie să utilizați index argument. Numărul de indici trebuie să fie egal cu numărul de elemente din serie.
d = [1, 2, 3, 4, 5]
s = pd. Seria (d, index=[„unu”, „două”, „trei”, „patru”, „cinci”])
s
Ieșire:
unul 1
doi 2
trei 3
patru 4
cinci 5
dtype: int64
Cum se creează o serie folosind dicționar
Cheile dicționarului devin etichetele seriei.
d = {"unul": 1,
„doi”: 2,
„trei”: 3,
„patru”: 4,
„cinci”: 5}
s = pd. Seria (d)
s
Ieșire:
unul 1
doi 2
trei 3
patru 4
cinci 5
dtype: int64
Cum se creează o serie folosind valoarea scalară
Dacă doriți să creați o serie folosind o valoare scalară, trebuie să furnizați index argument.
s = pd. Seria (1, index = ["a", "b", "c", "d"])
s
Ieșire:
a 1
b 1
c 1
d 1
dtype: int64
3. Cum se creează un cadru de date în Pandas
Un DataFrame este o structură de date bidimensională în care datele sunt aliniate sub formă de rânduri și coloane. Un DataFrame poate fi creat folosind dicționare, liste, o listă de dicționare, matrice numpy etc. În lumea reală, DataFrames-urile sunt create folosind stocarea existentă, cum ar fi fișiere CSV, fișiere Excel, baze de date SQL etc.
Obiectul DataFrame acceptă o serie de atribute și metode. Dacă doriți să aflați mai multe despre ele, puteți consulta documentația oficială a cadru de date panda.
Cum se creează un cadru de date gol
df = pd. DataFrame()
imprimare (df)
Ieșire:
DataFrame gol
Coloane: []
Index: []
Cum se creează un cadru de date folosind Listă
listObj = ["MUO", "tehnologie", "simplificat"]
df = pd. DataFrame (listObj)
imprimare (df)
Ieșire:
0
0 MUO
1 tehnologie
2 simplificat
Cum se creează un cadru de date folosind dicționarul de ndarray/liste
batmanData = {'Numele filmului': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
„Anul lansării”: [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
imprimare (df)
Ieșire:
Numele filmului Anul lansării
0 Batman Begins 2005
1 Cavalerul Întunecat 2008
2 The Dark Knight Rises 2012
Cum se creează un cadru de date utilizând Lista de liste
date = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (date, coloane = ['Nume', 'Nr. rolă'])
imprimare (df)
Ieșire:
Nume Roll Nr.
0 Alex 601
1 Bob 602
2 Cataline 603
Cum se creează un cadru de date folosind lista de dicționare
date = [{'Nume': 'Alex', 'Nr. rol': 601},
{„Nume”: „Bob”, „Nr. rolă”: 602},
{„Nume”: „Cataline”, „Nr. rolă”: 603}]
df = pd. DataFrame (date)
imprimare (df)
Ieșire:
Nume Roll Nr.
0 Alex 601
1 Bob 602
2 Cataline 603
Legate de: Cum se transformă o listă într-un dicționar în Python
Cum se creează un cadru de date folosind funcția zip().
Folosește zip() funcția de îmbinare a listelor în Python.
Nume = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = listă (zip (Nume, RollNo))
df = pd. DataFrame (listOfTuples, coloane = ['Nume', 'Nr. rolă'])
imprimare (df)
Ieșire:
Nume Roll Nr.
0 Alex 601
1 Bob 602
2 Cataline 603
4. Cum să citiți datele CSV în Pandas
Un fișier „valori separate prin virgulă” (CSV) este un fișier text delimitat care folosește o virgulă pentru a separa valorile. Puteți citi un fișier CSV folosind read_csv() metoda la panda. Dacă doriți să imprimați întregul DataFrame, utilizați to_string() metodă.
În acest exemplu și în următoarele, aceasta fișier CSV va fi folosit pentru efectuarea operațiunilor.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.to_string())
Ieșire:
5. Cum să analizați cadrele de date folosind metodele head(), tail() și info().
Cum să vizualizați datele folosind metoda head().
The cap() metoda este una dintre cele mai bune modalități de a obține o privire de ansamblu rapidă asupra DataFrame. Această metodă returnează antetul și numărul specificat de rânduri, începând de sus.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimare (df.head (10))
Ieșire:
Dacă nu specificați numărul de rânduri, primele 5 rânduri vor fi returnate.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimare (df.head())
Ieșire:
Cum să vizualizați datele folosind metoda tail().
The coadă() metoda returnează antetul și numărul specificat de rânduri, începând de jos.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimare (df.tail (10))
Ieșire:
Dacă nu specificați numărul de rânduri, vor fi returnate ultimele 5 rânduri.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimare (df.tail())
Ieșire:
Cum să obțineți informații despre date
The info() metodele returnează un scurt rezumat al unui DataFrame, inclusiv indexul dtype și coloana dtypes, valori non-nule și utilizarea memoriei.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimare (df.info())
Ieșire:
6. Cum să citiți datele JSON în Pandas
JSON (JavaSscript Oobiect Notation) este un format ușor de schimb de date. Puteți citi un fișier JSON folosind read_json() metoda la panda. Dacă doriți să imprimați întregul DataFrame, utilizați to_string() metodă.
În exemplul de mai jos, aceasta Fișier JSON este folosit pentru efectuarea operațiunilor.
Legate de: Ce este JSON? Prezentare generală a unui profan
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
print (df.to_string())
Ieșire:
Reîmprospătați-vă cunoștințele Python cu funcții și metode încorporate
Funcțiile ajută la scurtarea codului și la îmbunătățirea eficienței acestuia. Funcții și metode precum reduce(), Despică(), enumera(), eval(), rundă(), etc. poate face codul dvs. robust și ușor de înțeles. Este întotdeauna bine să știți despre funcțiile și metodele încorporate, deoarece acestea vă pot simplifica într-o mare măsură sarcinile de programare.
Biblioteca standard Python conține multe funcții pentru a vă ajuta cu sarcinile de programare. Aflați despre cel mai util și creați cod mai robust.
Citiți în continuare
- Programare
- Piton
- Dezvoltare web
- Programare
- Analiza datelor
Yuvraj este un student de licență în informatică la Universitatea din Delhi, India. Este pasionat de Full Stack Web Development. Când nu scrie, explorează profunzimea diferitelor tehnologii.
Aboneaza-te la newsletter-ul nostru
Alăturați-vă buletinului nostru informativ pentru sfaturi tehnice, recenzii, cărți electronice gratuite și oferte exclusive!
Click aici pentru a te abona