Python, ca limbaj, este valoros peste măsură, mai ales atunci când doriți să lucrați cu date structurate. Deoarece oamenii stochează o mulțime de date în fișiere Excel, este imperativ să consolideze mai multe fișiere pentru a economisi timp și efort.

Python vă permite să faceți exact asta; indiferent câte fișiere Excel doriți să combinați, o puteți face cu relativă ușurință. Având în vedere gama sa de biblioteci și resurse terță parte, puteți importa și utiliza instrumentele cu mai multe fațete ale Python pentru a vă licita.

În acest ghid, va trebui să instalați și să utilizați bibliotecile Pandas pentru a importa date în Python înainte de a le consolida.

Instalați Bibliotecile Pandas în Python

Pandas este o bibliotecă terță parte pe care o puteți instala în Python. Unele IDE-uri au deja instalate Pandas în ele.

Dacă utilizați un Versiunea IDE care nu vine cu Pandas preinstalat, fiți siguri, îl puteți instala direct în Python.

Iată cum se instalează Pandas:

pip install panda

Dacă utilizați Jupyter Notebook, puteți instala Pandas direct cu

instagram viewer
Comanda PIP. De cele mai multe ori, atunci când ați instalat Jupyter cu Anaconda, există șanse mari să aveți deja Pandas disponibile pentru utilizare directă.

Dacă nu puteți apela Pandas, puteți utiliza comanda de mai sus pentru a le instala direct.

Combinarea fișierelor Excel cu Python

Mai întâi, trebuie să creați un folder în locația preferată cu toate fișierele Excel. Odată ce folderul este gata, puteți începe să scrieți codul pentru a importa bibliotecile.

Veți folosi două variabile în acest cod:

  1. panda: Biblioteca Pandas oferă cadrele de date pentru stocarea fișierelor Excel.
  2. OS: Biblioteca este benefică pentru citirea datelor din folderul mașinii dvs

Pentru a importa aceste biblioteci, utilizați aceste comenzi:

Import Pandas ca pd
Import OS
  • Import: Sintaxa Python folosită pentru a importa bibliotecile în Python
  • panda: Numele bibliotecii
  • pd: Alias ​​dat bibliotecii
  • OS: O bibliotecă pentru a accesa folderul de sistem

După ce ați importat bibliotecile, creați două variabile pentru a stoca calea fișierului de intrare și de ieșire. Calea fișierului de intrare este necesară pentru a accesa folderul fișierelor. Calea fișierului de ieșire este necesară deoarece fișierul combinat va fi exportat acolo.

Dacă utilizați Python, asigurați-vă că schimbați bara oblică inversă în forța oblică (\ la /)

input_file_path = "C:/Utilizatori/gaurav/OneDrive/Desktop/Fișiere Excel/"
output_file_path = "C:/Utilizatori/gaurav/OneDrive/Desktop/"

Adăugați / la sfârșit și pentru a finaliza potecile.

Fișierele folderului sunt disponibile într-o listă. Creați o listă pentru a stoca toate referințele la fișiere din folderul de intrare folosind listdir funcția de la OS bibliotecă.

Dacă nu sunteți sigur de funcțiile disponibile într-o bibliotecă, puteți utiliza dir funcția cu numele bibliotecii. De exemplu, pentru a verifica versiunea exactă a funcției listdir, puteți utiliza comanda după cum urmează:

dir (OS)

Ieșirea va consta din toate funcțiile asociate disponibile în biblioteca OS. Funcția listdir este una dintre numeroasele funcții disponibile în această bibliotecă.

Creați o nouă variabilă pentru a stoca fișierele de intrare din folder.

excel_file_list = os.listdir (input_file_path)

Tipăriți această variabilă pentru a vedea numele fișierelor stocate în folder. Toate fișierele stocate în folder sunt afișate odată ce utilizați funcția de imprimare.

imprimare (excel_file_list)

Apoi, trebuie să adăugați un nou cadru de date pentru a stoca fiecare fișier Excel. Imaginați-vă un cadru de date ca un container pentru stocarea datelor. Iată comanda pentru crearea unui cadru de date.

df = pd. DataFrame()
  • df: Variabilă pentru a stoca valoarea DataFrame
  • pd: Alias ​​pentru Biblioteca panda
  • DataFrame: Sintaxă implicită pentru adăugarea unui cadru de date

Dosarul de intrare are trei .xlsx fișierele din acest exemplu. Numele fișierelor sunt:

Fișier1_excel.xlsx
File2_excel.xlsx
File3_excel.xlsx

Pentru a deschide fiecare fișier din acest folder, trebuie să rulați o buclă. Bucla va rula pentru fiecare dintre fișierele din lista creată mai sus.

Iată cum o poți face:

pentru excel_files din excel_file_list:

În continuare, este necesar să verificați extensiile fișierelor, deoarece codul va deschide numai fișierele XLSX. Pentru a verifica aceste fișiere, puteți utiliza un Dacă afirmație.

Folosește se termină cu funcţionează în acest scop, după cum urmează:

pentru excel_files din excel_file_list:

dacă excel_files.endswith(".xlsx"):

  • excel_files: Lista cu toate valorile fișierului
  • se termină cu: Funcție de verificare a extensiei fișierelor
  • ("".xlsx"): Această valoare a șirului se poate modifica, în funcție de ceea ce doriți să căutați

Acum că ați identificat fișierele Excel, puteți crea un nou cadru de date pentru a citi și stoca fișierele individual.

pentru excel_files din excel_file_list:

dacă excel_files.endswith(".xlsx"):

df1 = pd.read_excel (calea_fișier_input+fișiere_excel)

  • df1: Un nou cadru de date
  • pd: Biblioteca panda
  • read_excel: Funcție de citire a fișierelor Excel din biblioteca Pandas
  • cale_fișier_intrare: Calea folderului în care sunt stocate fișierele
  • excel_files: Orice variabilă care este utilizată în bucla for

Pentru a începe să atașați fișierele, trebuie să utilizați adăuga funcţie.

pentru excel_files din excel_file_list:

dacă excel_files.endswith(".xlsx"):

df1 = pd.read_excel (calea_fișier_input+fișiere_excel)
df = df.append (df1)

În cele din urmă, acum că cadrul de date consolidat este gata, îl puteți exporta în locația de ieșire. În acest caz, exportați cadrul de date într-un fișier XLSX.

df.to_excel (calea_fișier_ieșire+"Fișier_consolidat.xlsx")
  • df: Cadrul de date de exportat
  • to_excel: Comanda folosită pentru a exporta datele
  • calea_fișier_ieșire: Calea definită pentru stocarea rezultatului
  • Consolidated_file.xlsx: Numele fișierului consolidat

Acum, să ne uităm la codul final:

#Pandas este folosit ca un cadru de date pentru a gestiona fișierele Excel
importa panda ca pd
import os

# schimbați bara oblică din „\” în „/”, dacă utilizați dispozitive Windows

input_file_path = "C:/Utilizatori/gaurav/OneDrive/Desktop/Fișiere Excel/"
output_file_path = "C:/Utilizatori/gaurav/OneDrive/Desktop/"

#creați o listă pentru a stoca toate referințele la fișiere ale folderului de intrare folosind funcția listdir din biblioteca os.
#Pentru a vedea conținutul unei biblioteci (cum ar fi funcția listdir, puteți utiliza funcția dir pe numele bibliotecii).
#Utilizați dir (nume_bibliotecă) pentru a lista conținutul

excel_file_list = os.listdir (input_file_path)

#tipărește toate fișierele stocate în folder, după definirea listei
excel_file_list

#Odată ce fiecare fișier se deschide, utilizați funcția de adăugare pentru a începe consolidarea datelor stocate în mai multe fișiere

#creați un nou cadru de date gol, pentru a gestiona importurile de fișiere Excel
df = pd. DataFrame()

# Rulați o buclă for pentru a parcurge fiecare fișier din listă
pentru excel_files din excel_file_list:
#verificați numai fișierele cu sufix .xlsx
dacă excel_files.endswith(".xlsx"):
#creați un nou cadru de date pentru a citi/deschide fiecare fișier Excel din lista de fișiere creată mai sus
df1 = pd.read_excel (calea_fișier_input+fișiere_excel)
#adăugați fiecare fișier în cadrul de date gol original
df = df.append (df1)

#transferă rezultatul final într-un fișier Excel (xlsx) pe calea de ieșire
df.to_excel (calea_fișier_ieșire+"Fișier_consolidat.xlsx")

Utilizarea Python pentru a combina mai multe registre de lucru Excel

Python's Pandas este un instrument excelent atât pentru începători, cât și pentru utilizatorii avansați. Biblioteca este utilizată pe scară largă de dezvoltatorii care doresc să stăpânească Python.

Chiar dacă sunteți începător, puteți beneficia enorm învățând nuanțele Pandas și cum este utilizată biblioteca în Python.

6 operațiuni cu panda pentru începători

Învățați-vă pe panda cu aceste operațiuni pentru începători.

Citiți în continuare

AcțiuneTweetE-mail
Subiecte asemănătoare
  • Programare
  • Piton
  • Microsoft Excel
  • Foaie de calcul
Despre autor
Gaurav Siyal (59 articole publicate)

Gaurav Siyal are doi ani de experiență în scris, scriind pentru o serie de firme de marketing digital și documente despre ciclul de viață al software-ului.

Mai multe de la Gaurav Siyal

Aboneaza-te la newsletter-ul nostru

Alăturați-vă buletinului nostru informativ pentru sfaturi tehnice, recenzii, cărți electronice gratuite și oferte exclusive!

Click aici pentru a te abona