Cărțile audio câștigă din ce în ce mai multă popularitate față de cărțile electronice tradiționale. Sunt mai convenabile, deoarece le puteți asculta oricând și oriunde.

Puteți converti o carte electronică PDF într-o carte audio cu un simplu script Python. Folosind niște biblioteci simple, puteți dezvolta un proiect care va citi un PDF și va stoca cartea audio ca fișier nou.

Instalarea pachetelor necesare

Trebuie să instalați PyPDF3, pyttsx3, și pdf instalator pachete pentru a începe. Puteți instala aceste pachete folosind managerul de pachete pip. Asigurați-vă că ați făcut deja pip instalat pe sistemul dvs. Rulați următoarea comandă în promptul de comandă pentru a instala pachetele:

pip instalare PyPDF3 pyttsx3 pdfplumber
  • Puteți folosi PyPDF3 bibliotecă pentru a citi și edita fișiere PDF în Python.
  • The pyttsx3 biblioteca oferă conversie text în vorbire.
  • pdf instalator este o bibliotecă care vă permite să extrageți text și tabele din fișiere PDF.

Codul folosit în acest proiect este disponibil în a Depozitul GitHub și este gratuit pentru utilizare sub licența MIT.

instagram viewer

Conversia unui PDF într-o carte audio folosind Python

După ce ați instalat pachetele de mai sus, sunteți gata să le importați în fișierul dvs. Python:

import PyPDF3
import pyttsx3
import pdf instalator

Trebuie să furnizați numele și locația fișierului PDF pe care doriți să îl convertiți. De dragul simplității, puteți utiliza orice exemplu de fișier PDF. Copiați-l în același director cu scriptul și stocați-i numele într-o variabilă; daca se numeste Lorem.pdf, de exemplu:

fisier = 'Lorem.pdf'

Apoi, creați un obiect fișier pentru fișierul PDF și un obiect cititor PDF:

carte = deschis (fișier, 'rb')
pdfReader = PyPDF3.PdfFileReader (carte)

Mai târziu, veți parcurge toate paginile fișierului PDF. Pentru a găsi numărul total de pagini, utilizați numPages proprietate:

pagini = pdfReader.numPages

Acum, sunteți gata să extrageți textul din fișierul PDF:

finalText = ""

cu pdfplumber.open(fişier) la fel de pdf:
pentru i în intervalul (0, pagini):
pagina = pdf.pages[i]
text = page.extract_text()
finalText += text

Utilizați o buclă for pentru a itera toate paginile și a extrage textul din PDF. Puteți utiliza pachetul pdfplumber pentru a deschide fișierul pdf și extract_text metodă de a prelua text dintr-o pagină.

Cu textul complet stocat într-o variabilă, îl puteți procesa în continuare, în funcție de cerințele dvs. Dacă doriți să convertiți textul în audio și să-l salvați într-un fișier nou, utilizați următorul cod:

motor = pyttsx3.init()
engine.save_to_file (finalText, 'lorem.mp3')
motor.runAndWait()

Cand tu rulați acest cod Python, va crea un fișier audiobook în directorul său.

Dacă nu doriți să salvați cartea audio și, de exemplu, doriți să recitați fișierul PDF, puteți utiliza în schimb următorul cod:

motor = pyttsx3.init()
motor.Spune(text final)
motor.runAndWait()

Când rulați acest script, acesta va recita fișierul PDF.

Dezvoltați proiecte folosind Python

Python este cunoscut pentru versatilitatea sa. Puteți crea cu ușurință proiecte cu aplicații practice folosind Python.

Dacă doriți să vă murdăriți mâinile cu codul Python, puteți începe prin a dezvolta mini-proiecte. Unele idei bune de pornire sunt o aplicație de chestionare, un chatbot, un joc cu șarpe, un scurtator de adrese URL, un web scraper sau un convertor de unități.