Doriți să știți cum puteți captura o pagină web și o puteți salva ca document PDF sau imagine utilizând terminalul? Din fericire, Linux are o mulțime de utilități pe care le puteți utiliza pentru a automatiza sarcina de a converti documente HTML în fișiere PDF și imagini.
Acest articol vă va prezenta wkhtmltopdf și wkhtmltoimage, utilități de care aveți nevoie pentru a vă ușura munca.
Cum se convertește HTML în PDF
Dacă doriți să capturați pagini web și să le convertiți într-un fișier PDF, utilitarul wkhtmltopdf vă va ajuta. Wkhtmltopdf este un instrument de linie de comandă open-source utilizat pentru redarea paginilor web în documente PDF.
Deoarece instrumentul funcționează fără cap în interiorul terminalului Linux, nu veți avea nevoie de niciun driver web sau un cadru de automatizare a browserului precum Selenium.
Instalați wkhtmltopdf pe Linux
Wkhtmltopdf nu este unul dintre pachetele standard care sunt preinstalate pe Linux. Va trebui să-l instalați manual folosind managerul de pachete al sistemului.
Pentru a instala wkhtmltopdf pe distribuțiile bazate pe Ubuntu și Debian:
sudo apt install wkhtmltopdf
Pe distribuțiile bazate pe Arch, cum ar fi Manjaro Linux:
sudo pacman -S wkhtmltopdf
Instalarea wkhtmltopdf pe distribuții bazate pe RHEL, cum ar fi Fedora și CentOS, este de asemenea ușoară.
sudo dnf instalează wkhtmltopdf
Sintaxa de bază
Sintaxa de bază a comenzii este:
wkhtmltopdf numele fișierului paginii web
...Unde pagină web este adresa URL a paginii web pe care doriți să o convertiți și nume de fișier este numele fișierului PDF de ieșire.
Pentru a converti pagina de pornire Google într-un document PDF:
wkhtmltopdf https://google.com google.pdf
Ieșire:
La deschiderea fișierului PDF, veți observa că wkhtmltopdf a redat cu exactitate pagina web într-un document.
Imprimați mai multe copii ale paginii Web
--copii flag este un salvator dacă doriți ca fișierul dvs. de ieșire să aibă mai multe copii ale paginii web. Rețineți că atunci când tipăriți mai multe copii, wkhtmltopdf nu va genera mai multe fișiere PDF, ci va adăuga în schimb pagini suplimentare la un singur document.
Pentru a crea trei copii ale paginii de pornire Google:
wkhtmltopdf --copies 3 https://google.com google.pdf
Fișierul PDF de ieșire va conține trei pagini, după cum se specifică în comanda menționată mai sus.
Adăugați un filtru în tonuri de gri la ieșire
Pentru a adăuga un filtru în tonuri de gri în fișierul PDF, utilizați -g sau --scara tonurilor de gri semnalizați cu comanda:
wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf --grayscale https://google.com google.pdf
Fisier de iesire:
Modificați orientarea PDF-ului
În mod implicit, wkhtmltopdf generează fișierul PDF în aspect vertical, adică portret. Pentru a schimba acest comportament implicit și a captura pagini web în peisaj, folosiți --orientare semnalizați cu comanda:
wkhtmltopdf - peisaj de orientare https://google.com google.pdf
Ieșire:
Rețineți că versiunea peisaj a documentului are o zonă mai mare în spațiu alb în comparație cu cea portretă.
Nu includeți imagini în timpul conversiei
În timp ce generați ieșirea, dacă nu doriți ca wkhtmltopdf să redea imagini prezente într-o pagină web, utilizați --no-imagini steag:
wkhtmltopdf --no-images https://google.com google.pdf
Ieșire:
Legate de: Cele mai bune instrumente pentru a edita un fișier PDF oriunde
Cum se convertește o pagină web în imagini
Utilitarul wkhtmltoimage face parte din pachetul wkhtmltopdf. Dacă lucrați la un raport și doriți să includeți imagini ale unui site web, atunci acest instrument va funcționa în favoarea dvs. Terminalul Linux nu numai că vă face mai ușor să capturați imaginile, dar vă oferă și o serie de opțiuni care vă permit să vă personalizați ieșirea.
Sintaxa de bază
Wkhtmltoimage are o sintaxă similară cu wkhtmltopdf:
wkhtmltoimage numele fișierului paginii web
...Unde pagină web este adresa URL a unui site web și nume de fișier este numele imaginii de ieșire.
Convertiți o pagină Web într-o imagine
Continuând cu exemplul menționat mai sus, să convertim pagina de pornire Google în imagini.
wkhtmlimagine https://google.com google.png
Ieșire:
De asemenea, puteți specifica un format de fișier personalizat pe care doriți să îl aibă imaginea de ieșire. Wkhtmltoimage acceptă următoarele extensii de fișiere:
- JPEG / JPG
- PNG
- SVG
De exemplu, dacă doriți să generați o imagine JPG, pur și simplu înlocuiți extensia de fișier cu JPG în comandă:
wkhtmlimagine https://google.com google.jpg
Legate de: JPG vs. JPEG: Care este diferența dintre aceste formate de fișiere imagine?
Captarea paginilor web utilizând terminalul Linux
Dacă doriți să vizualizați fișierele PDF generate de wkhtmltopdf, trebuie să aveți un vizualizator PDF instalat pe sistemul Linux. În timp ce majoritatea distribuțiilor Linux vin cu un editor PDF preinstalat, puteți alege și instala manual un editor PDF care se potrivește nevoilor dvs.
Aveți nevoie să editați un fișier PDF în Linux? Aceste editoare PDF Linux sunt gratuite de instalat și ușor de utilizat.
Citiți în continuare
- Linux
- Linux
Deepesh este Junior Editor pentru Linux la MUO. Scrie conținut informațional pe internet de peste 3 ani. În timpul liber, îi place să scrie, să asculte muzică și să cânte la chitară.
Aboneaza-te la newsletter-ul nostru
Alăturați-vă newsletter-ului pentru sfaturi tehnice, recenzii, cărți electronice gratuite și oferte exclusive!
Încă un pas…!
Vă rugăm să confirmați adresa de e-mail în e-mailul pe care tocmai vi l-am trimis.