Doriți să știți cum puteți captura o pagină web și o puteți salva ca document PDF sau imagine utilizând terminalul? Din fericire, Linux are o mulțime de utilități pe care le puteți utiliza pentru a automatiza sarcina de a converti documente HTML în fișiere PDF și imagini.

Acest articol vă va prezenta wkhtmltopdf și wkhtmltoimage, utilități de care aveți nevoie pentru a vă ușura munca.

Cum se convertește HTML în PDF

Dacă doriți să capturați pagini web și să le convertiți într-un fișier PDF, utilitarul wkhtmltopdf vă va ajuta. Wkhtmltopdf este un instrument de linie de comandă open-source utilizat pentru redarea paginilor web în documente PDF.

Deoarece instrumentul funcționează fără cap în interiorul terminalului Linux, nu veți avea nevoie de niciun driver web sau un cadru de automatizare a browserului precum Selenium.

Instalați wkhtmltopdf pe Linux

Wkhtmltopdf nu este unul dintre pachetele standard care sunt preinstalate pe Linux. Va trebui să-l instalați manual folosind managerul de pachete al sistemului.

instagram viewer

Pentru a instala wkhtmltopdf pe distribuțiile bazate pe Ubuntu și Debian:

sudo apt install wkhtmltopdf

Pe distribuțiile bazate pe Arch, cum ar fi Manjaro Linux:

sudo pacman -S wkhtmltopdf

Instalarea wkhtmltopdf pe distribuții bazate pe RHEL, cum ar fi Fedora și CentOS, este de asemenea ușoară.

sudo dnf instalează wkhtmltopdf

Sintaxa de bază

Sintaxa de bază a comenzii este:

wkhtmltopdf numele fișierului paginii web

...Unde pagină web este adresa URL a paginii web pe care doriți să o convertiți și nume de fișier este numele fișierului PDF de ieșire.

Pentru a converti pagina de pornire Google într-un document PDF:

wkhtmltopdf https://google.com google.pdf

Ieșire:

La deschiderea fișierului PDF, veți observa că wkhtmltopdf a redat cu exactitate pagina web într-un document.

Imprimați mai multe copii ale paginii Web

--copii flag este un salvator dacă doriți ca fișierul dvs. de ieșire să aibă mai multe copii ale paginii web. Rețineți că atunci când tipăriți mai multe copii, wkhtmltopdf nu va genera mai multe fișiere PDF, ci va adăuga în schimb pagini suplimentare la un singur document.

Pentru a crea trei copii ale paginii de pornire Google:

wkhtmltopdf --copies 3 https://google.com google.pdf

Fișierul PDF de ieșire va conține trei pagini, după cum se specifică în comanda menționată mai sus.

Adăugați un filtru în tonuri de gri la ieșire

Pentru a adăuga un filtru în tonuri de gri în fișierul PDF, utilizați -g sau --scara tonurilor de gri semnalizați cu comanda:

wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf --grayscale https://google.com google.pdf

Fisier de iesire:

Modificați orientarea PDF-ului

În mod implicit, wkhtmltopdf generează fișierul PDF în aspect vertical, adică portret. Pentru a schimba acest comportament implicit și a captura pagini web în peisaj, folosiți --orientare semnalizați cu comanda:

wkhtmltopdf - peisaj de orientare https://google.com google.pdf

Ieșire:

Rețineți că versiunea peisaj a documentului are o zonă mai mare în spațiu alb în comparație cu cea portretă.

Nu includeți imagini în timpul conversiei

În timp ce generați ieșirea, dacă nu doriți ca wkhtmltopdf să redea imagini prezente într-o pagină web, utilizați --no-imagini steag:

wkhtmltopdf --no-images https://google.com google.pdf

Ieșire:

Legate de: Cele mai bune instrumente pentru a edita un fișier PDF oriunde

Cum se convertește o pagină web în imagini

Utilitarul wkhtmltoimage face parte din pachetul wkhtmltopdf. Dacă lucrați la un raport și doriți să includeți imagini ale unui site web, atunci acest instrument va funcționa în favoarea dvs. Terminalul Linux nu numai că vă face mai ușor să capturați imaginile, dar vă oferă și o serie de opțiuni care vă permit să vă personalizați ieșirea.

Sintaxa de bază

Wkhtmltoimage are o sintaxă similară cu wkhtmltopdf:

wkhtmltoimage numele fișierului paginii web

...Unde pagină web este adresa URL a unui site web și nume de fișier este numele imaginii de ieșire.

Convertiți o pagină Web într-o imagine

Continuând cu exemplul menționat mai sus, să convertim pagina de pornire Google în imagini.

wkhtmlimagine https://google.com google.png

Ieșire:

De asemenea, puteți specifica un format de fișier personalizat pe care doriți să îl aibă imaginea de ieșire. Wkhtmltoimage acceptă următoarele extensii de fișiere:

  • JPEG / JPG
  • PNG
  • SVG

De exemplu, dacă doriți să generați o imagine JPG, pur și simplu înlocuiți extensia de fișier cu JPG în comandă:

wkhtmlimagine https://google.com google.jpg

Legate de: JPG vs. JPEG: Care este diferența dintre aceste formate de fișiere imagine?

Captarea paginilor web utilizând terminalul Linux

Dacă doriți să vizualizați fișierele PDF generate de wkhtmltopdf, trebuie să aveți un vizualizator PDF instalat pe sistemul Linux. În timp ce majoritatea distribuțiilor Linux vin cu un editor PDF preinstalat, puteți alege și instala manual un editor PDF care se potrivește nevoilor dvs.

E-mail
Cei mai buni 5 editori Linux PDF pe care ar trebui să-i încercați

Aveți nevoie să editați un fișier PDF în Linux? Aceste editoare PDF Linux sunt gratuite de instalat și ușor de utilizat.

Citiți în continuare

Subiecte asemănătoare
  • Linux
  • PDF
  • Linux
Despre autor
Deepesh Sharma (67 articole publicate)

Deepesh este Junior Editor pentru Linux la MUO. Scrie conținut informațional pe internet de peste 3 ani. În timpul liber, îi place să scrie, să asculte muzică și să cânte la chitară.

Mai multe de la Deepesh Sharma

Aboneaza-te la newsletter-ul nostru

Alăturați-vă newsletter-ului pentru sfaturi tehnice, recenzii, cărți electronice gratuite și oferte exclusive!

Încă un pas…!

Vă rugăm să confirmați adresa de e-mail în e-mailul pe care tocmai vi l-am trimis.

.