Scott Tiger Tech Blog

Blog technologiczny firmy Scott Tiger S.A.

Obróbka PDF pod Linuksem

Autor: Piotr Karpiuk o wtorek 12. Październik 2010

Większość naszych potrzeb w zakresie edycji plików PDF na pulpicie zaspokoi rozszerzenie Sun PDF Import dla OpenOffice lub PDFedit. Jeżeli jakiś program nie pozwala na zapis w formacie PDF ale umożliwia drukowanie, to pakiet cups-pdf instaluje w systemie „drukarkę” która generuje plik PDF.

Do konwersji między formatami można użyć narzędzi takich jak pdftops, pdftohtml, pdftotext, pdf2svg, chm2pdf, ps2pdf czy wkhtmltopdf.

PDFjam jest nakładką na pdfpages – popularny skrypt LaTeXa. Pozwala wykonywać czynności takie jak modyfikowanie metadanych, zmiana rozmiaru strony, konwersja formatu na dwustronny, powiększanie/pomniejszanie, kolor tła.

pdftk jest reklamowany następująco: „Jeśli PDF to elektroniczny papier, to pdftk jest elektronicznym przyrządem do usuwania zszywek, dziurkaczem, segregatorem, maszyną szyfrującą i okularami rentgenowskimi”. Pozwala na wykonywanie takich czynności jak łączenie plików lub rozbijanie na pojedyncze strony, obracanie, dołączanie załączników, szyfrowanie dokumentu, nadawanie uprawnień (do oglądania, druku, druku wysokiej jakości, edycji zawartości, edycji komentarzy) i zabezpieczanie hasłem, dodawanie znaku wodnego. Graficznym interfejsem do programu jest PDF Chain.

Przykłady użycia narzędzi wiersza poleceń do obróbki PDF:

pdfinfo plik
informacje o dokumencie
pdfinfo -opw mojehaslo plik
zabezpiecza dokument hasłem właściciela (opcja -upw zakłada hasło użytkownika)

a2ps --output=result.ps --portrait jakis_plik
konwertuje dowolny w zasadzie plik (graficzny, tekstowy) do PostScriptu; później można użyć ps2pdf – ponieważ PDF jest zasadniczo podzbiorem PS, więc konwersja jest zwykle szybka i dokładna
pdffonts plik.pdf
lista czcionek wykorzystywanych w dokumencie i informacja czy są zagnieżdżone
pdfimages -j plik.pdf katalog_docelowy
wydobywa z pliku PDF obrazy i zapisuje je w formacie JPG w podanym katalogu
pdfjam mydoc.pdf --a4paper --outfile myA4doc.pdf
zmiana formatu strony dokumentu na A4 (np. z US letter)
pdftk form.pdf attach_files form.tex new.pdf
tworzy new.pdf poprzez dodanie załącznika form.pdf do form.pdf
pdftk new.pdf unpack_files output Source
wyodrębnia załączniki z PDFa i zapisuje je w katalogu Source
pdftk example.pdf burst output Pages/Page03%d.pdf
rozbija PDFa na osobne dokumenty po 1 stronie na dokument i zapisuje je w katalogu Pages; pliki będą miały nazwy Page000.pdf, Page001.pdf itd.
pdftk example.pdf form.pdf attachment.pdf cat output concat.pdf
scala wskazane pliki w jeden plik concat.pdf
pdftk file.pdf output new.pdf user_pw haslo allow printing copycontents
szyfruje i zabezpiecza dokument hasłem użytkownika nadając mu uprawnienia do drukowania dokumentu i kopiowania do schowka zawartości dokumentu
Share and Enjoy:
  • del.icio.us
  • Facebook
  • Google Bookmarks
  • Śledzik
  • Blip
  • Blogger.com
  • Gadu-Gadu Live
  • LinkedIn
  • MySpace
  • Wykop

Zostaw komentarz

XHTML: Możesz użyć następujących tagów: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>