Eine effiziente Methode, um PDF-Dokumente unter Linux aufzuteilen, ist die Nutzung eines Terminal-basierten Programms namens PDFtk, anstatt auf grafische Werkzeuge wie Evince oder Ocular zurückzugreifen. PDFtk ermöglicht nicht nur das Teilen von PDF-Dateien, sondern auch deren Bearbeitung und Modifikation.
Installation von PDFtk
Diese Software ist bereits seit einiger Zeit verfügbar und lässt sich problemlos auf den meisten Linux-Distributionen einrichten. Öffnen Sie ein Terminalfenster und folgen Sie den Anweisungen, um die App zu installieren.
Hinweis: Für die Installation von PDFtk müssen Sie Ubuntu, Debian, Arch Linux, Fedora oder OpenSUSE verwenden. Falls Sie eine andere Linux-Distribution nutzen, beachten Sie die Anweisungen zur Quellcode-Kompilierung weiter unten.
Ubuntu
sudo apt install pdftk
Debian
sudo apt-get install pdftk
Arch Linux
PDFtk ist auch unter Arch Linux nutzbar, jedoch ist die Installation aus den offiziellen Arch-Quellen nicht möglich. Stattdessen wird das Arch User Repository (AUR) benötigt. Um die Installation zu starten, öffnen Sie ein Terminal und installieren Sie zunächst Git mithilfe des Pacman-Paketmanagers.
Hinweis: Es existiert ein weiteres PDFtk-Paket im AUR, welches eine vorgefertigte Version bereitstellt. Davon wird jedoch abgeraten, da es Probleme mit dem GCC-GCJ-Paket geben kann.
sudo pacman -S git
Nachdem Git eingerichtet ist, können Sie die neueste Version des PDFtk-AUR-Snapshots herunterladen. Verwenden Sie dazu den Befehl `git clone`:
git clone https://aur.archlinux.org/pdftk.git
Wechseln Sie nun mit dem Befehl `cd` in den neu erstellten Ordner `pdftk`:
cd pdftk
Starten Sie den Build-Prozess mit `makepkg`. Dieser Befehl lädt alle notwendigen Abhängigkeiten herunter, kompiliert sie und installiert PDFtk. Sollte der Builder Abhängigkeiten nicht automatisch erfassen, müssen diese manuell installiert werden. Eine Liste der Abhängigkeiten finden Sie hier: Verknüpfung.
Fedora
Derzeit ist kein PDFtk-Paket in den Fedora-Repositories vorhanden. Glücklicherweise ist es jedoch möglich, die OpenSUSE-Pakete zu verwenden. Laden Sie zunächst die notwendigen Pakete mit `wget` herunter:
wget https://ftp.gwdg.de/pub/opensuse/distribution/leap/42.3/repo/oss/suse/x86_64/pdftk-2.02-10.1.x86_64.rpm wget https://ftp.gwdg.de/pub/opensuse/distribution/leap/42.3/repo/oss/suse/x86_64/libgcj48-4.8.5-24.14.x86_64.rpm
Wechseln Sie mit `cd` in den Download-Ordner:
cd ~/Downloads
Installieren Sie PDFtk und die Abhängigkeit mit dem DNF-Paketmanager:
sudo dnf install libgcj48-4.8.5-24.14.x86_64.rpm pdftk-2.02-10.1.x86_64.rpm -y
OpenSUSE
sudo zypper install pdftk
Kompilierung aus dem Quellcode
Das Kompilieren von PDFtk aus dem Quellcode ist relativ unkompliziert, da vorkonfigurierte Build-Dateien vorhanden sind. Zunächst muss der Quellcode heruntergeladen werden. Verwenden Sie dazu den Befehl `wget`:
wget https://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/pdftk-2.02-src.zip
Um eine korrekte Kompilierung zu gewährleisten, stellen Sie sicher, dass GCC, GCJ und libgcj installiert sind.
Entpacken Sie die heruntergeladene ZIP-Datei mit dem Befehl `unzip`:
cd ~/Downloads unzip pdftk-2.02-src.zip
Dies erstellt den Ordner `pdftk-2.02-src` in Ihrem Download-Verzeichnis. Wechseln Sie nun in diesen Ordner:
cd pdftk-2.02-src
Wechseln Sie in den Unterordner `pdftk`:
cd pdftk
Dieser Ordner enthält mehrere Makefiles für verschiedene Betriebssysteme. Listen Sie den Inhalt des Verzeichnisses mit `ls` auf:
ls
Suchen Sie das passende Makefile und starten Sie den Build-Prozess, indem Sie `make -f Makefile.filename` ausführen und `Makefile.filename` durch den Namen des verwendeten Makefiles ersetzen:
make -f Makefile.filename
Verwendung von PDFtk
PDFtk zeichnet sich durch seine Fähigkeit aus, PDF-Dateien aufzuteilen und zusammenzufügen. Um beispielsweise ein PDF-Dokument so aufzuteilen, dass jede Seite eine eigene Datei ergibt, verwenden Sie den Befehl `burst`:
pdftk testfile.pdf burst
PDFtk erstellt die geteilten Dateien im selben Verzeichnis wie die ursprüngliche Datei.
Möchten Sie alle geteilten PDF-Dateien wieder zu einer zusammenfügen? Beginnen Sie, indem Sie die ursprüngliche PDF-Datei umbenennen:
mv testfile.pdf testfile.bak
Jetzt, da die ursprüngliche Datei gesichert ist, können Sie alle Einzeldateien mit PDFtk wieder kombinieren. Verwenden Sie zunächst `ls`, um die Dateinamen aufzulisten:
ls
Speichern Sie dann alle PDF-Dateinamen in einer Textdatei:
ls *.pdf >> pdf-filenames.txt
Weisen Sie den Inhalt der Textdatei einer Bash-Variable zu. Dies stellt sicher, dass die Reihenfolge der Seiten beim Zusammenfügen korrekt ist:
value=$(<pdf-filenames.txt)
Führen Sie nun den Befehl aus, um die Dateien wieder zu einer PDF-Datei zu kombinieren:
pdftk $value cat output recombined-document.pdf