So entfernen Sie redundante Daten unter Linux mit Fdupes

Niemand mag doppelte Dateien. Sie nehmen unnötig Platz auf einem System ein und stören. Glücklicherweise gibt es unter Linux eine Möglichkeit, redundante Daten zu entfernen und doppelte Dateien mit Fdupes zu bereinigen.

Installieren Sie Fdupes

Das Fdupes-Tool ist eines der besten Befehlszeilen-Deduplizierungstools auf der Linux-Plattform. Wenn es ausgeführt wird, kann es jedes Verzeichnis nach doppelten Dateien durchsuchen, ihren genauen Speicherort ausspionieren und die Duplikate in Symlinks umwandeln – sowohl Hardlinks als auch Softlinks. Das Beste ist, dass durch die Umwandlung von Duplikaten in Systemverknüpfungen Speicherplatz reduziert wird, während die Dateien am selben Ort intakt bleiben.

Fdupes ist einfach zu installieren und wird von den meisten Linux-Distributionen unterstützt. Tatsächlich hat sogar FreeBSD die Software zur Verfügung. Um die Software zum Laufen zu bringen, starten Sie ein Terminal und geben Sie die Befehle ein, die Ihrem Linux-Betriebssystem entsprechen.

Ubuntu

sudo apt install fdupes

Debian

sudo apt-get install fdupes

Arch-Linux

Fdupes ist auf Arch Linux über das „Community“-Repository verfügbar. Leider ist das Repo „Community“ nicht standardmäßig eingerichtet. Um dieses Programm zu installieren, müssen Sie zuerst die Pacman.conf-Datei bearbeiten.

Um die Konfigurationsdatei zu bearbeiten, öffnen Sie sie im Nano-Texteditor.

sudo nano /etc/pacman.conf

Entfernen Sie in der Konfigurationsdatei das „#“ vor allem, was mit „Community“ zu tun hat. Denken Sie daran, dass jedes „#“ weg sein muss, sonst funktioniert das Repo nicht. Wenn die Änderungen abgeschlossen sind, speichern Sie sie mit Strg + O und beenden Sie sie mit Strg + X.

  So verwalten Sie Audiogeräte unter Linux mit Pavucontrol

Synchronisieren Sie das neue Community-Repo mit Pacman.

sudo pacman -Syy

Nachdem die Softwarequelle „Community“ erfolgreich synchronisiert wurde, hat Arch Linux vollen Zugriff darauf. Beenden Sie den Vorgang, indem Sie die Fdupes-Anwendung über den Paketmanager installieren.

sudo pacman -S fdupes

Fedora

sudo dnf install fdupes

OpenSUSE

sudo zypper install fdupes

Nach Duplikaten scannen

Bevor Fdupes überflüssige Dateien entfernen kann, muss es wissen, wo sie sich befinden. Um die Dateien zu finden, müssen Sie den Schalter r verwenden. Mit dem r-Schalter können Sie jeden Ordner auf Ihrem Linux-PC zusammen mit jedem Unterordner durchsuchen, wodurch das Auffinden von Duplikaten viel, viel schneller wird.

Befolgen Sie die nachstehenden Anweisungen, um zu erfahren, wie Sie doppelte Dateien an mehreren Stellen auf Ihrem Linux-PC finden und entfernen.

Duplikate im Home-Ordner

Einer der Hauptorte, an denen Benutzer Dateien speichern, ist /home/. Der Grund, warum dieser Ordner Tonnen von Dateien enthält, ist, dass alles, was ein Benutzer unter Linux tut, hier abgelegt wird. Infolgedessen bauen sich Dateien im Laufe der Zeit auf und es entstehen häufig Duplikate. Um diese Duplikate zu finden, öffnen Sie ein Terminal und verweisen Sie fdupes auf Ihren Home-Ordner.

  So hören Sie mit Gradio auf dem Linux-Desktop Radio

fdupes -r ~/

oder um einen anderen Benutzer auf Ihrem PC zu scannen, der derzeit nicht angemeldet ist, gehen Sie wie folgt vor:

fdupes -r /home/username/

Nach dem Ausführen des Scans gibt das Tool eine vollständige Liste der Duplikate zurück, die es im Home-Verzeichnis findet. Um diese Informationen zu speichern, leiten Sie die Ausgabe an eine Datei im Ordner „Dokumente“ weiter.

fdupes -r ~/ >> ~/Documents/fdupes-scan-home.txt

oder

fdupes -r /home/username/ >> ~/Documents/fdupes-scan-home-user.txt

Duplikate im Root-Dateisystem

Fdupes kann jeden Ort scannen und nicht nur den Home-Ordner. Wenn Sie versuchen, doppelte Dateien im Root-Dateisystem Ihres Linux-PCs zu finden, gehen Sie wie folgt vor.

Ändern Sie in einem Terminal die Shell von einem normalen Benutzer auf das Root-Konto. Wenn Sie von einem herkömmlichen Konto zu Root wechseln, kann die Fdupes-App Orte scannen, die für eine normale Einrichtung gesperrt sind.

sudo -s

oder

su -

Scannen Sie als Root das Root-Dateisystem mit Fdupes.

fdupes -r /

Alternativ scannen Sie einen bestimmten Ort und nicht das gesamte Root-System mit:

fdupes -r /location/on/your/pc

Müssen Sie die Scanergebnisse für später in eine Datei exportieren? Führen Sie diesen Befehl aus.

fdupes -r / >> /home/username/Documents/fdupes-scan.txt

oder

fdupes -r /location/on/your/pc >> /home/username/Documents/fdupes-scan.txt

Redundante Daten entfernen

Das Scannen nach doppelten Dateien ist ein wichtiger Bestandteil beim Entfernen redundanter Daten. Der nächste Schritt besteht darin, sich mit den Ergebnissen zu befassen und die Redundanzen zu entfernen. Glücklicherweise geht es unglaublich schnell, redundante Daten loszuwerden. Das Beste ist, dass eigentlich nichts gelöscht werden muss, da Fdupes das Austauschen tatsächlicher Dateien mit Symlinks unterstützt.

  So hören Sie Ihre Plex-Musiksammlung auf dem Linux-Desktop

Es gibt zwei Arten von Deduplizierungen, die Fdupes unterstützt: Hardlinks und Softlinks. Für beste Ergebnisse empfehlen wir die Verwendung von Hardlinks, da diese nicht von tatsächlichen Dateien zu unterscheiden sind. Soft-Symlinks funktionieren jedoch auch. Gehen Sie zum Deduplizieren in einem Terminal wie folgt vor.

Hinweis: Ersetzen Sie doppelte Daten nicht systemweit, es sei denn, Sie verstehen die Risiken, die auftreten können!

Hardlink ersetzen

fdupes -rH /home/username/

oder für systemweite Duplikate:

sudo -s
fdupes -rH /root/file/location

Softlink ersetzen

fdupes -rS /home/username/

oder für systemweit:

fdupes -rS /root/file/location