Wie funktioniert die Dateikomprimierung?
Wir haben alle von Dateikomprimierung gehört. Jeder, der regelmäßig Dateien aus dem Internet herunterlädt, ist mit Formaten wie ZIP und RAR vertraut, und jeder, der Mediendateien bearbeitet, weiß, dass eine Komprimierung erforderlich ist, um Bilder, Musik und Videos im Web gemeinsam nutzen zu können, ohne dabei die gesamte Bandbreite zu beanspruchen. Die Komprimierung von Dateien ist der Kern der Funktionsweise des Webs, könnten Sie argumentieren, da wir damit Dateien gemeinsam nutzen können, deren Übertragung sonst zu lange dauern würde. Aber wie funktioniert das??
Es ist nichts Magisches, aber es ist das Ergebnis harter Arbeit vieler sehr kluger Leute. Sehen wir uns die Funktionsweise der Dateikomprimierung an, indem wir die beiden wichtigsten Komprimierungsarten - verlustfrei und verlustbehaftet - betrachten.
Nur eine Warnung - ich werde die Dinge hier zu stark vereinfachen, um dies für Nicht-Mathematik-Majors lesbar zu machen. Weitere Informationen finden Sie in den verlinkten Wikipedia-Artikeln und in den Quellen von Wikipedia.
Verlustfreie Kompression
Verlustfreie Komprimierung funktioniert im Wesentlichen durch das Entfernen von Redundanz. Was bedeutet das? Lass uns die Dinge vereinfachen. Dieser Stapel von Steinen wird unsere Daten darstellen:
Wie Sie sehen, haben wir zwei rote Steine, fünf gelbe und drei blaue. Der einfachste Weg, dies darzustellen, ist, wie Sie oben sehen: die Steine selbst. Aber das ist nicht der einzige Weg, wie ich das darstellen kann. Ich könnte das auch tun:
Im obigen Bild sehen Sie exakt die gleichen Informationen - zwei rote, fünf gelbe und drei blaue -, benötigen jedoch deutlich weniger Platz. Ich habe überflüssige Steine mit Zahlen dargestellt, dh ich brauche nur drei Steine, um zehn darzustellen.
Sie erhalten eine ungefähre Vorstellung davon, wie eine verlustfreie Komprimierung möglich ist. Informationen, die überflüssig sind, werden durch Anweisungen ersetzt, die dem Computer mitteilen, wie viele identische Daten sich wiederholen. Ein weiteres vereinfachtes Beispiel:
fffffffuuuuuuuuuuuu
Kann sein “komprimiert” zu:
f7u12
Dies ist natürlich nur eine Methode der verlustfreien Komprimierung, aber es zeigt, wie dies möglich ist. Andere mathematische Tricks werden verwendet, aber bei der verlustfreien Komprimierung sollten Sie sich vor allem daran erinnern, dass der Speicherplatz vorübergehend gespeichert werden kann, die Originaldatei jedoch vollständig aus der komprimierten rekonstruiert werden kann. Wenn Sie drei Steine mit Zahlen sehen, wissen Sie genau, wie der Stapel hergestellt wird. Es geht keine Information verloren, wie der Name verlustlos impliziert.
Programme wie WinZip basieren auf verlustfreier Komprimierung. Sie entfernen diese redundanten Informationen beim Komprimieren (oder “Postleitzahl”) die Datei und stellen Sie sie wieder her, wenn Sie die Datei dekomprimieren (oder “entpacken”). Nichts ist verloren.
In der Bildwelt verwenden PNG-Dateien auch eine verlustfreie Komprimierung. Aus diesem Grund bieten sie eine kleinere Dateigröße für Bilder mit viel einheitlichem Speicherplatz: Diese redundanten Informationen werden mithilfe von Anweisungen dargestellt.
Natürlich ist dies alles eine Vereinfachung, aber es vermittelt den grundlegenden Punkt. Weitere Informationen zur verlustfreien Komprimierung finden Sie auf Wikipedia, wenn Sie interessiert sind.
Verlust der Kompression
Natürlich können Sie mit verlustfreien Methoden nur so viel erreichen. Glücklicherweise sind sie nicht die einzige Option: Sie können auch Informationen einfach entfernen. Dies wird als verlustbehaftete Komprimierung bezeichnet und ist nicht so verrückt, wie es sich anhört. In der Tat haben Sie wahrscheinlich viele Dateien auf Ihrem Computer, die mit verlustbehafteter Komprimierung erstellt wurden.
Eine MP3 zum Beispiel. Wenn Sie wie die meisten Menschen sind, die Ihr Computer für Tausende von Ihnen speichert, aber wussten Sie, dass sie nicht alle Audioinformationen enthalten, die die ursprüngliche Aufnahme enthielt? Einige Geräusche, die der Mensch nicht oder kaum hören kann, werden als Teil der Komprimierung entfernt. Je mehr Sie eine Datei komprimieren, desto mehr Informationen werden entfernt. Aus diesem Grund beginnt eine übermäßig komprimierte Datei matschig zu klingen.
Die verlustbehaftete Komprimierung wird meistens für Mediendateien verwendet - Bilder, Ton und Video. Die Verwendung einer verlustbehafteten Komprimierung für eine Textdatei wäre problematisch, da die daraus resultierenden Informationen verstümmelt würden. Es ist jedoch nicht immer notwendig, dass Mediendateien alle Informationen enthalten.
Ein weiteres Beispiel für eine verlustbehaftete Komprimierung ist das JPEG-Bild. Im Allgemeinen müssen Bilder, die im Internet gesehen werden, nicht so hochwertig sein wie Bilder, die zum Drucken vorgesehen sind. Auf diese Weise können Sie viele redundante Informationen in einem Webbild entfernen, selbst wenn dies bedrohlich gedruckt wäre.
Durch das wiederholte Komprimieren einer Datei mit verlustbehafteten Methoden wird die Qualität natürlich beeinträchtigt - bei jedem Vorgang gehen mehr Daten verloren. Unten ist ein Foto, das ich dreimal komprimiert habe, um dies zu demonstrieren:
Sie können von links nach rechts sehen, wie die Qualität abnimmt. Es kann keine Rolle spielen, je nachdem, wofür das Bild verwendet wird, und deshalb gibt es verlustbehaftete Komprimierung.
Es ist wichtig zu wissen, dass mit verlustbehafteten Methoden komprimierte Dateien tatsächlich Daten verlieren, was bedeutet, dass Sie die Originaldatei nicht mit verlustbehafteten Methoden aus einer komprimierten Datei wiederherstellen können. Es ist offensichtlich, wenn Sie darüber nachdenken, aber viele Druckprojekte sind ruiniert worden, weil Sie diesen wichtigen Punkt nicht verstanden haben.
Ich habe hier eigentlich nur die Oberfläche gekratzt, also bitte: Lesen Sie mehr über die verlustbehaftete Komprimierung auf Wikipedia. Es ist irgendwie faszinierend.
Fazit
Durch die Komprimierung wurde das Web zu dem, was es ist. In den Tagen der Einwahl brachten komprimierte Bilder Fotos in unseren Browser, zumindest nicht mit einer akzeptablen Geschwindigkeit. Durch komprimiertes Video werden Websites wie YouTube möglich. Jeder, der Netzwerke für Dateifreigaben nutzt, ist mit ZIP- und RAR-Dateien vertraut.
Hast du noch etwas hinzuzufügen? Ich bin mir sicher, dass ich einige wichtige Punkte vermisst habe, also erzähle mir (und den anderen Lesern) in den folgenden Kommentaren.
Bildnachweis: Frühlingsbild via Shutterstock
Erfahren Sie mehr über: Dateikomprimierung.