Différence entre GZIP et BZIP2 Différence entre

Anonim

GZIP vs BZIP2

GNU zip (également connu sous le nom GZIP) est un logiciel avec le but de compresser des dossiers. Il était à l'origine destiné à remplacer le programme de compression utilisé dans les premiers systèmes Unix - à utiliser dans le projet GNU (un projet de logiciel libre).

BZIP2 est un algorithme de compression de données open source sans perte - essentiellement une classe d'algorithmes de compression de données qui permet de reconstruire complètement les données d'origine d'un fichier compressé à partir des données compressées.

GZIP est basé sur un algorithme connu sous le nom de DEFLATE. C'est également un algorithme de compression de données sans perte. Il utilise à la fois l'algorithme LZ77 et le codage Huffman. Essentiellement, GZIP fait référence au format de fichier du même nom. Ce format est un en-tête de 10 octets qui contient un nombre magique (valeur numérique ou texte qui ne change jamais et est utilisé pour indiquer un format de fichier ou un protocole, une valeur numérique non modifiée qui ne change jamais ou des valeurs distinctes qui ne peuvent pas être confondues pour toute autre chose), des en-têtes supplémentaires qui peuvent être nécessaires ou non (nom de fichier d'origine, par exemple), un corps contenant une charge utile DEFLATE (les données que portent les en-têtes) et un pied de page de 8 octets qui contient une somme de contrôle CRC-32, ainsi que la longueur réelle des données non compressées d'origine.

Il existe diverses techniques de compression que le format BZIP2 utilise, empilées les unes sur les autres dans plusieurs couches. Ils se produisent dans un ordre très distinctif: Codage Run-Length (qui est une séquence de quatre à 255 symboles dupliqués qui est remplacée par les quatre premiers symboles, et une longueur de codage qui se répète entre 0 et 251), Burrows-Wheeler transform (qui est le type de bloc réversible qui constitue le noyau même du BZIP2), Move to front (laisse inchangé la taille du bloc traité), Encodage run-length (qui se compose de longs brins de symboles - habituellement des zéros - qui constamment répéter dans la sortie, et sont remplacés par le symbole et une séquence de deux codes), codage Huffman (qui est un processus qui remplace les symboles de longueur fixe de 8 bits octets avec des codes de longueur changeants), codage Hoffman multiple (qui se composent de plusieurs tables Hoffman de taille identique), le codage Unary base 1, le codage Delta et le tableau de bits Sparse.

Résumé:

1. GZIP est une application gratuite utilisée pour compresser des fichiers; BZIP2 est un algorithme de compression de données sans perte open source qui permet de récupérer les données d'origine d'un fichier compressé.

2. GZIP se compose d'un en-tête de 10 octets, d'en-têtes facultatifs, d'un corps et d'un pied de page de 8 octets; BZIP2 consiste en pas moins de neuf couches de techniques de compression.