Skillnad mellan GZIP och BZIP2

GZIP vs BZIP2

GNU zip (även känd som GZIP) är ett program med syfte att komprimera filer. Det var ursprungligen avsett att ersätta komprimeringsprogrammet som användes i de tidiga Unix-systemen - för att användas i GNU-projektet (ett kostnadsfritt mjukvaruprojekt).

BZIP2 är en öppen källkodslöslös datakomprimeringsalgoritm - i grund och botten en klass av datakomprimeringsalgoritmer som gör det möjligt att originaldata från en komprimerad fil fullständigt rekonstrueras från komprimerade data.

GZIP är baserat på en algoritm som kallas DEFLATE. Detta är också en förlustfri datakomprimeringsalgoritm. Den använder både LZ77-algoritmen och Huffman-kodningen. I huvudsak hänvisar GZIP till filformatet med samma namn. Det här formatet är en 10-bytehuvud som innehåller ett magiskt nummer (vilket betyder ett numeriskt eller textvärde som aldrig ändras och används för att beteckna ett filformat eller protokoll, ett namnlöst numeriskt värde som aldrig ändras eller tydliga värden som inte kan misstas för allt annat), extra rubriker som kanske eller inte egentligen är nödvändiga (originalfilnamn, till exempel), en kropp som innehåller en DEFLATE-komprimerad nyttolast (vilket är de data som rubrikerna bär) och en 8-byte sidfot som innehåller en CRC-32 kontrollsumma, liksom den faktiska längden på den ursprungliga okomprimerade data.

Det finns en mängd olika kompressionstekniker som BZIP2-formatet använder, som staplas på varandra i flera lager. De förekommer i en mycket distinkt ordning: Kodlängds-kodning (vilken är en sekvens av fyra till 255 dubbla symboler som ersätts av de fyra första symbolerna och en längd av kodning som upprepas mellan 0 och 251), Burrows-Wheeler transform vilket är den reversibla block-sorten som utgör själva kärnan i BZIP2), Flytta framåt (lämnar storleken på det bearbetade blocket oförändrat), Kodlängds-kodning (som består av långa symboler - vanligtvis nollor - som ständigt upprepa i utmatningen och ersättas av både symbolen och en sekvens av två koder), Huffman-kodning (vilket är en process som ersätter symboler med fast längd med 8-bit byte med ändrade längdkoder), Multiple Hoffman-kodning (som består av flera Hoffman-tabeller av samma storlek), Unary bas 1-kodning, Delta-kodning och Sparse bit array.

Sammanfattning:

1. GZIP är en gratis applikation som används för att komprimera filer; BZIP2 är en öppen källkodslöslös datakomprimeringsalgoritm som gör det möjligt att hämta originaldata för en komprimerad fil.

2. GZIP består av en 10-bytehuvud, valfria rubriker, en kropp och en 8-byte-sidfot; BZIP2 består av inte färre än nio lager kompressionstekniker.