ANSI vs Unicode
ANSI och Unicode är två teckenkodningar som vid en eller annan punkt i stor utsträckning användes. Användning är också den största skillnaden mellan de två som ANSI är mycket gammal och används av operativsystem som Windows 95/98 och äldre, medan Unicode är en nyare kodning som används av alla nuvarande operativsystem idag. ANSI hade många begränsningar som inte uppenbarligen var tydliga under de tidiga stadierna av användningen men blev smärtsamt tydliga när beräkningen började spridas globalt.
Den största nackdelen med ANSI är användningen av många kodsidor, beroende på vilket språk som används. Det finns en för engelska (kallat västeuropeiskt latin), grekiska, turkiska, hebreiska, arabiska och många andra. Det finns inget problem när alla datorer som åtkomst till data använder samma kodsida, men när olika kodsidor används, skulle dataläsningen inte vara densamma som de data som skrivits. Detta kan leda till datakorruption och jämn programkrasch i vissa scenarier.
Anledningen till att ANSI inte kan rymma är att den använder endast 8 bitar för att representera varje kodpunkt. Denna bredd är fast och har totalt 256 olika kombinationer. I jämförelse använder Unicode maximalt 32 bitar för varje kodpunkt; används i fast bredd i UTF-32. Men eftersom att använda fyra byte för varje tecken är ett så stort slöseri med utrymme, kodning med variabel bredd används i UTF-8 och UTF-16 för att spara utrymme.
Eftersom Unicode är en nyare standard förväntas det att äldre operativsystem inte stöder det. Även om kodpunkterna i UTF-8 och ANSI är ganska identiska kan äldre operativsystem som Windows 95 inte fungera med det. Därför kan program som använder Unicode inte kunna köras korrekt på dessa operativsystem. Med hänsyn till motsatsen, eller att köra ANSI-kodade program på nya operativsystem, är det möjligt eftersom det finns mekanismer för att konvertera mellan ANSI och Unicode. Tänk bara på att konvertering ger lite bearbetningskostnader. Det kan inte vara viktigt med dagens datorer, men det är fortfarande värt att notera att programmets effektivitet förbättras.
Sammanfattning:
1. ANSI är en mycket gammal teckenkodning och Unicode är den nuvarande standarden som används idag
2. ANSI använder olika sidor för olika språk medan Unicode inte gör det
3. ANSI använder kod med fast bredd medan Unicode kan använda både fast och variabel bredd
4. Unicode-program fungerar inte på äldre system
5. ANSI-program är långsammare än Unicode-program på nuvarande datorer