Mis on Unicode?

Ülemaailmne standard, kus iga märk kasutab unikaalset numbrit U + 0000 ja U + 10FFFF vahel, võib Unicode olla 8-bitine, 16-bitine või 32-bitine. Numbreid, matemaatilist märget, populaarseid sümboleid ja kõigi keelte märke omistatakse koodipunktile, näiteks U + 0041 on inglise täht "A." Allpool on näide sellest, kuidas "Arvuti lootus" oleks kirjutatud inglise Unicode'is.

U + 0043 U + 006F U + 006D U + 0070 U + 0075 U + 0074 U + 0065 U + 0072 U + 00A0 U + 0048 U + 006F U + 0070 U + 006 U

Näpunäide: Microsofti Windowsi kasutajad saavad Unicode'i koodipunkte leida ka tähemärgikaardi utiliidi käivitamisega.

ASCII, BOM, märk, koodileht, tarkvaratingimused, UTF