Pretvori besedilo v binarno in nazaj — UTF-8 in ASCII s podporo slovenskim znakom.
Znaki: 11UTF-8 bajti: 11Dolžina izhoda: 107
Hitra referenca: pogosti znaki ASCII v 8-bitnem binarnem
Znak
Desetiško
Binarno (8 bitov)
A
65
01000001
Z
90
01011010
a
97
01100001
z
122
01111010
0
48
00110000
9
57
00111001
(presledek)
32
00100000
!
33
00100001
?
63
00111111
(nova vrstica)
10
00001010
Pogosta vprašanja
Kako deluje pretvorba besedila v binarno?
Vsak znak v besedilu ima številčno kodo (svojo kodno točko). Pri znakih ASCII koda ustreza 7 bitom in se dopolni do 8 z vodilno ničlo. Znak A ima kodo 65, kar je v binarnem zapisu 01000001. Pretvornik prebere vsak znak, poišče njegovo kodo in zapiše binarno predstavitev bajt za bajtom.
Kakšna je razlika med ASCII in UTF-8?
ASCII obsega 128 znakov (angleške črke, števke, ločila) in uporablja en 7-bitni bajt na znak. UTF-8 je kodiranje s spremenljivo dolžino, ki obvlada vse znake na svetu — latinico, cirilico, kitajske pismenke, arabščino, emojije — z enim do štirimi bajti na znak. Slovenski znaki č, š, ž niso v ASCII; v UTF-8 zasedejo po 2 bajta. Za slovenščino vedno uporabite UTF-8 — ASCII bo zavrnil č z napako.
Zakaj se mi binarno ne dekodira?
Najpogostejši vzroki: (1) bitne skupine niso po 8 (ali 7) bitov — preverite, da ni dodatnih presledkov; (2) v vnosu so znaki, ki niso 0 ali 1; (3) binarno predstavlja nepopolno UTF-8 zaporedje (npr. polovica zapisa za č). Dekoder javi položaj prve napake. Če v vnosu ni ločil, nastavite »Združevanje bitov« na 8 in »Ločilo« na »Brez«.
Koliko bitov na znak naj uporabim?
Standardna konvencija je 8 bitov na bajt. Čisti ASCII se sicer prilega v 7 bitov, vendar shranjeni podatki in omrežni protokoli vedno dopolnjujejo do 8. 7-bitno uporabite le pri starih teleprinterskih protokolih ali šolskih nalogah. Slovenski znaki (č, š, ž), cirilica, kitajske pismenke in emojiji zahtevajo večbajtno UTF-8, zato 7-bitno združevanje za njih ne velja.
Ali lahko pretvorim slovensko besedilo ali emoji?
Da — pustite kodiranje na UTF-8. Slovenski č je v UTF-8 dvobajten: 11000100 10001101. Enako š (11000101 10100001) in ž (11000101 10111110). Pismenke CJK (kitajske, japonske, korejske) so trojbajtne. Večina emojijev zaseda 4 bajte. Način ASCII vsak znak izven obsega 0–127 zavrne z napako, zato za slovensko besedilo uporabite UTF-8.
Je binarno enako kot strojna koda?
Ne. Binarno je le številska osnova — osnova 2 — ki uporablja dve števki, 0 in 1. Strojna koda je binarna predstavitev procesorskih ukazov in je specifično kodiranje za določen procesor. Binarno, ki ga vidite tukaj, je besedilo, kodirano v bajtih, in ne izvršljive instrukcije. Oboje uporablja ničle in enice, zato »binarno« pogovorno pomeni »računalniku razumljivo«.
Kako pretvorim binarno nazaj v besedilo?
Preklopite na zavihek »Binarno → Besedilo« in prilepite svoj binarni zapis. Dekoder vhod razdeli po ločilu (privzeto: presledek) v bajte, vsako skupino pretvori iz osnove 2 v desetiško kodno točko in sestavi rezultat. Pri UTF-8 pravilno spoji večbajtna zaporedja nazaj v en znak — tako se 11000100 10001101 pravilno prebere kot č.
Vsa pretvorba poteka v vašem brskalniku. Nič se ne nalaga na splet.
Orodje pretvarja besedilo v binarno predstavitev (osnova 2) in dekodira binarno nazaj v berljivo besedilo. Podpira kodiranje UTF-8 (kateri koli jezik, vključno s slovenskimi č, š, ž ter emojiji) in 7-bitno ASCII za delo s starejšimi protokoli. Izberete lahko združevanje po 8 ali 7 bitih in ločilo (presledek, vezaj, navpična črta ali brez).
Primer: znak č zaseda v UTF-8 dva bajta — 11000100 10001101. Beseda »OK« je v ASCII 01001111 01001011. Uporabno za naloge pri matura informatika, vaje pri Računalništvu na FRI UL ali FERI UM, kratke prikaze v učnem gradivu in razumevanje, kako računalnik shrani besedilo. Vsa pretvorba poteka v brskalniku, podatki ne zapustijo naprave.