Uncategorized

Pretvornik binarno ↔ besedilo

Pretvori besedilo v binarno in nazaj — UTF-8 in ASCII s podporo slovenskim znakom.

Besedilo za pretvorbo

Kodiranje

Združevanje bitov

Ločilo

Znaki: 11 UTF-8 bajti: 11 Dolžina izhoda: 107

Binarni izhod

01010000 01101111 01111010 01100100 01110010 01100001 01110110 01101100 01101010 01100101 01101110

Hitra referenca: pogosti znaki ASCII v 8-bitnem binarnem
Znak	Desetiško	Binarno (8 bitov)
A	65	01000001
Z	90	01011010
a	97	01100001
z	122	01111010
0	48	00110000
9	57	00111001
(presledek)	32	00100000
!	33	00100001
?	63	00111111
(nova vrstica)	10	00001010

Pogosta vprašanja

Kako deluje pretvorba besedila v binarno?

Vsak znak v besedilu ima številčno kodo (svojo kodno točko). Pri znakih ASCII koda ustreza 7 bitom in se dopolni do 8 z vodilno ničlo. Znak A ima kodo 65, kar je v binarnem zapisu 01000001. Pretvornik prebere vsak znak, poišče njegovo kodo in zapiše binarno predstavitev bajt za bajtom.

Kakšna je razlika med ASCII in UTF-8?

ASCII obsega 128 znakov (angleške črke, števke, ločila) in uporablja en 7-bitni bajt na znak. UTF-8 je kodiranje s spremenljivo dolžino, ki obvlada vse znake na svetu — latinico, cirilico, kitajske pismenke, arabščino, emojije — z enim do štirimi bajti na znak. Slovenski znaki č, š, ž niso v ASCII; v UTF-8 zasedejo po 2 bajta. Za slovenščino vedno uporabite UTF-8 — ASCII bo zavrnil č z napako.

Zakaj se mi binarno ne dekodira?

Najpogostejši vzroki: (1) bitne skupine niso po 8 (ali 7) bitov — preverite, da ni dodatnih presledkov; (2) v vnosu so znaki, ki niso 0 ali 1; (3) binarno predstavlja nepopolno UTF-8 zaporedje (npr. polovica zapisa za č). Dekoder javi položaj prve napake. Če v vnosu ni ločil, nastavite »Združevanje bitov« na 8 in »Ločilo« na »Brez«.

Koliko bitov na znak naj uporabim?

Standardna konvencija je 8 bitov na bajt. Čisti ASCII se sicer prilega v 7 bitov, vendar shranjeni podatki in omrežni protokoli vedno dopolnjujejo do 8. 7-bitno uporabite le pri starih teleprinterskih protokolih ali šolskih nalogah. Slovenski znaki (č, š, ž), cirilica, kitajske pismenke in emojiji zahtevajo večbajtno UTF-8, zato 7-bitno združevanje za njih ne velja.

Ali lahko pretvorim slovensko besedilo ali emoji?

Da — pustite kodiranje na UTF-8. Slovenski č je v UTF-8 dvobajten: 11000100 10001101. Enako š (11000101 10100001) in ž (11000101 10111110). Pismenke CJK (kitajske, japonske, korejske) so trojbajtne. Večina emojijev zaseda 4 bajte. Način ASCII vsak znak izven obsega 0–127 zavrne z napako, zato za slovensko besedilo uporabite UTF-8.

Je binarno enako kot strojna koda?

Ne. Binarno je le številska osnova — osnova 2 — ki uporablja dve števki, 0 in 1. Strojna koda je binarna predstavitev procesorskih ukazov in je specifično kodiranje za določen procesor. Binarno, ki ga vidite tukaj, je besedilo, kodirano v bajtih, in ne izvršljive instrukcije. Oboje uporablja ničle in enice, zato »binarno« pogovorno pomeni »računalniku razumljivo«.

Kako pretvorim binarno nazaj v besedilo?

Preklopite na zavihek »Binarno → Besedilo« in prilepite svoj binarni zapis. Dekoder vhod razdeli po ločilu (privzeto: presledek) v bajte, vsako skupino pretvori iz osnove 2 v desetiško kodno točko in sestavi rezultat. Pri UTF-8 pravilno spoji večbajtna zaporedja nazaj v en znak — tako se 11000100 10001101 pravilno prebere kot č.

Vsa pretvorba poteka v vašem brskalniku. Nič se ne nalaga na splet.

Orodje pretvarja besedilo v binarno predstavitev (osnova 2) in dekodira binarno nazaj v berljivo besedilo. Podpira kodiranje UTF-8 (kateri koli jezik, vključno s slovenskimi č, š, ž ter emojiji) in 7-bitno ASCII za delo s starejšimi protokoli. Izberete lahko združevanje po 8 ali 7 bitih in ločilo (presledek, vezaj, navpična črta ali brez).

Primer: znak č zaseda v UTF-8 dva bajta — 11000100 10001101. Beseda »OK« je v ASCII 01001111 01001011. Uporabno za naloge pri matura informatika, vaje pri Računalništvu na FRI UL ali FERI UM, kratke prikaze v učnem gradivu in razumevanje, kako računalnik shrani besedilo. Vsa pretvorba poteka v brskalniku, podatki ne zapustijo naprave.