strona główna

Unikod

Tekst jest ciągiem znaków, a Unikod (najpopularniejszy z unikodów) umową tłumaczenia znaków na liczby naturalne i z powrotem rozszerzającą ASCII.

Aby użyć ich np. w systemie Ubuntu można wcisnąć control+shift+u, a następnie wpisać i zatwierdzić szesnastkowy kod znaku. Takie kody podane są poniżej dla wybranych znaków, w formie tabeli. Aby odczytać kod znaku należy najpierw odczytać cyfry z wiersza znaku, a następnie z jego kolumny i połączyć.

12B
3Bαβλ

Szesnastkowy kod znaku α to 3B1, β — 3B2, a λ — 3BB.

0215191A1D24459294A0A3A6CFD0D2D4
21
010512151618191A1B1C292AC4
22
11181C2D353637380003042728BBBCBD
2122
A0A1A7ACB1B2B3B6B7BCBDBEBFD7F7
 ¡§¬±²³·¼½¾¿×÷
89BC23456789AB
220228
0F11C0C1C2C3 08090A0B292A
22 23
1314191E1D2021263233343E445DD7
20
232425263C414548495D5F60616264656A6B
22
0E131E1F20212B34353637549597A1A4A5
22
A1A3ADB1B3C7C9CACB20212D
252B
192214B26212639263A26A129162A7D2A7E2E2E306E
ƒ⚡︎
123456789ABCDEF0123456789
39ΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟ3AΠΡΣΤΥΦΧΨΩ
3Bαβγδεζηθικλμνξο3Cπρςστυφχψω
3C3D3E3F4041424344454647
26
03569ABCDEF
266

strona z dużą tabelą unikodu

narzędzie do rozpoznawania znaków unikodowych z rysunku

podobne narzędzie do rozpoznawania symboli latexowych

UTF-8

UTF-8 jest systemem kodowania Unikodu jako ciągów bajtów zgodny z ASCII.

Poniżej ∕ i % będą oznaczać odpowiednio dzielenie całkowitoliczbowe i operację modulo.

Niech n będzie liczbą naturalną. Jeśli n < 27, jej kod UTF-8 składa się z jednego bajtu n.

W przeciwnym przypadku jeśli n < 211, to jej kod składa się z dwóch bajtów: 27+26+n∕26 i 27+n%26.

W p.p. jeśli n < 216, jej kod to trzy bajty: 27+26+25+n∕212, 27+(n∕26)%26 i 27+n%26.

W p.p. jeśli n < 221, jej kod to cztery bajty: 27+26+25+24+n∕218, 27+(n∕212)%26, 27+(n∕26)%26 i 27+n%26.

strona kodująca znaki UTF-8