Poate apărea tabelul de coduri ascii. Codificarea informațiilor text
Un computer înțelege procesul de conversie a acestuia într-o formă care permite transmiterea, stocarea sau procesarea automată mai convenabilă a acestor date. În acest scop sunt folosite diverse tabele. ASCII a fost primul sistem dezvoltat în Statele Unite pentru a lucra cu text în limba engleză, care a devenit ulterior răspândit în întreaga lume. Articolul de mai jos este dedicat descrierii, caracteristicilor, proprietăților și utilizării ulterioare.
Afișarea și stocarea informațiilor într-un computerSimbolurile de pe un monitor de computer sau de unul sau altul gadget digital mobil sunt formate pe baza unor seturi de forme vectoriale de diferite caractere și a unui cod care vă permite să găsiți printre ele simbolul care trebuie introdus la locul potrivit. Reprezintă o secvență de biți. Astfel, fiecare caracter trebuie să corespundă în mod unic unui set de zerouri și unu, care apar într-o anumită ordine unică.
Cum a început totulDin punct de vedere istoric, primele computere erau de limba engleză. Pentru a codifica informații simbolice în ele, a fost suficient să folosiți doar 7 biți de memorie, în timp ce 1 octet format din 8 biți a fost alocat în acest scop. Numărul de caractere înțeles de computer în acest caz a fost de 128. Aceste caractere includ alfabetul englez cu semnele de punctuație, numerele și unele caractere speciale. Codificarea pe șapte biți în limba engleză cu tabelul corespunzător (pagina de cod), dezvoltată în 1963, a fost numită Codul standard american pentru schimbul de informații. De obicei, abrevierea „codificare ASCII” a fost și este încă folosită pentru a o desemna.
Trecerea la multilingvismDe-a lungul timpului, computerele au devenit utilizate pe scară largă în țările care nu vorbesc engleza. În acest sens, a fost nevoie de codificări care să permită utilizarea limbilor naționale. S-a decis să nu se reinventeze roata și să se ia ca bază ASCII. Tabelul de codificare din noua ediție s-a extins semnificativ. Utilizarea celui de-al 8-lea bit a făcut posibilă traducerea a 256 de caractere într-un limbaj de calculator.
Codificarea ASCII are un tabel care este împărțit în 2 părți. Doar prima jumătate a acestuia este considerată a fi un standard internațional general acceptat. Include:
- Caractere cu numere de serie de la 0 la 31, codificate în secvențe de la 00000000 la 00011111. Sunt rezervate caracterelor de control care controlează procesul de afișare a textului pe ecran sau imprimantă, emiterea unui semnal sonor etc.
- Caracterele cu NN în tabel de la 32 la 127, codificate prin secvențe de la 00100000 la 01111111 formează partea standard a tabelului. Acestea includ un spațiu (N 32), litere ale alfabetului latin (minuscule și majuscule), numere din zece cifre de la 0 la 9, semne de punctuație, paranteze de diferite stiluri și alte simboluri.
- Caractere cu numere de serie de la 128 la 255, codificate prin secvențe de la 10000000 la 11111111. Acestea includ litere ale alfabetului național, altele decât cele latine. Această parte alternativă a tabelului ASCII este folosită pentru a converti caracterele rusești în formă de computer.
Caracteristicile codificării ASCII includ diferența dintre literele „A” - „Z” ale literelor mici și mari de doar un bit. Această circumstanță simplifică foarte mult conversia registrului, precum și verificarea dacă aceasta aparține unui anumit interval de valori. În plus, toate literele din sistemul de codificare ASCII sunt reprezentate de propriile numere de succesiune în alfabet, care sunt scrise cu 5 cifre în sistemul de numere binar, precedate de 011 2 pentru literele mici și 010 2 pentru literele mari.
Una dintre caracteristicile codificării ASCII este reprezentarea a 10 cifre - „0” - „9”. În al doilea sistem numeric ele încep cu 00112 și se termină cu 2 valori numerice. Astfel, 0101 2 este echivalent cu numărul zecimal cinci, astfel încât caracterul „5” este scris ca 0011 01012. Pe baza celor de mai sus, puteți converti cu ușurință numerele BCD într-un șir ASCII adăugând secvența de biți 00112 la fiecare ciugulit de pe stânga.
După cum știți, sunt necesare mii de caractere pentru a afișa texte în limbile grupului din Asia de Sud-Est. Un astfel de număr dintre ele nu poate fi descris în niciun fel într-un octet de informații, astfel încât nici măcar versiunile extinse de ASCII nu ar mai putea satisface nevoile crescute ale utilizatorilor din diferite țări.
Astfel, a apărut necesitatea creării unei codări universale a textului, a cărei dezvoltare, în colaborare cu mulți lideri ai industriei IT globale, a fost întreprinsă de consorțiul Unicode. Specialiștii săi au creat sistemul UTF 32 în acesta, 32 de biți au fost alocați pentru a codifica 1 caracter, constituind 4 octeți de informații. Principalul dezavantaj a fost o creștere bruscă a cantității de memorie necesară de până la 4 ori, ceea ce a implicat multe probleme.
În același timp, pentru majoritatea țărilor cu limbi oficiale aparținând grupului indo-european, numărul de caractere egal cu 232 este mai mult decât excesiv.
Ca urmare a lucrărilor ulterioare ale specialiștilor din consorțiul Unicode, a apărut codificarea UTF-16. A devenit opțiunea de conversie a informațiilor simbolice care se potrivea tuturor atât în ceea ce privește cantitatea de memorie necesară, cât și numărul de caractere codificate. De aceea, UTF-16 a fost adoptat implicit și necesită rezervarea a 2 octeți pentru un caracter.
Chiar și această versiune de Unicode destul de avansată și de succes a avut unele dezavantaje, iar după trecerea de la versiunea extinsă a ASCII la UTF-16, greutatea documentului s-a dublat.
În acest sens, s-a decis să se utilizeze codificarea cu lungime variabilă UTF-8. În acest caz, fiecare caracter al textului sursă este codificat ca o secvență de lungime de la 1 la 6 octeți.
Toate caracterele latine cu lungime variabilă UTF-8 sunt codificate în 1 octet, ca în sistemul de codificare ASCII.
O caracteristică specială a YTF-8 este că, în cazul textului în latină fără a utiliza alte caractere, chiar și programele care nu înțeleg Unicode vor putea să-l citească. Cu alte cuvinte, codarea de bază a textului ASCII devine pur și simplu parte a noului UTF cu lungime variabilă. Caracterele chirilice din YTF-8 ocupă 2 octeți și, de exemplu, caracterele georgiane - 3 octeți. Prin crearea UTF-16 și 8, principala problemă a creării unui singur spațiu de cod în fonturi a fost rezolvată. De atunci, producătorii de fonturi pot completa tabelul doar cu forme vectoriale de caractere text în funcție de nevoile lor.
Diferite sisteme de operare preferă diferite codificări. Pentru a putea citi și edita textele tastate într-o codificare diferită, se folosesc programe de conversie a textului rusesc. Unele editoare de text conțin transcoduri încorporate și vă permit să citiți text indiferent de codificare.
Acum știți câte caractere sunt în codificarea ASCII și cum și de ce a fost dezvoltată. Desigur, astăzi standardul Unicode este cel mai răspândit în lume. Totuși, nu trebuie să uităm că se bazează pe ASCII, așa că trebuie apreciată contribuția dezvoltatorilor săi în domeniul IT.
Dec | Hex | Simbol | Dec | Hex | Simbol | |
000 | 00 | specialist. NOP | 128 | 80 | Ђ | |
001 | 01 | specialist. DECI H | 129 | 81 | Ѓ | |
002 | 02 | specialist. STX | 130 | 82 | ‚ | |
003 | 03 | specialist. ETX | 131 | 83 | ѓ | |
004 | 04 | specialist. EOT | 132 | 84 | „ | |
005 | 05 | specialist. ENQ | 133 | 85 | … | |
006 | 06 | specialist. ACK | 134 | 86 | † | |
007 | 07 | specialist. BEL | 135 | 87 | ‡ | |
008 | 08 | specialist. B.S. | 136 | 88 | € | |
009 | 09 | specialist. TAB | 137 | 89 | ‰ | |
010 | 0A | specialist. LF | 138 | 8A | Љ | |
011 | 0B | specialist. VT | 139 | 8B | ‹ ‹ | |
012 | 0C | specialist. FF | 140 | 8C | Њ | |
013 | 0D | specialist. CR | 141 | 8 D | Ќ | |
014 | 0E | specialist. ASA DE | 142 | 8E | Ћ | |
015 | 0F | specialist. SI. | 143 | 8F | Џ | |
016 | 10 | specialist. DLE | 144 | 90 | ђ | |
017 | 11 | specialist. DC1 | 145 | 91 | ‘ | |
018 | 12 | specialist. DC2 | 146 | 92 | ’ | |
019 | 13 | specialist. DC3 | 147 | 93 | “ | |
020 | 14 | specialist. DC4 | 148 | 94 | ” | |
021 | 15 | specialist. N.A.K. | 149 | 95 | ||
022 | 16 | specialist. SYN | 150 | 96 | – | |
023 | 17 | specialist. ETB | 151 | 97 | — | |
024 | 18 | specialist. POATE SA | 152 | 98 | ||
025 | 19 | specialist. E.M. | 153 | 99 | ™ | |
026 | 1A | specialist. SUB | 154 | 9A | љ | |
027 | 1B | specialist. ESC | 155 | 9B | › | |
028 | 1C | specialist. FS | 156 | 9C | њ | |
029 | 1D | specialist. G.S. | 157 | 9D | ќ | |
030 | 1E | specialist. R.S. | 158 | 9E | ћ | |
031 | 1F | specialist. NE | 159 | 9F | џ | |
032 | 20 | ambreiaj SP (Spațiu) | 160 | A0 | ||
033 | 21 | ! | 161 | A1 | Ў | |
034 | 22 | " | 162 | A2 | ў | |
035 | 23 | # | 163 | A3 | Ћ | |
036 | 24 | $ | 164 | A4 | ¤ | |
037 | 25 | % | 165 | A5 | Ґ | |
038 | 26 | & | 166 | A6 | ¦ | |
039 | 27 | " | 167 | A7 | § | |
040 | 28 | ( | 168 | A8 | Eu | |
041 | 29 | ) | 169 | A9 | © | |
042 | 2A | * | 170 | A.A. | Є | |
043 | 2B | + | 171 | AB | « | |
044 | 2C | , | 172 | A.C. | ¬ | |
045 | 2D | - | 173 | ANUNȚ | | |
046 | 2E | . | 174 | A.E. | ® | |
047 | 2F | / | 175 | A.F. | Ї | |
048 | 30 | 0 | 176 | B0 | ° | |
049 | 31 | 1 | 177 | B1 | ± | |
050 | 32 | 2 | 178 | B2 | І | |
051 | 33 | 3 | 179 | B3 | і | |
052 | 34 | 4 | 180 | B4 | ґ | |
053 | 35 | 5 | 181 | B5 | µ | |
054 | 36 | 6 | 182 | B6 | ¶ | |
055 | 37 | 7 | 183 | B7 | · | |
056 | 38 | 8 | 184 | B8 | e | |
057 | 39 | 9 | 185 | B9 | № | |
058 | 3A | : | 186 | B.A. | є | |
059 | 3B | ; | 187 | BB | » | |
060 | 3C | < | 188 | B.C. | ј | |
061 | 3D | = | 189 | BD | Ѕ | |
062 | 3E | > | 190 | FI | ѕ | |
063 | 3F | ? | 191 | B.F. | ї | |
064 | 40 | @ | 192 | C0 | A | |
065 | 41 | A | 193 | C1 | B | |
066 | 42 | B | 194 | C2 | ÎN | |
067 | 43 | C | 195 | C3 | G | |
068 | 44 | D | 196 | C4 | D | |
069 | 45 | E | 197 | C5 | E | |
070 | 46 | F | 198 | C6 | ȘI | |
071 | 47 | G | 199 | C7 | Z | |
072 | 48 | H | 200 | C8 | ȘI | |
073 | 49 | eu | 201 | C9 | Y | |
074 | 4A | J | 202 | C.A. | LA | |
075 | 4B | K | 203 | C.B. | L | |
076 | 4C | L | 204 | CC | M | |
077 | 4D | M | 205 | CD | N | |
078 | 4E | N | 206 | C.E. | DESPRE | |
079 | 4F | O | 207 | CF | P | |
080 | 50 | P | 208 | D0 | R | |
081 | 51 | Q | 209 | D1 | CU | |
082 | 52 | R | 210 | D2 | T | |
083 | 53 | S | 211 | D3 | U | |
084 | 54 | T | 212 | D4 | F | |
085 | 55 | U | 213 | D5 | X | |
086 | 56 | V | 214 | D6 | C | |
087 | 57 | W | 215 | D7 | H | |
088 | 58 | X | 216 | D8 | SH | |
089 | 59 | Y | 217 | D9 | SCH | |
090 | 5A | Z | 218 | D.A. | Kommersant | |
091 | 5B | [ | 219 | D.B. | Y | |
092 | 5C | \ | 220 | DC | b | |
093 | 5D | ] | 221 | DD | E | |
094 | 5E | ^ | 222 | DE | YU | |
095 | 5F | _ | 223 | DF | eu | |
096 | 60 | ` | 224 | E0 | A | |
097 | 61 | A | 225 | E1 | b | |
098 | 62 | b | 226 | E2 | V | |
099 | 63 | c | 227 | E3 | G | |
100 | 64 | d | 228 | E4 | d | |
101 | 65 | e | 229 | E5 | e | |
102 | 66 | f | 230 | E6 | și | |
103 | 67 | g | 231 | E7 | h | |
104 | 68 | h | 232 | E8 | Și | |
105 | 69 | i | 233 | E9 | th | |
106 | 6A | j | 234 | E.A. | La | |
107 | 6B | k | 235 | E.B. | l | |
108 | 6C | l | 236 | E.C. | m | |
109 | 6D | m | 237 | ED | n | |
110 | 6E | n | 238 | E.E. | O | |
111 | 6F | o | 239 | E.F. | P | |
112 | 70 | p | 240 | F0 | R | |
113 | 71 | q | 241 | F1 | Cu | |
114 | 72 | r | 242 | F2 | T | |
115 | 73 | s | 243 | F3 | la | |
116 | 74 | t | 244 | F4 | f | |
117 | 75 | u | 245 | F5 | X | |
118 | 76 | v | 246 | F6 | ts | |
119 | 77 | w | 247 | F7 | h | |
120 | 78 | X | 248 | F8 | w | |
121 | 79 | y | 249 | F9 | sch | |
122 | 7A | z | 250 | FA. | ъ | |
123 | 7B | { | 251 | FB | s | |
124 | 7C | | | 252 | F.C. | b | |
125 | 7D | } | 253 | FD | uh | |
126 | 7E | ~ | 254 | F.E. | Yu | |
127 | 7F | Specialist. DEL | 255 | FF | eu |
Descrierea caracterelor speciale (de control) Trebuie menționat că inițial caracterele de control ale tabelului ASCII au fost folosite pentru a asigura schimbul de date prin teletip, introducerea datelor de pe bandă perforată și pentru controlul simplu al dispozitivelor externe.
În prezent, majoritatea caracterelor de control ale tabelelor ASCII nu mai poartă această încărcare și pot fi folosite în alte scopuri.
NUL, 00 | Nul, gol |
SOH, 01 | Începutul titlului |
STX, 02 | Începutul textului, începutul textului. |
ETX, 03 | Sfârșitul textului, sfârșitul textului |
EOT, 04 | Sfârșitul transmisiei |
ENQ, 05 | Întreba. Vă rugăm să confirmați |
ACK, 06 | Confirmare. confirm |
BEL, 07 | Bell, sună |
BS, 08 | Backspace, întoarceți un caracter înapoi |
TAB, 09 | Filă, filă orizontală |
LF, 0A | Line Feed, line feed. În prezent, în majoritatea limbajelor de programare este notat ca \n |
VT, 0B | Filă verticală, tabulare verticală. |
FF, 0C | Feed de formulare, feed de pagini, pagină nouă |
CR, 0D | Întoarcere cu cărucior, întoarcere cu cărucior. În prezent, în majoritatea limbajelor de programare este notat cu \r |
deci,0E | Shift Out, schimbați culoarea benzii de cerneală din dispozitivul de imprimare |
SI,0F | Schimbați, întoarceți înapoi culoarea benzii de cerneală din dispozitivul de imprimare |
DLE, 10 | Data Link Escape, comutarea canalului la transmisia de date |
DC1, 11 DC2, 12 DC3, 13 DC4, 14 | Controlul dispozitivului, simboluri de control al dispozitivului |
NAK, 15 | Confirmare negativă, nu confirm. |
SYN, 16 | Sincronizare. Simbol de sincronizare |
ETB, 17 | Sfârșitul blocului de text, sfârșitul blocului de text |
CAN, 18 | Anulare, anulare a unei transmise anterior |
EM, 19 | Sfârșitul Mediului |
SUB, 1A | Înlocuitor, înlocuitor. Plasat în locul unui simbol al cărui sens a fost pierdut sau corupt în timpul transmiterii |
ESC, 1B | Secvență de control de evacuare |
FS, 1C | Separator de fișiere, separator de fișiere |
GS, 1D | Separator de grup |
RS, 1E | Separator de înregistrări, separator de înregistrări |
SUA, 1F | Separator de unități |
DEL, 7F | Ștergeți, ștergeți ultimul caracter. |
Excel pentru Office 365 Word pentru Office 365 Outlook pentru Office 365 PowerPoint pentru Office 365 Publisher pentru Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio Standard 2019 Outlook Word 2019 Excel 2061 2066 she 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 2010 Word Visio 20710 2010 2010 07 Publisher 2007 Access 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standard 2007 Visio Standard 2010 Mai puțin
În acest articol: inserați un caracter ASCII sau Unicode într-un documentDacă trebuie să introduceți doar câteva caractere speciale sau simboluri, puteți utiliza comenzile rapide de la tastatură. Pentru o listă de caractere ASCII, consultați următoarele tabele sau articolul Inserarea alfabetelor naționale folosind comenzile rapide de la tastatură.
Note:
Inserarea caracterelor ASCIIPentru a introduce un caracter ASCII, apăsați și mențineți apăsată tasta ALT în timp ce introduceți codul caracterului. De exemplu, pentru a introduce un simbol grad (º), apăsați și mențineți apăsată tasta ALT, apoi introduceți 0176 pe tastatura numerică.
Pentru a introduce numere, utilizați tastatura numerică în loc de numerele de pe tastatura principală. Dacă trebuie să introduceți numere pe tastatura numerică, asigurați-vă că indicatorul BLOCARE NUMĂR este aprins.
Inserarea caracterelor UnicodePentru a introduce un caracter Unicode, introduceți codul caracterului, apoi apăsați ALT și X. De exemplu, pentru a introduce un simbol dolar ($), introduceți 0024 și apăsați ALT și X. Pentru toate codurile de caractere Unicode, consultați .
Important: Unele programe Microsoft Office, cum ar fi PowerPoint și InfoPath, nu acceptă conversia codurilor Unicode în caractere. Dacă trebuie să inserați un caracter Unicode într-unul dintre aceste programe, utilizați .
Note:
Dacă apare un caracter Unicode greșit după ce apăsați ALT+X, selectați codul corect, apoi apăsați din nou ALT+X.
În plus, trebuie să introduceți „U+” înainte de cod. De exemplu, dacă introduceți „1U+B5” și apăsați ALT+X, va fi afișat textul „1µ”, iar dacă introduceți „1B5” și apăsați ALT+X, va fi afișat simbolul „Ƶ”.
Un tabel de caractere este un program încorporat în Microsoft Windows care vă permite să vizualizați caracterele disponibile pentru un font selectat.
Folosind un tabel de simboluri, puteți copia simboluri individuale sau un grup de simboluri în clipboard și le puteți lipi în orice program care acceptă afișarea acestor simboluri. Deschiderea tabelului de simboluri
În Windows 10, introduceți cuvântul „simbol” în caseta de căutare din bara de activități și selectați tabelul cu simboluri din rezultatele căutării.
În Windows 8, tastați „simbol” pe ecranul Start și selectați tabelul cu simboluri din rezultatele căutării.
În Windows 7, faceți clic pe butonul Start, selectați Toate programele, Accesorii, Instrumente de sistem, apoi faceți clic pe Harta caracterelor.
Caracterele sunt grupate după font. Faceți clic pe lista de fonturi pentru a selecta setul de caractere corespunzător. Pentru a selecta un simbol, faceți clic pe acesta, apoi faceți clic pe butonul Selectați. Pentru a insera un simbol, faceți clic dreapta pe locația dorită din document și selectați Lipire.
Codurile de caractere utilizate frecventPentru o listă completă de caractere, consultați Computer, Tabel de coduri de caractere ASCII sau Tabele de caractere Unicode organizate după set.
Valută |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Simboluri legale |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Simboluri matematice |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Fracții |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Simboluri de punctuație și dialect |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Simboluri de formă |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Codurile diacritice utilizate în mod obișnuit Pentru o listă completă de glife și codurile corespunzătoare, consultați.
|
Potrivit Uniunii Internaționale de Telecomunicații, în 2016, trei miliarde și jumătate de oameni au folosit internetul cu o oarecare regularitate. Cei mai mulți dintre ei nici nu se gândesc la faptul că orice mesaje pe care le trimit prin intermediul computerului sau gadgeturilor mobile, precum și textele care sunt afișate pe tot felul de monitoare, sunt de fapt combinații de 0 și 1. Această reprezentare a informațiilor se numește codificare . Acesta asigură și facilitează foarte mult stocarea, prelucrarea și transmiterea acestuia. În 1963, a fost dezvoltată codarea ASCII americană, care face obiectul acestui articol.
Prezentarea informațiilor pe computerDin punctul de vedere al oricărui computer electronic, textul este un set de caractere individuale. Acestea includ nu numai litere, inclusiv majuscule, ci și semne de punctuație și numere. În plus, sunt folosite caractere speciale „=”, „&”, „(” și spații.
Setul de caractere care alcătuiesc textul se numește alfabet, iar numărul lor se numește cardinalitate (notat cu N). Pentru a-l determina, se folosește expresia N = 2^b, unde b este numărul de biți sau greutatea informației unui anumit simbol.
S-a dovedit că un alfabet cu o capacitate de 256 de caractere poate reprezenta toate caracterele necesare.
Deoarece 256 reprezintă a 8-a putere a doi, greutatea fiecărui caracter este de 8 biți.
O unitate de măsură de 8 biți se numește 1 octet, deci se obișnuiește să spunem că orice caracter din text stocat pe un computer ocupă un octet de memorie.
Orice texte sunt introduse în memoria unui computer personal folosind tastele de la tastatură pe care sunt scrise numere, litere, semne de punctuație și alte simboluri. Ele sunt transferate în RAM în cod binar, adică fiecare caracter este asociat cu un cod zecimal cunoscut oamenilor, de la 0 la 255, care corespunde unui cod binar - de la 00000000 la 11111111.
Codificarea caracterelor octet-octet permite procesorului care efectuează procesarea textului să acceseze fiecare caracter individual. În același timp, 256 de caractere sunt destul de suficiente pentru a reprezenta orice informație simbolică.
Această abreviere în engleză înseamnă cod pentru schimbul de informații.
Chiar și în zorii computerizării, a devenit evident că era posibil să se vină cu o mare varietate de modalități de codificare a informațiilor. Cu toate acestea, pentru a transfera informații de la un computer la altul, a fost necesar să se dezvolte un standard unificat. Deci, în 1963, în SUA a apărut tabelul de codificare ASCII. În el, orice simbol al alfabetului computerului este asociat cu numărul său de serie în reprezentare binară. ASCII a fost folosit inițial doar în Statele Unite și mai târziu a devenit un standard internațional pentru computere.
Codurile ASCII sunt împărțite în 2 părți. Doar prima jumătate a acestui tabel este considerată standard internațional. Include caractere cu numere de serie de la 0 (codat ca 00000000) la 127 (codat 01111111).
Număr de serie | Codificarea textului ASCII | Simbol |
0000 0000 - 0001 1111 | Caracterele cu N de la 0 la 31 se numesc caractere de control. Funcția lor este de a „gestiona” procesul de afișare a textului pe un monitor sau dispozitiv de imprimare, oferirea unui semnal sonor etc. |
|
0010 0000 - 0111 1111 | Caractere de la N de la 32 la 127 (partea standard a tabelului) - litere mari și mici ale alfabetului latin, cifrele a zecea, semne de punctuație, precum și diverse paranteze, simboluri comerciale și alte simboluri. Caracterul 32 reprezintă un spațiu. |
|
1000 0000 - 1111 1111 | Caracterele cu N de la 128 la 255 (parte alternativă a tabelului sau a paginii de cod) pot avea diferite variante, fiecare având propriul său număr. Pagina de coduri este folosită pentru a specifica alfabetele naționale care sunt diferite de latină. În special, cu ajutorul acestuia se realizează codificarea ASCII pentru caracterele rusești. |
În tabel, codificările sunt scrise cu majuscule și se succed în ordine alfabetică, iar numerele sunt în ordine crescătoare. Acest principiu rămâne același pentru alfabetul rus.
Personaje de controlTabelul de codificare ASCII a fost creat inițial pentru a primi și transmite informații prin intermediul unui dispozitiv care nu a fost folosit de mult timp, cum ar fi un teletype. În acest sens, în setul de caractere au fost incluse caractere neprintabile, folosite ca comenzi pentru a controla acest dispozitiv. Comenzi similare au fost folosite în astfel de metode de mesagerie pre-computer precum codul Morse etc.
Cel mai comun caracter de teletip este NUL (00). Este folosit și astăzi în majoritatea limbajelor de programare pentru a indica sfârșitul unei linii.
Codul standard american este necesar nu numai pentru introducerea informațiilor text pe tastatură. Este folosit și în grafică. În special, în ASCII Art Maker, imaginile diferitelor extensii reprezintă un spectru de caractere ASCII.
Există două tipuri de astfel de produse: cele care îndeplinesc funcția de editor grafic prin conversia imaginilor în text și cele care convertesc „desenele” în grafică ASCII. De exemplu, celebra emoticon este un exemplu excelent de simbol de codificare.
ASCII poate fi folosit și la crearea unui document HTML. În acest caz, puteți introduce un anumit set de caractere, iar la vizualizarea paginii va apărea pe ecran un simbol care corespunde acestui cod.
ASCII este, de asemenea, necesar pentru crearea de site-uri web multilingve, deoarece caracterele care nu sunt incluse într-un tabel național specific sunt înlocuite cu coduri ASCII.
ASCII a fost folosit inițial pentru a codifica informațiile text folosind 7 biți (unul a fost lăsat necompletat), dar astăzi funcționează ca 8 biți.
Literele situate în coloanele situate deasupra și dedesubt diferă între ele doar într-un singur bit. Acest lucru reduce semnificativ complexitatea auditului.
Utilizarea ASCII în Microsoft OfficeDacă este necesar, acest tip de codificare a informațiilor text poate fi utilizat în editorii de text Microsoft, cum ar fi Notepad și Office Word. Cu toate acestea, este posibil să nu puteți utiliza unele funcții când introduceți text în acest caz. De exemplu, nu veți putea folosi text îngroșat deoarece codarea ASCII păstrează doar sensul informațiilor, ignorând aspectul și forma generală a acesteia.
Organizația ISO a adoptat standardele ISO 8859. Acest grup definește codificări pe opt biți pentru diferite grupuri de limbi. Mai exact, ISO 8859-1 este un tabel ASCII extins pentru Statele Unite și țările din Europa de Vest. Și ISO 8859-5 este un tabel folosit pentru alfabetul chirilic, inclusiv limba rusă.
Din mai multe motive istorice, standardul ISO 8859-5 a fost folosit pentru o perioadă foarte scurtă de timp.
Pentru limba rusă, în acest moment sunt utilizate următoarele codificări:
- CP866 (Pagina de cod 866) sau DOS, care este adesea numită codificare GOST alternativă. A fost folosit activ până la mijlocul anilor 90 ai secolului trecut. Momentan practic nu este folosit.
- KOI-8. Codificarea a fost dezvoltată în anii 1970 și 80 și este în prezent standardul general acceptat pentru mesajele de e-mail pe RuNet. Este utilizat pe scară largă în sistemele de operare Unix, inclusiv Linux. Versiunea „rusă” a KOI-8 se numește KOI-8R. În plus, există versiuni pentru alte limbi chirilice, cum ar fi ucraineană.
- Pagina de cod 1251 (CP 1251, Windows - 1251). Dezvoltat de Microsoft pentru a oferi suport pentru limba rusă în mediul Windows.
Principalul avantaj al primului standard CP866 a fost păstrarea caracterelor pseudografice în aceleași poziții ca și în ASCII extins. Acest lucru a făcut posibilă rularea programelor text fabricate în străinătate, cum ar fi celebrul Norton Commander, fără modificări. În prezent, CP866 este utilizat pentru programele dezvoltate pentru Windows care rulează în modul text pe ecran complet sau în ferestre text, inclusiv FAR Manager.
Textele de computer scrise în codificare CP866 sunt destul de rare în zilele noastre, dar este cea care este folosită pentru numele fișierelor rusești în Windows.
„Unicode”În acest moment, această codificare este cea mai utilizată. Codurile Unicode sunt împărțite în zone. Primul (U+0000 la U+007F) include caractere ASCII cu coduri. Urmează zonele de caractere ale diferitelor scripturi naționale, precum și semnele de punctuație și simbolurile tehnice. În plus, unele coduri Unicode sunt rezervate în cazul în care este necesar să se includă noi caractere în viitor.
Acum știți că în ASCII, fiecare caracter este reprezentat ca o combinație de 8 zerouri și unu. Pentru nespecialiști, aceste informații pot părea inutile și neinteresante, dar nu vrei să știi ce se întâmplă „în creierul” computerului tău?!
Apropo, pe site-ul nostru puteți converti orice text în cod zecimal, hexazecimal, binar folosind Calculatorul de cod online.
Tabelul ASCIIASCII (Codul standard american pentru schimbul de informații)
Tabel de coduri de caractere ASCII Windows (Win-1251)
|
|
Backspace (Returnează un caracter). Indică faptul că mecanismul de imprimare sau cursorul de afișare se deplasează înapoi cu o poziție. |
|
Tabularea orizontală. Indică mișcarea motorului de imprimare sau a cursorului de afișare la următorul „tab stop” prescris. |
|
Linie de alimentare. Indică mișcarea mecanismului de imprimare sau a cursorului de afișare la începutul liniei următoare (în jos pe o linie). |
|
Tabularea verticală. Indică mișcarea mecanismului de imprimare sau a cursorului de afișare la următorul grup de linii. |
|
Feed de formulare. Indică mișcarea motorului de imprimare sau a cursorului de afișare la poziția de pornire a paginii, formularului sau ecranului următor. |
|
Retur transport. Indică mișcarea mecanismului de imprimare sau a cursorului de afișare către poziția inițială (cel mai din stânga) a liniei curente. |
Începutul titlului. Folosit pentru a defini începutul unui antet, care poate conține informații de rutare sau o adresă. |
|
Începutul textului. Afișează începutul textului și, în același timp, sfârșitul titlului. |
|
Sfârșitul textului. Se aplică la încheierea textului care a început cu caracterul STX. |
|
Anchetă. Solicitarea datelor de identificare (cum ar fi „Cine ești?”) de la o stație la distanță. |
|
Recunoașteți. Dispozitivul receptor transmite acest caracter expeditorului ca confirmare a recepției cu succes a datelor. |
|
Recunoaștere negativă. Dispozitivul receptor transmite acest caracter expeditorului în cazul refuzului (eșecului) recepției datelor. |
|
Sincron/Inactiv. Folosit în sistemele de transmisie sincronizată. Când nu există transmisie de date, sistemul trimite continuu simboluri SYN pentru a asigura sincronizarea. |
|
Sfârșitul blocului de transmisie. Indică sfârșitul unui bloc de date în scopuri de comunicare. Folosit pentru a împărți cantități mari de date în blocuri separate. |
Nul. (Fără caracter - fără date). Folosit pentru transmisie atunci când nu există date. |
|
Clopot (Apel). Folosit pentru controlul dispozitivelor de alarmă. |
|
Schimbă afară. Indică faptul că toate cuvintele de cod ulterioare trebuie interpretate conform setului de caractere extern înainte de sosirea caracterului SI. |
|
Schimbă în. Indică faptul că combinațiile ulterioare de coduri trebuie interpretate conform setului de caractere standard. |
|
Data Link Escape. Schimbarea semnificației următoarelor caractere. Folosit pentru control suplimentar sau pentru transmiterea unei combinații arbitrare de biți. |
|
DC1, DC2, DC3, DC4 |
Comenzile dispozitivului. Simboluri pentru operarea dispozitivelor auxiliare (funcții speciale). |
Anulare. Indică faptul că datele care preced acest caracter într-un mesaj sau bloc ar trebui ignorate (de obicei, dacă este detectată o eroare). |
|
Sfârșitul Mediului. Indică capătul fizic al unei benzi sau al altui mediu de stocare |
|
Substitui. Folosit pentru a înlocui un caracter eronat sau invalid. |
|
Evadare (Extindere). Folosit pentru a extinde codul indicând faptul că un caracter ulterior are un sens alternativ. |
|
Spaţiu. Un caracter care nu se imprimă folosit pentru a separa cuvintele sau pentru a muta motorul de imprimare sau pentru a afișa cursorul înainte cu o poziție. |
|
Șterge. Folosit pentru a șterge (șterge) caracterul anterior dintr-un mesaj |