Kodiranje ASCII. Tabela kodiranja ASCII

S kodiranjem informacij v računalnik se nanaša na proces preoblikovanja v obliko, ki omogoča organiziranje bolj priročnega prenosa, shranjevanja ali avtomatske obdelave teh podatkov. V ta namen se uporabljajo različne tabele. Kodiranje ASCII je prvi sistem, ki je bil razvit v Združenih državah za delo z angleškim besedilom, ki je bilo nato razširjeno po vsem svetu. Njegov opis, značilnosti, lastnosti in nadaljnja uporaba je posvečena spodnjemu članku.

Prikaz in shranjevanje informacij v računalniku

Simboli na računalniškem monitorju ali mobilnem digitalnem pripomočku so oblikovani na podlagi nizov vektorskih oblik različnih kodnih simbolov, ki vam omogočajo, da najdete med njimi simbol, ki ga je treba vstaviti v. potrebujete kraj. Gre za zaporedje bitov. Tako mora vsak znak ustrezati nizu ničel in enot, ki so v določenem, unikatnem vrstnem redu.

Kako se je vse začelo

V zgodovini so bili prvi računalniki angleško govoreči. Za kodiranje informacij o znakih v njih je bilo dovolj uporabiti samo 7 bitov pomnilnika, za ta namen pa je bil dodeljen 1 bajt, sestavljen iz 8 bitov. Število znakov, ki jih računalnik razume v tem primeru, je bilo samo 128. Ti znaki so sestavljali angleška abeceda z ločili, številkami in nekaterimi posebnimi znaki. Angleško sedembitno kodiranje z ustrezno tabelo (kodno stran), razvito leta 1963, je bilo imenovano American Standard Code za informacijeIzmenjava Običajno je bila uporabljena kratica "ASCII kodiranje", ki se uporablja za njeno označevanje.

Prehod na večjezičnost

Računalniki so se sčasoma pogosto uporabljali v državah, ki niso angleško govoreče. V zvezi s tem je obstajala potreba po kodiranju, ki omogoča uporabo nacionalnih jezikov. Odločili smo se, da ne bomo ponovno izumili kolesa, in da bomo osnovali ASCII. Tabela kodiranja v novi izdaji se je znatno razširila. Uporaba 8. bita omogoča prevajanje 256 znakov v računalniški jezik.

Opis

Kodiranje ASCII ima tabelo, ki je razdeljena na dva dela. Splošno sprejet mednarodni standard velja samo za prvo polovico. Vključuje:
  • simbole s zaporednimi številkami od 0 do 31 kodiranih zaporedij od 00000000 do 00011111. Rezervirani so za kontrolne znake, ki nadzorujejo postopek izpisovanja besedila na zaslon ali tiskalnik, z zvočnim signalom itd.
  • 15) NN simboli v tabeli od 32 do 127 kodiranih zaporedij od 00100000 do 01111111 tvorijo standardni del tabele. Vključujejo prostor (N 32), črke latinice (velike in majhne), desetmestne številke od 0 do 9 ločil, oklepaje različnih vrstic in druge simbole.
  • Simboli s serijskimi številkami od 128 do 255, ki so kodirani z zaporedji od 10.000.000 do 1100. Ti vključujejo abecedne črke, ki niso latinske. Ta alternativni del tabele kodiranja ASCII se uporablja za pretvorbo ruskih znakov v računalniško obliko.
  • Nekatere lastnosti

    Funkcije kodiranja ASCII vključujejo kratico spodnje in zgornje črke "A" do "Z" samo en bit. Ta okoliščina močno poenostavi preoblikovanje registra, kot tudi njegovo preverjanje pripadnosti določenemu območju vrednosti. Poleg tega so vse črke v sistemu kodiranja ASCII predstavljene z njihovimi lastnimi zaporednimi številkami v abecedi, ki so zapisane z 5 števkami v binarnem sistemu, pred katerimi so črke male črke 011 2, zgornja pa 010 2.
    Med značilnostmi kodiranja ASCII lahko preštejemo predstavitev 10 številk - "0" - "9". V drugem sistemu se začnejo z 00112 in končajo z dvema vrednostma številk. Torej, 0101 2 je enako decimalnemu številu pet, tako da je "5" napisano kot 001101012. Na podlagi zgoraj navedenega lahko preprosto pretvorite dvojiško decimalno število v niz v ASCII kodiranju z dodajanjem levega bitnega zaporedja 00112 vsakemu polbajtu.

    Unicode

    Kot veste, je na tisoče znakov potrebno za prikaz besedil v jezikih skupine jugovzhodne Azije. Takšna količina ni opisana v nobenem bajtu informacij, zato tudi razširjene različice ASCII ne morejo več izpolnjevati naraščajočih potreb uporabnikov iz različnih držav.

    Tako je obstajala potreba po univerzalnem kodiranju besedila, katerega razvoj je v sodelovanju s številnimi voditelji globalne IT industrije prevzel konzorcij Unicode. Njeni strokovnjaki so ustvarili sistem UTF 32. V njem je za kodiranje 1 znaka dodeljenih 32 bitov, sestavljenih iz 4 bajtov informacij. Glavna stvarPomanjkljivost je bilo močno povečanje količine pomnilnika, ki je zahtevala kar štirikrat, kar je povzročilo veliko težav. Hkrati je za večino držav z uradnimi jeziki, ki pripadajo indoevropski skupini, število ocen, ki je enako 2 32, več kot presežek. Kot rezultat nadaljnjega dela strokovnjakov iz konzorcija Unicode se je pojavilo kodiranje UTF-16. Postala je možnost pretvarjanja simboličnih informacij, ki so bile zložene vse tako po količini zahtevanega pomnilnika kot po številu kodiranih znakov. Zato je UTF-16 privzeto sprejet in v njem za en znak je potrebno rezervirati 2 bajta. Tudi ta precej napredna in uspešna različica Unicode je imela nekaj slabosti in po prehodu z razširjene različice ASCII na UTF-16 se je teža dokumenta podvojila. V zvezi s tem je bilo odločeno, da se uporablja kodiranje spremenljive dolžine UTF-8. V tem primeru je vsak simbol izvornega besedila kodiran v zaporedju 1 do 6 bajtov.

    Povezava z ameriško standardno kodo za izmenjavo informacij

    Vsi znaki v latinici v UTF-8 s spremenljivo dolžino so kodirani v 1 bajt, kot v sistemu kodiranja ASCII. Značilnost UTF-8 je, da če je besedilo v latinščini brez uporabe drugih znakov, bodo tudi programi, ki ne razumejo Unicode, še vedno omogočali branje. Z drugimi besedami, osnovni del kodiranja besedila ASCII preprosto preide v novo spremenljivo dolžino UTF. Cirilski znaki v UTF-8 zasedajo 2 bajta, na primer gruzijski - 3 bajti. Ustvarjanje UTF-16 in 8 je rešilo glavni problem pri ustvarjanju enotnega prostora kode v pisavah. SOd takrat lahko proizvajalci pisav izpolnijo samo tabelo z vektorskimi oblikami znakov besedila glede na njihove potrebe.
    Različni operacijski sistemi dajejo prednost različnim kodiranjem. Za branje in urejanje besedil, natipkanih v drugačnem kodiranju, se uporabljajo ruski programi za transkodiranje besedila. Nekateri urejevalniki besedil vsebujejo vgrajene kodirnike in omogočajo branje besedila ne glede na kodiranje.
    Zdaj veste, koliko znakov v kodiranju ASCII in kako in zakaj je bilo razvito. Seveda je danes najbolj razširjena na svetu prejela standardni Unicode. Vendar ne smemo pozabiti, da temelji na ASCII, zato je treba vrednost razvijalcev na področju IT ustrezno ceniti.

    Sorodne publikacije