Brezplačna tabela znakov Unicode

Unicode je mednarodni standard za kodiranje znakov, ki vam omogoča prikaz besedila na katerem koli računalniku na svetu na enak način, ne glede na jezik sistema, ki se uporablja na njem.

Osnove

Da bi razumeli, za kaj je potrebna tabela znakov Unicode, najprej razumemo mehanizem prikazovanja besedila na zaslonu monitorja. Računalnik, kot vemo, obdeluje vse informacije digitalno, vendar pa mora biti v grafiki prikazan za pravilno zaznavanje osebe. Da bi lahko prebrali to besedilo, moramo rešiti vsaj dve nalogi:
  • Kodirane natisnjene znake v digitalni obliki.
  • Omogočiti operacijskemu sistemu, da primerja digitalno obliko z vektorskimi simboli, z drugimi besedami, da najde pravilne črke.
  • Prvo kodiranje

    Predhodnik vseh kodiranja je ameriški ASCII. Opisal je angleško abecedo z ločili in arabskimi številkami. Uporabljenih 128 znakov je postalo osnova za nadaljnji razvoj - uporabljena je tudi sodobna tabela znakov Unicode. Črke latinske abecede od takrat zavzamejo prve položaje v vsakem kodiranju.
    Vsi ASCII-ji so omogočili shranjevanje 256 znakov, vendar je bilo prvih 128 v latinščini, preostalih 128 pa je bilo globalno uporabljenih za oblikovanje nacionalnih standardov. Na primer, v Rusiji, na njegovi podlagi so bili ustvarjeni CP866 in KOI8-R. Te spremembe so se imenovale razširitveRazličice ASCII.

    Kodirane strani in Crazzybras

    Nadaljnji tehnološki razvoj in pojav grafičnega vmesnika sta povzročila oblikovanje kodiranja ANSI s strani Ameriškega inštituta za standardizacijo. Za ruske uporabnike, zlasti z izkušnjami, je njegova različica znana kot Windows 1251. Najprej je predstavila koncept "kodne strani". S pomočjo kodnih strani, ki so vsebovale simbole nacionalnih abeced, razen latinščine, je obstajalo "medsebojno razumevanje" med računalniki, ki se uporabljajo v različnih državah.

    Vendar pa je prisotnost velikega števila različnih kodiranja, ki se uporabljajo za isti jezik, začela povzročati težave. Bilo je tako imenovanih karkozybris. Nastale so zaradi neskladja med izvorno kodno stranjo, na kateri so bile določene informacije, in kodno stranjo, ki se privzeto uporablja na računalniku končnega uporabnika.
    Kot primer se lahko navedejo zgoraj omenjeni kodirni koder CP866 in KOI8-R. Črke v njih so se razlikovale po kodnih položajih in načelih umestitve. V prvem so bili razvrščeni po abecednem vrstnem redu, v drugem pa na samovoljno. Lahko si predstavljate, kaj se je dogajalo pred očmi uporabnika, ki je poskušal odpreti takšno besedilo, ne da bi imel kodno stran, ki jo želite, ali pa jo je računalnik napačno interpretiral.

    Ustvarjanje Unicode

    Širjenje interneta in sorodnih tehnologij, kot je elektronska pošta, je privedlo do dejstva, da je besedilna sporočila na koncu prenehala ustrezati vsem. Vodilna podjetja na tem območjuIT je ustvaril konzorcij Unicode (konzorcij Unicode), ki ga je tabela simbolov uvedla leta 1991 pod imenom UTF-32.
    Vendar pa prva univerzalna tabela znakovnih kod Unicode UTF-32 ni bila široko porazdeljena. Glavni razlog je bila redundanca shranjenih podatkov. Hitro je bilo izračunano, da bo besedilo v državah, ki uporabljajo latinsko abecedo, kodirano z novo univerzalno preglednico, štirikrat več prostora kot uporaba razširjene ASCII tabele.

    Razvoj Unicode

    Naslednja tabela znakov UTF-16 Unicode je odpravila to težavo. Kodiranje je bilo izvedeno v polovici števila bitov, hkrati pa se je zmanjšalo tudi število možnih kombinacij. Namesto milijarde znakov vam omogoča, da prihranite samo 65.536. Kljub temu se je izkazalo za tako uspešno, da je bilo to število, v skladu z odločitvijo konzorcija, opredeljeno kot osnovni prostor za shranjevanje znakov Unicode. Kljub temu uspehu UTF-16 ni ustrezala vsem, saj je bila količina shranjenih in prenesenih informacij še vedno dvakrat preobremenjena. Univerzalna rešitev je UTF-8 tabela znakov Unicode z spremenljivo dolžino pisanja. To lahko imenujemo preboj na tem področju.
    Tako je z uvedbo zadnjih dveh standardov tabela znakov Unicode rešila problem enotnega prostora kode za vse trenutno uporabljene pisave.

    Unicode za ruski jezik

    HvalaDolžina spremenljive kode, ki se uporablja za prikazovanje simbolov, je latinica kodirana v formatu Unicode, tako kot v njegovem ASCII, torej en bit. Za druge abecede je slika lahko drugačna. Na primer, znaki gruzijske abecede se uporabljajo za kodiranje treh bajtov, znaki cirilice pa dve. Vse to je mogoče v standardu Unicode UTF-8 (karta znakov). Ruski jezik ali cirilica zavzema 448 mest v splošnem kodnem prostoru, razdeljenem na pet blokov.


    V teh petih blokih so glavne cirilske in cerkveno slovanske abecede ter dodatna črka drugih jezikov, ki uporabljajo cirilico. Številne pozicije so označene, da se prikažejo stare oblike predstavitve črk cirilice, 22 mest v skupnem znesku pa ostane prost.

    Trenutna različica Unicoda

    Z odločitvijo o prednostni nalogi, ki je bila standardizacija pisav in ustvarjanje enotnega kodnega prostora za njih, "Konzorcij" ni prenehal s svojim delom. Unicode se nenehno razvija in dopolnjuje. Najnovejša dejanska različica tega standarda 9.0 je bila izdana leta 2016. Vključeval je šest dodatnih abeced in razširjen seznam standardiziranih čustvenih simbolov.
    Treba je opozoriti, da se zaradi poenostavitve raziskav Unicode dodajo celo tako imenovani mrtvi jeziki. Takšno ime so dobili, ker ljudi, za katere je bil sorodnik, ne obstaja. V to skupino spadajo tudi jeziki, ki so se do danes ohranili le v obliki pisnih spomenikov. Vnačelo, velja za dodajanje znakov v novo specifikacijo Unicode lahko kdorkoli. Res je, za to bo treba izpolniti dostojno količino izvornih dokumentov in porabiti veliko časa. Živi primer tega je lahko zgodovina programerja Terencea Edena. Leta 2013 je zaprosil za vključitev v specifikacijo simbolov, ki se nanašajo na gumbe za upravljanje računalnika. V tehnični dokumentaciji so bili uporabljeni od sredine 70-ih let prejšnjega stoletja, vendar pred specifikacijo 9,0 ni bil del Unicode.

    Tabela znakov

    Na vsakem računalniku, ne glede na uporabljeni operacijski sistem, tabelo znakov Unicode. Kako uporabljati te preglednice, kje jih najti in kaj lahko naredijo za rednega uporabnika?
    V sistemu Windows se tabela simbolov nahaja v razdelku menija "Storitve". V družini operacijskih sistemov Linux je običajno mogoče najti v razdelku "Standard", v MacOS-u pa v nastavitvah tipkovnice. Glavni namen te tabele je, da v besedilne dokumente vnesete znake, ki niso na tipkovnici. Vloga za takšne tabele je široka: od uvedbe tehničnih simbolov in ikon nacionalnih denarnih sistemov do pisanja priročnika o praktični uporabi Tarot kart.

    V zaključku

    se Unicode uporablja povsod in je vključen v naše življenje skupaj z razvojem interneta in mobilnih tehnologij. Zaradi njegove uporabe se je sistem mednarodnih komunikacij bistveno poenostavil. To lahko rečeteuvedba Unicoda je indikativen, vendar popolnoma neviden primer uporabe tehnologije za skupno dobro vsega človeštva.

    Sorodne publikacije