Kakšna je moč abecede

abeceda v računalništvu se imenuje sistem znakov, preko katerega lahko pošljete informativno sporočilo. Da bi razumeli bistvo te definicije, podajamo nekaj dodatnih teoretičnih dejstev:

  • Vsa sporočila so sestavljena iz abecede. Ta članek je na primer sporočilo. Nato je sestavljen iz znakov n abecede.
  • Pod simbolom lahko razumemo najmanj pomemben del abecede. Tudi nedeljivi delci se imenujejo atomi. Simboli v ruski abecedi so "a", "b", "in" in tako naprej.
  • V teoriji abeceda ni nujno več kodirana. V tiskani knjigi so na primer znaki v abecedi sami, kar pomeni, da nimajo nobenega kodiranja.
    Toda v praksi imamo naslednje: računalnik ne razume, kaj so črke. Zato je treba za prenos informacijskega sporočila najprej kodirati v jeziku, ki je razumljiv računalniku. Če želite nadaljevati, morate vnesti dodatne pogoje.

    Kakšna je moč abecede

    Pod močjo abecede mislimo na skupno število znakov v njej. Da bi ugotovili, kakšna je moč abecede, morate samo prešteti število znakov v njej. Razumimo. Za rusko abecedo je moč abecede 33 ali 32 znakov, če ne uporabljate »e«. Predpostavimo, da so vsi simboli v naši abecedi enako verjetni. To predpostavko lahko razumemo kot: predpostavimo, da imamo vrečko s podpisanimikocke Število kock v njem je neskončno in vsaka je podpisana z enim samim znakom. Potem, z enakomerno porazdelitvijo, ne glede na to, koliko dobimo kocke iz vrečke, bo število kock z različnimi simboli enako, ali pa bo to skušalo storiti z rastjo števila kock, ki jih dobimo iz vrečke.

    Ocena teže informacijskih sporočil

    Pred skoraj sto leti je ameriški inženir Ralph Hartley izvedel formulo, s katero lahko ocenite količino informacij v sporočilu. Njegova formula deluje za verjetnostne dogodke in izgleda takole: i = log 2 M Kjer je i - število nedeljivih informacijskih atomov (bitov) v sporočilu, "M" - moč abecede. Pojdimo še dlje. S pomočjo matematičnih transformacij lahko ugotovimo, da se moč abecede izračuna na naslednji način:

    M = 2 i Ta formula na splošno opredeljuje razmerje med številom enako verjetnega dogodka "M" in količino informacij "i".

    Izračunamo moč

    Najverjetneje že iz šolskega tečaja računalništva vemo, da se v sodobnih računalniških sistemih, ki temeljijo na arhitekturi von Neumanna, uporablja binarni kodirni sistem. Kodira tako aplikacije kot podatke. Za predstavitev besedila v računalniškem sistemu uporabite enotno kodo z osmimi števkami. Zato se šteje, da enotna koda vsebuje fiksen niz elementov - 0 in 1. Vrednosti v takšni kodi so določene z določenim vrstnim redom teh elementov. Z osem-bitno kodo lahko kodiramo sporočila po 256 bitov po formuliHartley: M 8 = 2 8 = 256 bitov informacij. Takšna situacija z binarno kodo za kodiranje znakov se je zgodovinsko oblikovala. Toda teoretično bi lahko uporabili druge abecede za predstavitev podatkov. Na primer, v štirimestni abecedi bi vsak znak imel težo ne eno, ampak dva bita, v osmih - 3 bite, in tako naprej. To se izračuna z uporabo binarnega logaritma, podanega zgoraj (i = log 2 M).
    Ker je v abecedi 256 bitov dodeljenih osem binarnih mest, ki označujejo posamezen znak, je bilo odločeno, da se vnese dodatno merilo informacije - bajt. En bajt vsebuje en znak tabele kod ASCII in vsebuje osem bitov.

    Kako se merijo informacije

    Osemstotno kodiranje besedila, ki se uporablja v ASCII kodni tabeli, vam omogoča, da vsebujete osnovni niz latinice in cirilice v velikih in malih črkah, številke, ločila in druge osnovne simbole. Za merjenje velikih količin podatkov uporabite posebne predpone za besede bajtov in bitov. Take konzole so podane v spodnji tabeli:
    Mnogi ljudje, ki so študirali fiziko, zanikajo, da bi bilo razumno uporabiti klasične soglasnike za označevanje informacijskih enot (kot so kilo in mega), v resnici pa to ni povsem pravilno, saj te predpone za vrednosti označujejo množenje ene ali druge stopnja števila deset, ko se v računalništvu povsod uporablja binarni sistem meritev.

    Pravilna imena merilnih enot podatkov

    Za odpravomarca 1999 je Mednarodna komisija za elektrotehniko odobrila nove enote za enote, ki se uporabljajo za določanje količine informacij v elektronskem računalniku. Takšne predpone so "mebia", "kibi", "gibi", "tebi", "eksby", "pety". Dokler te enote še ne bodo uresničene, je verjetno, da je potreben čas za izvajanje tega standarda in njegovo razširitev. Kako narediti prehod od klasičnih enot na novo odobrene, lahko določite v naslednji tabeli:

    Predpostavimo, da imamo besedilo, ki vsebuje K znakov. Nato s pomočjo abecednega pristopa izračunamo količino informacij V, ki jo vsebuje. To je enako zmožnosti abecede glede na težo informacij enega znaka v njej. Z Hartleyjevo formulo vemo, kako izračunati količino informacij z binarnim logaritmom. Če predpostavimo, da je število znakov v abecedi N in da je število znakov v zapisu informacij o sporočilu K, dobimo naslednjo formulo za izračun obsega sporočila: V = K? log 2 N abecedni pristop kaže, da je obseg informacij odvisen samo od sposobnosti abecede in velikosti sporočil (to je števila znakov v njem), ne pa tudi semantične vsebine za osebo.

    Primeri izračuna moči

    Razredi informatike pogosto nalagajo nalogo, da najdejo moč abecede, dolžino sporočila ali obseg informacij. Tu je ena od naslednjih nalog:"Besedilna datoteka zaseda 11 Kbyte prostora na disku in vsebuje 11264 znakov. Določite moč abecede te besedilne datoteke." Kakšna bo rešitev, si lahko ogledate na spodnji sliki.
    Tako abeceda z zmogljivostjo 256 znakov nosi le 8 bitov informacij, kar se v računalništvu imenuje en bajt. Byte opisuje 1 znak tabele ASCII, ki, če mislite, da ni veliko.

    En bajt - ali je veliko ali ne?

    Sodobni vzorci podatkovnih skladišč Podatkovni centri Google in Facebook ne vsebujejo več kot ducat petabajtov informacij. Točna količina podatkov pa bo težko izračunati celo zase, saj boste potem morali ustaviti vse procese na strežnikih in bližnje uporabnike za dostop do snemanja in urejanja njihovih osebnih podatkov.
    Da pa si predstavljamo takšne nepredstavljive količine podatkov, moramo jasno razumeti, da je vse sestavljeno iz majhnih podrobnosti. Treba je razumeti, zakaj je moč abecede enaka (256) in koliko bitov vsebuje 1 bajt informacij (kot se spomnite, 8).

    Sorodne publikacije