Aplikacije OCR: prepoznavanje besedila, seznami, razvijalci, teža programa, izvedljive funkcije, funkcije, funkcije in povratne informacije uporabnikov.

Papir kot glavni nosilec informacij postopoma izgubi svoj pomen. Namesto papirnih dokumentov uporabite njihovo elektronsko različico, če je mogoče. Toda kako prevesti elektronske arhive v obstoječe arhive? Za rešitev tega problema so bili ustvarjeni posebni programi za prepoznavanje besedila.

Kaj so programi OCR in kako delujejo

Ta programska oprema uporablja tehnologijo ORC (optično prepoznavanje znakov) ali tehnologijo ICR (prepoznavanje znakov inteligence). V ruskem jeziku se te kratice prevedejo kot "optično" ali "inteligentno prepoznavanje znakov". Programi, ki uporabljajo OCR, delujejo tako. Fotografija z besedilom, ki ste ga prejeli od optičnega bralnika, je razdeljena na več fragmentov. Za vsakega od njih program ustvari več predpostavk. Z preverjanjem in primerjanjem s standardi vsak fragment daje oceno, ki ustreza stopnji naključja. Pri izbiri največjega programa program "vidi" simbol in ga prikaže v polju vgrajenega urejevalnika besedila.


IRC deluje na enak način, vendar se za obdelavo znakov uporabljajo umetne nevronske mreže. Glavna prednost te metode je kompaktnost programov in stalno učenje. To vam omogoča učinkovito prepoznavanje besed, ki jih je človek napisal z velikimi črkami. Toda ta tehnologija ne more "prebrati" trdnega rokopisnega besedila. Za vsak obstoječi operacijski sistem, svojeAplikacije OCR. Najbolj priljubljena za Windows je:
  • ABBYY FineReader;
  • OmniPage;
  • Readiris;
  • Program Samsung Scan OCR;
  • Poleg računalniške programske opreme je na voljo veliko storitev za prepoznavanje besedila na spletu. Med njimi so najbolj znani FineReader Online, OnlineOCR, FreeOCR.


    ABBYY FineReader 14

    Ta programski izdelek je razvilo domače podjetje ABBYY, eno izmed najboljših med aplikacijami, ki uporabljajo OCR. Osnova programa je originalni motor, imenovan Finereader Engine. Zagotavlja naslednje značilnosti:
  • Hitro prepoznavanje natisnjenega besedila s točnostjo nad 98%. Nestrpnost do kakovosti izvirne slike. Tako lahko identično prepoznate besedilo fotografij, posnetih z optičnim bralnikom ali fotoaparatom.
  • Tehnologija ADRT vam omogoča, da prepoznate ne le besedilo, temveč tudi njegovo oblikovanje: pisavo, alinee, odstavke, stolpce.
  • Možnost večnitne obdelave slik. To vam omogoča uporabo vseh procesorskih jeder (največ 4) za pospešitev postopka prepoznavanja.
  • Podpira več kot 190 jezikov, vključno s tistimi, ki uporabljajo abecedo, razen latinice ali cirilice (japonska, kitajska, arabska).
  • Vgrajeni urejevalnik besedila vam omogoča, da preverite rezultat prepoznavanja ali ga uredite.
  • Interakcija s paketom Office. Omogoča vam izvoz priznanega besedila v programu Microsoft Word in Exel za nadaljnjo obdelavo.
  • Sposobnost študija programa. Ta funkcija vam omogoča, da program naučite "prebrati" posebne oznake črk. Na primer nestandardna pisava ali črke, napisane z roko.
  • Delo z dokumentom PDF. FineReader vam omogoča, da prepoznate besedilo te vrste datoteke in "šivanje" več skeniranih slik v PDF ali PDF /A.
  • Glavna pomanjkljivost tega programa je cena. Endless licenco za osnovno različico bo stala 7000 rubljev. Različice "Business" in "Enterprise" - v 12 in 39 tisoč rubljev, v tem zaporedju. Če naj bi program uporabljal samo doma, lahko s torrent trackerja prenesete tudi 11. in 12. različico izdelka.
    Sistemske zahteve:
  • Procesor: 32 - ali 64-bitni, 1 GHz in podpora za niz navodil SSE 2 (Intel Celeron M in boljši, AMD Athlon 64 in boljši).
  • RAM: 1 GB. Če ima procesor več kot 1 jedro, potem je za vsakih dodatnih 512 MB potrebno.
  • Video kartica: Vsakdo, ki podpira ločljivost 1024 x 800.
  • Trdi disk: 3 GB za namestitev in delovanje.
  • Optični bralnik: podpira gonilnike TWAIN in WIA.
  • OS: Windows 788110.
  • Mnenja uporabnikov o FineReaderju 14

    Pozitivno se odzivajo na FineReader, pri čemer med zasluge poudarjajo zmožnost izdelka, da prepozna besedilo iz slabih papirnih originalov, priročen in enostaven vmesnik ter visoko hitrost. obdelavo slik. Med težavami, ki se pojavijo pri uporabi tega OCR programa, nekateri uporabniki opozarjajo na zlonamerno upravljano sliko. Na primer: Neustrezno delo za prilagoditev svetlosti optično prebrane slike.

    OmniPage 18

    Glavni konkurent podjetja FineReader na ruskem trgu programov ORC. Po funkcionalnosti je zelo podoben nasprotniku, vendar ima več razlik:
  • Sposobnost zagonapostopek optičnega branja in prepoznavanja z uporabo gumbov skenerja.
  • Podpora za 4-jedrne procesorje. To vam omogoča, da zmanjšate čas prepoznavanja in pretvorite več slik hkrati.
  • Ustvarjanje lastne e-knjižnice za buccider (ebook Kindle.
  • Samodejno zaznavanje določenega jezika.
  • Med pomanjkljivostmi programa je mogoče opaziti nizko hitrost, primerljivo z 10. različico FineReaderja, in ceno za kopijo licence - 150 dolarjev.
    Sistemske zahteve:
  • Procesor: x32 ali x64-bitni, 1 GHz, Intel Pentium in boljši, AMD Athlon in boljši.
  • RAM: 512 MB.
  • Video kartica: vsaka, podpira ločljivost 1024 x 800 in barvno globino 16 bitov.
  • ​​
  • Trdi disk: 11 GB za namestitev vseh komponent in 100 MB za delo.
  • Optični bralnik: podpira TWAIN, WIA in ISIS gonilnike.
  • OS: Windows XP SP3 Vista SP2 x32 /x6478.
  • Mnenje uporabnikov OmniPage

    Pravijo, da je to nenadoma negativno, saj so težave prisotne v vseh delih programa, od lepih, a nerazumljivih vmesnikov do slabih poizvedb. Izdelek ni prilagojen za delo v WinXP. Lahko je prisiljen delati, vendar bo moral nekaj časa preživeti. OmniPage ima težave s prepoznavanjem. Na primer: na list papirja z risbami, tabelami, dobljenimi iz optičnega bralnika, zlahka prepozna črno besedilo. Pri uporabi slik s fotoaparata ali mobilnega telefona se natančnost prepoznavanja zmanjša na 70%, kar je zelo neprijetno pri obdelavi velikih dokumentov.

    Tudi 18. mestorazličica se morda ne bo začela zaradi napak v kodi. Če želite odpraviti to težavo, morate namestiti popravek 1801.

    Read Iris Pro 17

    Read Iris je OCR program, ki z manj denarja (8000 vs 12000) lahko poveže funkcionalnost in zmogljivost z FineReaderjem. Profesionalna različica ima naslednje funkcije:
  • Full-time delo s PDF: prepoznavanje, ustvarjanje datotek za podatkovne baze, stiskanje in glas nad besedilom.
  • Podpora za 140 jezikov.
  • Priznavanje papirnatih tabel in besedil z možnostjo izvoza v Exel in Word.
  • Pridobivanje slik iz katerega koli modela optičnega bralnika.
  • Obstaja tudi poslovna različica, ki vam omogoča zaščito datotek PDF z vodnimi žigi in upravljanje dokumentov, daljših od 50 strani. Sistemske zahteve:
  • Procesor: x86 ali x64 z 1 GHz ali več.
  • RAM: 1 GB.
  • Video kartica: Vsakdo, ki podpira ločljivost 1024 x 800.
  • Trdi disk: 400 MB za namestitev.
  • Optični bralnik: podpira TWAIN, WIA gonilnike.
  • OS: Windows 7810 x32 /x64.
  • Bralčevo mnenje ReadIris

    Govorijo o tem programu za prepoznavanje besedil OCR kot dober in najhitrejši pretvornik PDF v Word s številnimi težavami:
  • Prefinjen vmesnik, v katerem začetnik ni lahko razumeti.
  • Samodejno skenirajte dokument, ko spremenite območje optičnega branja.
  • Slaba tehnična podpora.
  • Včasih se program ne aktivira zaradi napak v kodi programa.
  • Program Samsung Scan OCR - Kaj je ta program?

    To je brezplačna programska oprema, ki je opremljena z večnamenskoNaprave "3 v 1" (tiskalnik, optični bralnik, kopirni stroj) podjetja "Samsung". Razvit je bil v sodelovanju z Iris, ustvaril je ReadIris Pro, optimiziran za delo s proizvajalcem MFP. Od prvotnega "bralnika" ima Samsung Scan ORC vmesnik, obrezano funkcionalnost in velikost - potrebuje 40 MB na trdem disku.

    Spletne storitve

    So alternativa aplikacijam za stacionarno prepoznavanje besedila z intenzivnimi viri. Na primer, OCR je FineReader. Lastnosti sistemov podobnih projektov omogočajo prepoznati besedilo iz slik veliko hitreje kot na samostojnem računalniku. Med storitvami, ki so vključene v sprejemanje besedila s fotografij, lahko ločite tri najbolj primerne: FineReaderOnline, FreeOCR, OnlineOCR.
    Prvi je neposredni razvoj stacionarne različice izdelka. Ob registraciji novi uporabnik dobi 10 brezplačnih strani za obdelavo in 5 mesečno. To omejitev lahko prekličete z nakupom letne naročnine za 3200550017800 rubljev za 20005000 oziroma 10.000 strani. Če ima uporabnik licenco za FineReader 14, se mora le registrirati in aktivirati za uporabo v spletni različici. V tem primeru bo prejel število strani, ki ustrezajo vrsti kupljene licence: Standard (2000), Business (5000) ali Enterprise (10.000).
    Storitev onlineOCR.com vam omogoča pretvorbo 15 slik /uro (omejitve za neregistrirane uporabnike) v besedilo in shranjevanje kot datoteke .docx, .xlsx ali .txt. Po registraciji je na voljo:
  • Shranjevanje .pdf .doc, .xlx, .rtf.
  • Pretvorite večstranske datoteke PDF.
  • Število strani50.
  • Če strani niso dovolj, jih je mogoče kupiti v višini 50-50000 kosov.
    Projekt FreeOCR.com se razlikuje od prejšnjega s popolno brezplačno in brez omejitev števila obdelanih strani. Motor OCR tega spletnega mesta podpira ruski, ukrajinski, turški, vietnamski in vse evropske jezike - le 29. Edina slabost tega portala je, da deluje le z grafičnimi slikami, ki se nalagajo zaporedno, saj ustvarjalci ne zagotavljajo čakalne vrste obdelave. Prikaže prepoznane informacije brez oblikovanja v formatu TXT.

    Mnenje uporabnikov o spletnih storitvah OCR

    Ta spletna mesta so potrebna v primerih, ko je prenos in namestitev celotnega programa ORC neprimerna. Na primer, v abstrakt vstavite nekaj citatov iz knjige ali revije. Med slabostmi takšnih strani so pogojno prosti (FineReader) in šibki funkcionalni (FreeOCR, OnlineOCR). Če povzamemo, lahko rečemo, da obstaja veliko programov OCR za prepoznavanje besedila s slikami ali dokumenti PDF in članek prikazuje samo najbolj znane. Zato bodo programi OCR za skener vsak uporabnik lahko sami izbrali glede na zahteve in proračun. Ali pa uporabite eno od številnih brezplačnih storitev OCR.

    Sorodne publikacije