Cum să recunoașteți textul utilizând ABBYY FineReader: instrucțiuni pas cu pas. Scanare FineReader

„Ghid rapid de utilizare ABBYY® FineReader 12 Acest document conține informații de bază despre funcționarea ABBYY FineReader. Complet..."

ABBYY® FineReader 12

Ghid rapid de utilizare

Acest document conține informații de bază despre funcționarea ABBYY FineReader. Ghid complet pentru

lucrul cu aplicațiile ABBYY FineReader, Screenshot Reader și Hot Folder este disponibil pe site-ul web al companiei

ABBYY. Dacă nu aveți o conexiune permanentă la internet, puteți descărca manualul

utilizator în format PDF.

Ce este ABBYY FineReader

Instalarea și lansarea ABBYY FineReader

Cerințe de sistem

Instalarea programului

Se lansează ABBYY FineReader

Lucrul cu ABBYY FineReader

Sarcini încorporate

Conversia documentelor pas cu pas

Analiza structurii documentului și zonele de editare

Activarea și înregistrarea programului

Activarea ABBYY FineReader

Înregistrarea ABBYY FineReader

Securitatea datelor

Ce este ABBYY FineReader ABBYY FineReader este un sistem optic de recunoaștere a caracterelor (OCR - Optical Character Recognition). Este conceput pentru a converti documente scanate, documente PDF și fișiere imagine, inclusiv fotografii digitale, în formate editabile.

Avantajele ABBYY FineReader 12 Viteză și precizie ridicată a recunoașterii Suport pentru majoritatea limbilor lumii Verificarea rezultatelor recunoașterii Interfață simplă și intuitivă Recunoașterea documentelor fotografiate Salvarea documentelor în diverse formate, precum și trimiterea către stocarea online Asistență tehnică gratuită pentru utilizatorii înregistrați Instalare și lansarea ABBYY FineReader Cerințe de sistem 1. Procesor pe 32 de biți (x86) sau 64 de biți (x64) cu o viteză de ceas de 1 gigahertz (GHz) sau mai mare.



2. Sistem de operare Microsoft® Windows® 8, Microsoft® Windows® 7, Microsoft Windows Vista, Microsoft Windows XP, Microsoft Windows Server 2012/2012 R2, Microsoft Windows Server 2008/2008 R2, Microsoft Windows Server 2003.

Pentru a lucra cu o interfață localizată, sistemul de operare trebuie să ofere suportul lingvistic necesar.

3. RAM - 1024 MB.

Când rulați pe sisteme cu mai multe nuclee, sunt necesari 512 MB suplimentar de RAM pentru fiecare nucleu suplimentar.

4. Spațiu liber pe disc: 850 MB pentru instalarea tuturor componentelor programului, 700 MB pentru rularea programului.

5. Placă video și monitor cu o rezoluție de cel puțin 1.024.768 pixeli.

6. Tastatură, mouse sau alt dispozitiv de indicare.

Instalarea programului

Pentru a instala ABBYY FineReader 12:

1. Rulați fișierul Setup.exe de pe CD-ul de instalare sau din folderul de distribuție a programului.

Puteți instala ABBYY FineReader 12 Corporate în rețeaua locală. Puteți descărca Ghidul administratorului de sistem în format PDF de pe site-ul web ABBYY.

Se lansează ABBYY FineReader

Pentru a lansa ABBYY FineReader 12:

Ghid de utilizare rapid pentru ABBYY FineReader 12 Selectați ABBYY FineReader 12 (ABBYY FineReader 12 Corporate) în meniul StartPrograms sau În aplicațiile Microsoft Office, faceți clic pe butonul de lansare ABBYY FineReader situat în panoul FineReader 12 sau În Windows Explorer, selectați fișierul cu imaginea și în meniul său contextual, selectați Deschidere cu ABBYY FineReader sau convertiți în formatul dorit.

Lucrul cu ABBYY FineReader

Procesul de procesare a documentelor folosind programul ABBYY FineReader constă din patru etape:

Primirea unei imagini;

Recunoașterea documentelor;

Verificarea și editarea textului primit;

Salvarea rezultatelor recunoașterii.

Adesea, acest proces constă în aceeași secvență de acțiuni, de exemplu, scanarea, recunoașterea și salvarea textului recunoscut într-un format specific. Pentru a efectua cele mai comune sarcini, programul oferă sarcini încorporate care vă permit să obțineți text recunoscut cu un singur clic pe buton. Pentru a recunoaște documentele cu o structură complexă, puteți configura și rula singur fiecare etapă de procesare.

Sarcini încorporate Sarcinile încorporate sunt lansate din fereastra Sarcini, care se deschide în mod implicit când pornește aplicația. Dacă fereastra este închisă, faceți clic pe butonul Sarcină din bara de instrumente principală a programului.

Ghid de pornire rapidă ABBYY FineReader 12

Pentru a converti un document utilizând sarcini încorporate:

1. În fereastra Sarcină, selectați fila necesară cu sarcini:

De bază - conține cele mai frecvent utilizate sarcini încorporate ale programului ABBYY FineReader;

Microsoft Word - sarcini de conversie într-un document Microsoft Word;

Microsoft Excel - sarcini de creare a foilor de calcul Microsoft Excel;

–  –  –

Sarcinile mele - vă puteți crea propriile sarcini personalizate, constând din pași necesari special pentru dvs. (numai pentru versiunea ABBYY FineReader Corporate).

2. În lista de limbi ale documentului, specificați limbile de recunoaștere.

3. În lista Color Mode, selectați un mod de culoare:

Colorat - designul de culoare al documentului nu se va schimba;

Alb-negru - Paginile documentului vor fi alb-negru, reducând dimensiunea documentului FineReader. În comparație cu modul Culoare, acest mod necesită mai puțin timp pentru a procesa un document.

ABBYY FineReader 12 Ghid rapid de utilizare Atenție! Odată ce selectați modul alb-negru, nu veți putea restabili schema de culori a documentului. Pentru a obține un document color, deschideți un fișier care conține imagini color ale paginilor sau scanați un document de hârtie color.

4. Dacă este necesar, setați parametri suplimentari pentru sarcinile de conversie într-un document Microsoft Word, un document Microsoft Excel și un document Adobe PDF în partea dreaptă a ferestrei.

5. Faceți clic pe butonul pentru sarcina de care aveți nevoie.

Sarcinile ABBYY FineReader sunt efectuate ținând cont de setările specificate în dialogul Setări (meniul ToolsSettings...).

Odată lansată, pe ecran apare bara de progres a sarcinii, care conține o bară de progres a sarcinii, o listă de pași, precum și sugestii și avertismente.

Ca urmare a finalizării sarcinii, va fi creat un document cu formatul necesar, iar imaginile vor fi adăugate în documentul FineReader. Dacă este necesar, puteți edita zonele selectate din imagini, puteți verifica textul recunoscut și puteți salva rezultatele recunoașterii într-un alt format.

Conversie pas cu pas a documentelor Pentru a configura și lansa în mod independent fiecare etapă a procesării documentelor, utilizați fereastra principală a programului ABBYY FineReader.

Ghid de pornire rapidă ABBYY FineReader 12

1. În bara de instrumente principală, în lista derulantă Limba documentului, specificați limbile de recunoaștere.

2. Scanați sau deschideți imagini.

În mod implicit, analiza și recunoașterea documentelor vor începe automat. Puteți modifica aceste setări în fila Scanare/Deschidere a casetei de dialog Setări (meniul InstrumenteSetări...).

3. În fereastra Imagine, verificați zonele selectate și editați-le dacă este necesar.

4. Dacă ați schimbat zone, în bara de instrumente principală, faceți clic pe butonul Recunoaștere.

5. În fereastra Text, verificați și, dacă este necesar, editați rezultatele recunoașterii.

Analiza structurii documentului și a zonelor de editare Calitatea obținută în urma conversiei unui document depinde de mulți factori: imaginea sursă, setările de recunoaștere, opțiunile de salvare. Unul dintre cei mai importanți pași este analizarea structurii logice a documentului, adică. evidențierea zonelor cu text, imagini, tabele și coduri de bare. Zonele sunt evidențiate pentru a spune sistemului cum să recunoască anumite părți ale imaginii și în ce ordine. Aceasta reproduce designul original al documentului.

Ghid rapid de utilizare ABBYY FineReader 12 În mod implicit, analiza documentelor în ABBYY FineReader este efectuată automat.

Cu toate acestea, în documentele complexe, unele zone pot să nu fie evidențiate corect. Este adesea mai convenabil să le corectați, mai degrabă decât să reselectați toate zonele Instrumentele pentru marcarea și editarea manuală a zonelor sunt situate în panoul ferestrei Imagine, precum și în barele de instrumente pop-up pentru Text, Imagine, Imagine de fundal. și zonele de masă. O bară de instrumente pop-up apare lângă zona activă. Pentru a selecta o zonă, faceți clic pe ea cu butonul stâng al mouse-ului.

Cu instrumentele manuale de marcare puteți:

Adăugați sau eliminați o zonă

–  –  –

Mutați limitele zonei sau zonei în sine Adăugați/eliminați o parte dreptunghiulară a zonei Renumerotați zonele După ce toate operațiunile de editare pentru zone sunt finalizate, executați din nou recunoașterea.

Puteți citi mai multe despre cum să lucrați cu instrumente pentru marcarea manuală, precum și despre situații non-standard, a căror soluție poate necesita setări suplimentare, în ajutorul complet de pe site-ul web ABBYY.

Activarea și înregistrarea programului Activarea ABBYY FineReader Pentru a utiliza ABBYY FineReader 12 în modul complet funcțional, poate fi necesară activarea produsului. Activarea este complet sigură și anonimă.

Cea mai simplă și rapidă modalitate este să activați programul prin Internet. De asemenea, puteți activa programul prin e-mail sau telefon/fax. Veți găsi informații detaliate despre activare pe site-ul web ABBYY.

Înregistrarea ABBYY FineReader ABBYY vă invită să deveniți utilizator înregistrat al programului ABBYY

FineReader 12. Prin înregistrare, beneficiați de o serie de beneficii:

Suport tehnic gratuit;

Abilitatea de a utiliza aplicația ABBYY Screenshot Reader, concepută pentru recunoașterea textului din capturile de ecran ale zonelor ecranului;

Restaurarea numărului de serie în cazul pierderii acestuia;

Actualizări automate ale produselor;

Oportunitatea de a primi informații despre ofertele speciale pentru produsele ABBYY.

Vă puteți înregistra copia programului în unul dintre următoarele moduri:

Completați cardul de înregistrare în timpul procesului de activare a programului. Dacă nu ați înregistrat programul în timpul procesului de activare, puteți face acest lucru mai târziu, în orice moment convenabil pentru dvs.

Ghid rapid de utilizare ABBYY FineReader 12 În meniul Ajutor, selectați Înregistrare... și completați cardul de înregistrare.

Înregistrați-vă pe site-ul web ABBYY.

Securitatea datelor În timpul procesului de înregistrare a programului, sunteți de acord cu transferul voluntar al datelor dumneavoastră personale către ABBYY. De asemenea, sunteți de acord cu colectarea, prelucrarea și utilizarea datelor dumneavoastră cu caracter personal de către ABBYY în condițiile de confidențialitate și în conformitate cu legea aplicabilă, în conformitate cu Acordul de licență. Datele personale pe care le furnizați vor fi utilizate numai în cadrul grupului de companii ABBYY și nu vor fi furnizate unor terți, cu excepția cazurilor prevăzute de legislația aplicabilă, în conformitate cu Acordul de licență sau cu Acordul de licență în sine.

ABBYY are dreptul de a vă trimite e-mailuri care conțin știri despre produse, modificări de preț, oferte speciale și alte informații despre produse sau companie numai dacă v-ați confirmat consimțământul pentru a primi informații de la ABBYY bifând caseta corespunzătoare în timpul înregistrării. Vă puteți elimina oricând adresa din lista de abonați, contactând ABBYY.

Ghid de pornire rapidă ABBYY FineReader 12

Informațiile conținute în acest document pot fi modificate fără notificare, iar ABBYY nu își asumă nicio obligație de a face acest lucru.

Software-ul descris în acest document este furnizat în baza unui Acord de licență. Acest software poate fi folosit sau copiat numai în strictă conformitate cu termenii acestui acord. Copierea acestui software pe orice mediu de stocare, cu excepția cazului în care există o permisiune specială pentru a face acest lucru în Acordul de licență sau în acordul de non-distribuție, reprezintă o încălcare a Legii Federației Ruse „Cu privire la protecția juridică a programelor de calculator și a bazelor de date” și drept international.

Nicio parte a acestui manual nu poate fi reprodusă sau transmisă sub nicio formă sau prin orice mijloc, electronic sau mecanic, inclusiv fotocopiere sau înregistrare, pentru orice scop, fără permisiunea scrisă a companiei ABBYY.

© Abi Production LLC, 2013. Toate drepturile rezervate.

ABBYY, ABBYY FineReader, ADRT sunt mărci comerciale înregistrate sau mărci comerciale ale ABBYY Software Ltd.

© 1984-2008 Adobe Systems Incorporated și licențiatorii săi. Toate drepturile rezervate.

Protejat de brevete SUA: 5.929.866; 5.943.063; 6.289.364; 6.563.502; 6.185.684; 6.205.549; 6.639.593;

7.213.269; 7.246.748; 7.272.628; 7.278.168; 7.343.551; 7.395.503; 7.389.200; 7.406.599; 6.754.382; Cererile de brevet sunt în așteptare.

Biblioteca Adobe® PDF este protejată prin drepturi de autor de către Adobe Systems Incorporated.

Adobe, Acrobat®, sigla Adobe, sigla Acrobat, sigla Adobe PDF și Adobe PDF Library sunt fie mărci comerciale înregistrate, fie mărci comerciale ale Adobe Systems Incorporated în Statele Unite și/sau în alte țări.

Acest program conține componente care sunt © 2008 Celartem, Inc. Toate drepturile rezervate.

Acest program conține componente care sunt © 2011 Caminova, Inc. Toate drepturile rezervate.

Produs de AT&T Labs Technology.

DjVu® este protejat de brevetul SUA nr. 6.058.214. Cererile de brevet în alte țări sunt în așteptare.

Acest program conține componente care sunt © 2013 University of New South Wales. Toate drepturile rezervate.

© 2002-2008 Intel Corporation.

© 2010 Microsoft Corporation. Toate drepturile rezervate.

Microsoft, Outlook, Excel, PowerPoint, Windows Vista, Windows sunt fie mărci comerciale înregistrate, fie mărci comerciale ale Microsoft Corporation în Statele Unite și/sau alte țări.

© 1991-2013 Unicode, Inc. Toate drepturile rezervate.

© 2010, Oracle și/sau afiliații săi. Toate drepturile rezervate.

OpenOffice.org și sigla OpenOffice.org sunt mărci comerciale sau mărci comerciale înregistrate ale Oracle și/sau ale afiliaților săi.

Licența JasPer versiunea 2.0:

© 2001-2006 Michael David Adams © 1999-2000 Image Power, Inc.

© 1999-2000 The University of British Columbia EPUB® este o marcă înregistrată a IDPF (International Digital Publishing Forum). Acest program conține componente deținute de © 2009 The FreeType Project (www.freetype.org).

Produsul include software dezvoltat de OpenSSL Project pentru a fi utilizat în OpenSSL Toolkit. (http://www.openssl.org/). Produsul conține software criptografic scris de Eric Young ( [email protected]).

© 1998-2011 Proiectul OpenSSL. Toate drepturile rezervate.

© 1995-1998 Eric Young ( [email protected]) Toate drepturile rezervate.

Acest produs include software dezvoltat de Tim Hudson ( [email protected]).

Alte mărci comerciale sunt mărci comerciale sau mărci comerciale înregistrate

Lucrări similare:

„01.02.2016 SHEMOT NUME Exod 1:1–6:1/Isaia 27:6–28:13; 29:22,23/Marcu 1,2 Exodul 1:1 Acestea sunt (acum) numele copiilor lui Israel care au intrat în Egipt; fiecare dintre ei a intrat cu casa lui la Iacov. Exodus 1:1 Iată numele copiilor lui Israel care au intrat cu Iacov în Egipt, şi au intrat fiecare cu casa lui. Iată o linie dreaptă...”

Convertirea textului în format digital este o sarcină destul de comună pentru cei care lucrează cu documente. Programul Abbyy Finereader vă va ajuta să economisiți mult timp prin traducerea automată a inscripțiilor din imagini raster sau „cititoare” în text editabil.

În acest articol ne vom uita la modul de utilizare a Abbyy Finereader pentru recunoașterea textului.

Cum să recunoști textul dintr-o imagine folosind Abbyy Finereader

Pentru a recunoaște textul pe o imagine raster, pur și simplu încărcați-l în program, iar Abbyy Finereader va recunoaște automat textul. Tot ce trebuie să faceți este să îl editați, să evidențiați ceea ce aveți nevoie și să îl salvați în formatul necesar sau să îl copiați într-un editor de text.

Puteți recunoaște textul direct de la un scaner conectat.

Citiți mai multe pe site-ul nostru.

Cum să creați un document PDF și FB2 folosind Abbyy Finereader

Programul Abbyy Finereader vă permite să convertiți imagini în format PDF universal și format FB2 pentru citire pe e-readers și tablete.

Procesul de creare a unor astfel de documente este similar.

1. În meniul principal al programului, selectați secțiunea E-Book și apăsați FB2. Selectați tipul de document sursă: scanare, document sau fotografie.

2. Găsiți și deschideți documentul necesar. Se va încărca în program pagină cu pagină (acest lucru poate dura ceva timp).

3. Când procesul de recunoaștere este finalizat, programul vă va solicita să selectați un format pentru salvare. Selectați FB2. Dacă este necesar, accesați „Opțiuni” și introduceți informații suplimentare (autor, titlu, cuvinte cheie, descriere).

După salvare, puteți rămâne în modul de editare a textului și îl puteți converti în format Word sau PDF.

Caracteristici de editare a textului în Abbyy Finereader

Există mai multe opțiuni pentru text pe care Abbyy Finereader le recunoaște.

În documentul original, salvați imaginile și subsolurile, astfel încât acestea să fie transferate în noul document.

Analizați documentul pentru a afla ce erori și probleme pot apărea în timpul procesului de conversie.

Editați imaginea paginii. Sunt disponibile opțiuni pentru decuparea, corectarea fotografiilor și modificarea rezoluției.

Așa că ți-am spus cum să folosești Abbyy Finereader. Are capabilități destul de largi pentru editarea și conversia textelor. Lăsați acest program să vă ajute să creați orice documente de care aveți nevoie.

Deși progresele realizate în domeniul inteligenței artificiale (AI) în ultimii 50 de ani nu au adus mașinile inteligente cu nici un iotă mai aproape de capacitățile cognitive umane, ar fi nedrept să negem complet progresele în această direcție. Cel mai evident și izbitor exemplu este șahul (ca să nu mai vorbim de jocurile mai simple). Un computer încă nu poate imita gândirea noastră, dar este destul de capabil să compenseze acest decalaj cu o cantitate mare de memorie specializată și viteză de căutare. Vladimir Kramnik a descris jocul programului Deep Fritz care l-a învins în 2006 drept „inuman”, în sensul că a contrazis adesea regulile (umane) stabilite de strategie și tactică.

Și în urmă cu puțin peste un an, o altă creație a IBM, care la un moment dat a pus bazele victoriilor triumfale în șah ale computerelor (celebrul Deep Blue), numit Watson, a făcut o nouă descoperire, învingând doi campioni ai popularului test american Jeopardy. cu o marjă largă. Cu toate acestea, este semnificativ faptul că, deși Watson a exprimat în mod independent răspunsurile, întrebările i-au fost încă transmise sub formă de text. Acest lucru sugerează că succesele în multe domenii ale aplicației AI - recunoașterea vorbirii și a imaginilor, traducerea automată - sunt destul de modeste, deși acest lucru nu ne împiedică să le folosim în practică astăzi. Cele mai mari succese, probabil, sunt demonstrate de sistemele optice de recunoaștere a caracterelor (OCR, Optical Character Recognition), cu care aproape toți utilizatorii de PC sunt probabil familiarizați într-un fel sau altul. Mai mult, evoluțiile rusești în acest domeniu ocupă un loc demn în lume - mă refer la ABBYY FineReader.

Puțină istorie

Versiunea actuală a ABBYY FineReader este numărul 11, adică aplicația a trecut printr-o cale de dezvoltare destul de lungă și chiar și istoria acestui proces prezintă un oarecare interes. Fără a pretinde a fi o cronică exhaustivă, voi da doar principalele repere din ultimul deceniu, în care am urmărit mai mult sau mai puțin FineReader:

AnVersiuneCaracteristici principale
2003 7.0 Creșterea acurateței recunoașterii cu până la 25%. Acest lucru s-a reflectat cel mai mult în tabele, în special în cele complexe, cu celule colorate, divizoare ascunse etc.
2005 8.0 Optimizarea în continuare a algoritmilor de recunoaștere, care vizează în primul rând să lucreze nu cu documente scanate, ci cu fotografii digitale. În acest scop, au apărut funcții suplimentare pentru pregătirea originalelor (eliminarea distorsiunilor, alinierea liniilor etc.).
2007 9.0 Apariția tehnologiei ADRT, care ține cont de structura logică a întregului document procesat (cu mai multe pagini) și este capabilă să evidențieze elemente repetate (anteturi și subsoluri), să conecteze obiecte „curgătoare” (tabele) etc.
2009 10.0 Îmbunătățirea suplimentară a ADRT și a algoritmilor de recunoaștere, crescând acuratețea de procesare a originalelor cu rezoluție scăzută cu până la 30%.
2011 11.0 Atenția principală este acordată vitezei programului. „A doua venire” a modului alb-negru, care la originale de bună calitate oferă o accelerație suplimentară de până la 30%.

Desigur, în același timp, FineReader a extins suportul pentru formatele de documente, instrumente și interfețe încorporate îmbunătățite, recrearea îmbunătățită a structurii originalelor etc. Cu toate acestea, punctele evidențiate sunt direct legate de tehnologiile OCR și demonstrează bine procesul de dezvoltare spasmodică. caracteristică sistemelor complexe intensive în cunoștințe când după următoarea „recunoaștere” urmează o anumită perioadă de „liniște”, necesară pentru îmbunătățirea noilor algoritmi. Ele reprezintă valoarea principală a oricărui program OCR și, prin urmare, orice informații detaliate despre ele ajung rar la utilizatori. Cu toate acestea, ABBYY a acceptat cu amabilitate să ridice vălul secretului și astăzi avem ocazia să ne uităm la sfântul sfintelor FineReader.

Principii de bază

Deci, deoarece OCR aparține domeniului AI, este logic ca dezvoltatorii să se străduiască să imite cel puțin într-o oarecare măsură activitatea creierului nostru. Desigur, structura sistemului nostru vizual este incredibil de complexă, dar principiile de bază ale „blocurilor mari” ale funcționării sale au fost suficient studiate, de obicei, sunt trei:

  1. Integritate- un obiect este considerat ca o colecție a părților sale și (pentru imagini vizuale) relații spațiale dintre ele. La rândul lor, părțile primesc interpretare doar ca parte a întregului obiect. Acest principiu ajută la construirea și clarificarea ipotezelor, eliminând rapid pe cele improbabile.
  2. Finalitate- întrucât orice interpretare a datelor urmărește un scop specific, recunoașterea este un proces de prezentare a ipotezelor despre un obiect și testarea lor intenționată. Un sistem care funcționează în conformitate cu acest principiu nu numai că va folosi puterea de calcul mai economic, dar va face și mai puține greșeli.
  3. Adaptabilitate- sistemul salvează informațiile acumulate în timpul funcționării și le reutilizează, adică se învață singur. Acest principiu vă permite să creați și să acumulați cunoștințe noi și să evitați rezolvarea în mod repetat a acelorași probleme.

FineReader este singurul sistem OCR din lume care funcționează în conformitate cu principiile descrise mai sus în toate etapele procesării documentelor. Tehnologia corespunzătoare se numește IPA- conform primelor litere ale termenilor englezi. De exemplu, conform principiului integrității, un fragment al unei imagini va fi interpretat ca simbol numai dacă conține toate părțile structurale ale obiectelor similare și cele care se află în anumite relații. Acest lucru ajută la înlocuirea căutării unui număr mare de standarde (în căutarea unuia mai mult sau mai puțin adecvat) cu o testare țintită a unui număr rezonabil de ipoteze, bazându-se pe informații acumulate anterior despre contururile posibile ale unui personaj dintr-un document recunoscut. .

Cu toate acestea, principiile IPA se aplică atunci când se analizează nu numai fragmente corespunzătoare caracterelor individuale (probabil) ci și întreaga imagine sursă a paginii. Majoritatea sistemelor OCR se bazează pe recunoașterea structurii ierarhice a unui document, adică pagina este împărțită în elemente structurale de bază precum tabele, imagini, blocuri de text, care, la rândul lor, sunt împărțite în alte obiecte caracteristice - celule, paragrafe - și așa mai departe, până la personaje individuale.

O astfel de analiză poate fi efectuată în două moduri principale: de sus în jos, adică de la elemente constitutive la personaje individuale sau, dimpotrivă, de jos în sus. Unul dintre ele este cel mai des folosit, dar ABBYY a dezvoltat un algoritm special MDA(analiza documentelor pe mai multe niveluri), care le combină pe ambele. Pe scurt, arată astfel: structura paginii este analizată folosind o metodă de sus în jos, iar reconstrucția documentului electronic după finalizarea recunoașterii are loc de jos în sus, dar la toate nivelurile există un mecanism suplimentar de feedback. Ca urmare, probabilitatea unor erori grave asociate cu recunoașterea incorectă a obiectelor de nivel înalt este redusă drastic.

ADRT

Din punct de vedere istoric, sistemele OCR au evoluat de la recunoașterea caracterelor individuale. Această sarcină este încă cea mai importantă și mai dificilă cu ea; Cu toate acestea, curând a devenit clar că informațiile de nivel superior (de exemplu, despre limba documentului și ortografia corectă a cuvintelor recunoscute) ar putea ajuta la rezolvarea acestei probleme - așa au apărut verificările contextuale și din dicționar. Apoi, dorința de a păstra formatarea și de a recrea structura fizică (adică, pozițiile relative ale diferitelor obiecte) a unui document a condus la necesitatea unei analize detaliate a unei întregi pagini. Este clar că acest lucru afectează semnificativ și calitatea generală a recunoașterii, deoarece ajută la procesarea corectă a aspectului cu mai multe coloane, a tabelelor și a altor metode de aranjare „neliniară” a textului.

Cele mai moderne OCR operează tocmai la aceste trei niveluri - caractere, cuvinte, pagini - exersând, după cum am menționat deja, abordări de sus în jos sau de jos în sus. Cu toate acestea, ABBYY, în conformitate cu principiile IPA, a introdus un alt nivel în FineReader - întregul document cu mai multe pagini. În primul rând, acest lucru a fost necesar pentru a reproduce corect structura logică, care în documentele moderne devine din ce în ce mai complexă. Dar există bonusuri suplimentare: precizie sporită și procesare mai rapidă a obiectelor care se repetă, identificarea mai corectă (și, prin urmare, recunoașterea) a obiectelor care „curg” de la o pagină la alta.

Tocmai de aceea a fost dezvoltat ADRT(Adaptive Document Recognition Technology) - tehnologie pentru analiza și sinteza documentelor la nivel logic. În cele din urmă, ajută la ca rezultatul FineReader să funcționeze cât mai asemănător cu cel original. Pentru a face acest lucru, imaginea întregului document este analizată, iar cuvintele recunoscute sunt combinate în grupuri (clustere) în funcție de stilul, mediul și locația din pagină. În acest fel, programul pare să vadă „logica” marcajului documentului și poate unifica ulterior designul rezultatului.

Datorită ADRT, FineReader, începând cu versiunea 9.0, a învățat să detecteze, să recunoască și să reproducă următoarele părți structurale și elemente de formatare a documentului:

  • textul principal;
  • anteturi și subsoluri;
  • numerele paginilor;
  • anteturi de același nivel;
  • Cuprins;
  • inserții de text;
  • Legende pentru desene;
  • mese;
  • note de subsol;
  • zone de semnătură/sigiliu;
  • fonturi și stiluri.

Procesul de recunoaștere

În conformitate cu algoritmul MDA, recunoașterea efectivă începe de sus în jos, de la nivelul paginii. Este clar că cu cât se iau mai multe decizii greșite în etapele incipiente ale acestui proces, cu atât vor fi mai multe în cele ulterioare. Acesta este motivul pentru care acuratețea recunoașterii depinde atât de mult de calitatea originalelor, dar algoritmii lor de preprocesare pot avea, de asemenea, un impact semnificativ. Astfel, pe măsură ce popularitatea documentelor color a crescut în FineReader, a apărut o procedură de binarizare adaptivă. AB). Dacă scanați imediat un document în modul alb-negru unde există filigrane sau textul este situat pe un substrat texturat sau color, atunci va apărea invariabil „gunoi” pe imagine, care va fi apoi destul de dificil de separat de „utilul”. ” imagine (deoarece informațiile originale despre el sunt deja pierdute). De aceea FineReader preferă să lucreze cu imagini color sau în tonuri de gri, transformându-le independent în alb-negru (acest proces se numește binarizare). Dar asta nu este tot. Deoarece culorile textului și fundalului pot varia în cadrul unei pagini și chiar în rândurile individuale, AB identifică cuvinte cu mai mult sau mai puțin aceleași caracteristici și selectează parametrii optimi de binarizare pentru fiecare din punctul de vedere al calității recunoașterii. Aceasta este tocmai adaptabilitatea algoritmului, care este, prin urmare, un exemplu de utilizare a feedback-ului în MDA. Este clar că eficacitatea AB depinde în mare măsură de proiectarea documentelor sursă - pe baza de testare ABBYY, acest algoritm a oferit o creștere a preciziei recunoașterii cu 14,5%.

Dar cel mai interesant, desigur, începe atunci când procesul de recunoaștere coboară la cele mai joase niveluri. Așa-numita procedură de împărțire liniară împarte liniile în cuvinte și cuvintele în litere individuale; apoi, în conformitate cu principiul IPA, generează un set de ipoteze (adică opțiuni posibile pentru ce fel de simbol este acesta, în ce simboluri este împărțit cuvântul etc.) și, furnizând fiecăruia o estimare a probabilității, îl trece. la intrarea mecanismului de recunoaștere a caracterelor. Acesta din urmă constă dintr-un număr de așa-numite clasificatoare, fiecare dintre acestea generând, de asemenea, un număr de ipoteze ordonate după gradul de probabilitate așteptat. Cea mai importantă caracteristică a oricărui clasificator este poziția medie a ipotezei corecte. Este clar că cu cât este mai mare, cu atât mai puțină muncă pentru algoritmii ulterioare - de exemplu, verificarea dicționarului. Dar pentru clasificatorii suficient de bine stabiliti, caracteristici precum acuratețea recunoașterii bazată pe primele trei ipoteze sau numai pe prima sunt cel mai adesea evaluate - adică, aproximativ vorbind, capacitatea de a ghici răspunsul corect în trei sau o singură încercare. ABBYY utilizează următoarele tipuri de clasificatoare în sistemele sale: raster, caracteristică, diferenţial de caracteristică, contur, diferenţial structural şi structural - care sunt grupate la două niveluri logice.

Principiul de funcționare RK, sau clasificatorul raster, se bazează pe o comparație pixel cu pixel a unei imagini de caracter cu standarde. Acestea din urmă sunt formate ca urmare a medierii imaginilor din setul de antrenament și reduse la o anumită formă standard; În consecință, dimensiunea, grosimea elementelor și panta sunt, de asemenea, pre-normalizate pentru imaginea recunoscută. Acest clasificator se caracterizează prin ușurință de implementare, viteza de funcționare și rezistență la defectele de imagine, dar oferă o precizie relativ scăzută și de aceea este utilizat în prima etapă - pentru a genera rapid o listă de ipoteze.

clasificator de caracteristici ( PC), după cum sugerează și numele, se bazează pe prezența semnelor unui anumit simbol în imagine. Dacă există N astfel de caracteristici în total, atunci fiecare ipoteză poate fi reprezentată printr-un punct din spațiul N-dimensional; în consecință, acuratețea ipotezei va fi apreciată prin distanța de la aceasta până la punctul corespunzător standardului (care este dezvoltat și pe eșantionul de antrenament). Este clar că tipurile și numărul de caracteristici determină în mare măsură calitatea recunoașterii, așa că de obicei sunt destul de multe. Acest clasificator este, de asemenea, relativ rapid și simplu, dar nu este foarte robust la diferite defecte de imagine. În plus, PC-ul nu funcționează cu imaginea originală, ci cu un anumit model, o abstracție, adică nu ține cont de unele informații: să spunem, însuși faptul prezenței unor elemente importante nu spune orice despre poziția lor relativă. Din acest motiv, PC-ul este folosit nu în loc de, ci împreună cu RK.

Clasificator de contur ( QC) este un caz special al PC-ului și diferă prin aceea că analizează contururile caracterului intenționat extras din imaginea originală. În general, precizia sa este mai mică decât cea a unui computer cu drepturi depline.

clasificator diferenţial de caracteristici ( MPC) este, de asemenea, similar cu PC-ul, dar este folosit numai pentru a face distincția între obiecte similare, cum ar fi „m” și „rn”. În consecință, analizează doar acele zone în care diferențele sunt ascunse și primește ca intrare nu numai imaginile originale, ci și ipotezele formate în stadiile incipiente ale recunoașterii. Principiul funcționării sale, însă, este oarecum diferit de un PC. În etapa de antrenament, în spațiul N-dimensional se formează două „nori” (grupuri de puncte) de valori posibile pentru fiecare dintre cele două opțiuni, apoi se construiește un hiperplan care separă „norii” unul de celălalt și este aproximativ echidistante de ele. Rezultatul recunoașterii depinde de jumătate de spațiu în care se află punctul corespunzător imaginii originale.

MPC în sine nu prezintă ipoteze, ci doar le rafinează pe cele existente (a căror listă este în general sortată folosind metoda bulelor), astfel încât să nu se efectueze o evaluare directă a eficacității, ci indirect este echivalată cu caracteristicile întreg primul nivel de recunoaștere OCR. Cu toate acestea, este clar că depinde de corectitudinea caracteristicilor selectate și de reprezentativitatea eșantionului de standarde, asigurându-se care este o sarcină destul de intensivă în muncă.

Clasificator diferenţial structural ( KFOR) a fost folosit inițial pentru prelucrarea textelor scrise de mână. Sarcina sa este să facă distincția între obiecte similare, cum ar fi „C” și „G”. Astfel, SDK se bazează pe caracteristici caracteristice fiecărei perechi de caractere, procesul său de învățare este chiar mai complex decât cel al MDC, iar viteza sa de operare este mai mică decât cea a tuturor clasificatoarelor anterioare.

clasificator structural ( SK) este o sursă de mândrie pentru ABBYY; a fost dezvoltat inițial pentru a recunoaște așa-numitul text scris de mână, adică atunci când o persoană scrie cu litere „tipărite”, dar ulterior a fost folosit pentru tipărire. Este utilizat în etapele finale ale recunoașterii și intră în vigoare destul de rar, și anume numai atunci când cel puțin două ipoteze cu probabilități suficient de mari ajung la el.

Caracteristicile calitative ale tuturor clasificatorilor sunt colectate în tabelul următor. Ele, totuși, permit doar evaluarea eficienței algoritmilor unul față de celălalt, deoarece aceștia nu sunt absoluti, ci sunt obținuți pe baza procesării unui eșantion de testare specific. Poate părea că în ultimele etape de recunoaștere lupta este literalmente pentru o fracțiune de procent, dar, de fapt, fiecare clasificator aduce o contribuție semnificativă la creșterea acurateței recunoașterii - de exemplu, SC reduce numărul de erori cu o valoare vizibilă. 20%.

RKPCQCMPC*KFOR**SK**
Precizie pentru primele trei opțiuni, %99,29 99,81 99,30 99,87 99,88 -
Precizie conform primei opțiuni, %97,57 99,13 95,10 99,26 99,69 99,73

* evaluarea întregului prim nivel al algoritmului ABBYY OCR
** estimare pentru întregul algoritm după adăugarea clasificatorului corespunzător

Este curios, însă, că, în ciuda preciziei destul de ridicate, algoritmul de recunoaștere în sine nu ia decizia finală. În conformitate cu principiul MDA, ipotezele sunt prezentate la fiecare nivel logic, iar numărul lor poate crește exponențial. În consecință, este puțin probabil ca testarea secvențială a tuturor ipotezelor să fie eficientă și, prin urmare, sistemele ABBYY OCR utilizează metoda de structurare a ipotezelor, adică atribuirea lor unuia sau altuia. Există câteva zeci dintre acestea din urmă, iată doar câteva dintre tipurile lor: cuvânt din dicționar, cuvânt non-dicționar, cifre arabe, cifre romane, URL, expresie regulată - și fiecare poate include multe modele specifice (de exemplu, un cuvânt într-una dintre limbile cunoscute, latină, chirilică etc.).

Toate acțiunile finale sunt realizate cu ipoteze construite folosind modele. De exemplu, verificarea contextuală va determina limba documentului și va reduce imediat în mod semnificativ probabilitatea ca modelele să utilizeze alfabete incorecte, iar verificarea dicționarului va compensa erorile de recunoaștere incertă a anumitor caractere: de exemplu, cuvântul „întoarce” este prezent în Dicționar englez - spre deosebire de „tum” (în orice caz, nu se numără printre cele populare). Deși prioritatea dicționarului este mai mare decât cea a oricărui clasificator, nu este neapărat ultima soluție și, în general, nu oprește verificările ulterioare: în primul rând, așa cum am menționat mai sus, există un model de cuvânt non-dicționar și, în al doilea rând, , organizarea specială a dicționarelor permite cu un procent mare de probabilități de a ghici dacă un cuvânt necunoscut poate aparține unei anumite limbi. Cu toate acestea, verificarea dicționarului (și completitudinea dicționarelor) are un impact semnificativ asupra rezultatului recunoașterii, iar în testele proprii ABBYY reduce numărul de erori cu aproape jumătate.

Nu numai OCR

Documentele tipărite sunt departe de a fi singurele de interes din punct de vedere al digitizării și procesării automate a acestora. Destul de des trebuie să lucrați cu formulare, adică documente cu câmpuri predefinite și fixe, care sunt completate manual, dar relativ precis (așa-numitele caractere tipărite manual) - diverse chestionare pot servi ca exemplu. Tehnologia pentru prelucrarea lor are un nume separat - ICR(recunoaștere inteligentă a caracterelor) - și diferă destul de semnificativ de OCR. Deci, deoarece în acest caz sarcina nu este de a recrea întregul document, ci de a extrage date specifice din acesta, acesta se împarte în două subsarcini principale: găsirea câmpurilor necesare și recunoașterea efectivă a conținutului acestora.

Aceasta este o zonă destul de specifică, iar ABBYY oferă un produs software complet separat, ABBYY FlexiCapture, pentru aceasta. Este destinat creării de sisteme automate și semi-automatizate, implică personalizarea pentru tipuri specifice de documente pentru care sunt create șabloane speciale, poate găsi în mod inteligent diverse câmpuri pe pagini și poate verifica datele din ele etc. Cu toate acestea, la bază se află recunoașterea caracterelor algoritmi similari cu cei , care sunt utilizați în FineReader, iar schema generală este foarte asemănătoare:

Cu toate acestea, există încă o diferență importantă: clasificatorul structural este un participant obligatoriu în proces - acest lucru se datorează specificului simbolurilor imprimate manual. În plus, ICR implică un număr mare de verificări suplimentare specifice: de exemplu, dacă un caracter este tăiat sau dacă caracterele recunoscute formează de fapt o dată.

Una dintre cele mai populare funcționalități pentru lucrul cu scanarea și procesarea fișierelor de diferite tipuri este Fine Reader. Funcționalitatea produsului software a fost dezvoltată de compania rusă ABBYY, care permite nu numai recunoașterea, ci și procesarea documentelor (traducerea, modificarea formatelor etc.); Mulți utilizatori îl pot instala doar, dar nu își pot da seama imediat cum să folosească ABBYY FineReader. Puteți găsi răspunsuri la multe întrebări în acest articol.

Programul vă permite să scanați și să recunoașteți text - și multe altele

Pentru a înțelege în detaliu ce fel de program este ABBYY FineReader 12, trebuie să luați în considerare în detaliu toate capacitățile sale. Prima și cea mai simplă funcție este scanarea unui document. Există două opțiuni de scanare: cu și fără recunoaștere. În cazul unei scanări regulate a unei foi tipărite, veți primi imaginea pe care ați scanat-o în folderul specificat de pe dispozitivul dvs. de calcul.

ATENŢIE. Foaia trebuie plasată uniform pe partea de scanare a imprimantei, de-a lungul contururilor indicate pe imprimantă. Nu permiteți fișierului sursă să devină strâmb, deoarece acest lucru poate duce la o calitate slabă a scanării finale.

Trebuie să decideți singur de ce aveți nevoie de FineReader, deoarece utilitarul are o funcționalitate semnificativă, de exemplu, puteți alege independent în ce culoare doriți să fie imaginea, este posibil să convertiți toate fotografiile în alb-negru. În alb-negru, recunoașterea este mai rapidă și calitatea procesării crește.

Dacă sunteți interesat de funcția de recunoaștere a textului ABBYY FineReader, trebuie să apăsați un buton special înainte de a scana. În acest caz, există mai multe opțiuni pentru obținerea de informații. În mod standard, pe ecran va fi afișată o bucată de foaie recunoscută, pe care o puteți copia sau edita manual.

Dacă selectați alte funcții, puteți primi imediat fișierul ca document Word sau tabel Excel. Selectarea functiilor este foarte simpla, meniul este intuitiv si usor de personalizat datorita faptului ca toate butoanele de care ai nevoie sunt in fata ochilor tai.

IMPORTANT. Înainte ca ABBYY FineReader să poată recunoaște textul, trebuie să selectați cu precizie limba de procesare. În ciuda faptului că utilitatea funcționează complet automat, se întâmplă ca calitatea scăzută a sursei să nu ne permită să înțelegem ce fel de limbă a fost în sursă. Acest lucru reduce foarte mult calitatea rezultatelor finale ale aplicației.

Mai multe moduri de operare

Pentru a înțelege pe deplin cum să utilizați ABBYY FineReader 12, trebuie să încercați două moduri de operare: „Atenție” și „Recunoaștere rapidă”. Al doilea mod este potrivit pentru imagini de înaltă calitate, iar primul pentru fișiere de calitate scăzută. Procesul fișierelor în modul Aprofundat durează de 3-5 ori mai mult.

Ilustrația arată rezultatul programului - recunoașterea textului dintr-o imagine

Ce alte funcții există?

Recunoașterea textului în ABBYY FineReader nu este singura caracteristică utilă. Pentru o mai mare comoditate pentru utilizator, există

De data aceasta, vă voi spune cum să transformați documentele de hârtie în format PDF electronic, precum și cum să transferați un document pe hârtie pe un computer pentru a modifica textul. Deci să începem.
Am un document pe hârtie în mâini.

SCANĂ în PDF

Sarcină: transferați acest document pe computer (traduceți în formă electronică). Mai mult, trebuie făcută exact în această formă, astfel încât să nu poată fi schimbată în viitor (în linii mari, trebuie să faceți o fotografie a documentului). Apoi, acest document electronic trebuie trimis prin poștă la o adresă de e-mail. Mai mult, clientul îl solicită în format pdf.

Pe etape:
1) Trec documentul prin scanner
2) Salvez imprimarea rezultată în format pdf pe computer
3) Trimit fisierul primit prin posta
În munca mea, folosesc 2 programe pentru a rezolva această problemă:
Foxit Phantom sau ABBYY FineReader. Pentru claritate, atașez capturi de ecran:
În Foxit Phantom, când scanerul este pornit, trebuie să selectați FILE-CREATE PDF FROM SCANNER în meniul principal...
Scanarea va avea loc și vi se va solicita să salvați fișierul. Selectați o locație, scrieți numele fișierului și salvați.

ABBYY FineReader are butoane uriașe în bara de instrumente. Unul dintre ele se numește SCAN to PDF. Îl folosim.

Dacă trebuie să scanați un document cu mai multe pagini, atunci, în etape:
1) Apăsați butonul numărul 1 SCANARE

Primim un document scanat

Scanăm și o altă pagină (apăsăm din nou butonul numărul 1 SCANARE).
2) Salvați ca PDF



Ca rezultat, obținem un document finit cu mai multe pagini sub forma unui fișier PDF.

Acum acest fișier poate fi trimis prin e-mail.

RECUNOAȘTEREA TEXTULUI

Sarcină: convertiți un document de hârtie în formă electronică (în computer)

Pe etape:
1) Scanare (butonul 1 SCANARE)

2) Recunoaștere (butonul 2 RECOGNIZE ALL)

Recunoașterea trebuie înțeleasă ca procesul de traducere a unei fotografii (imagine) în text (litere, cifre, semne). Dacă ați fotografiat o pagină de text, atunci după ce ați recunoscut 99% din text de pe hârtie, acesta se va transforma în text electronic. Textul electronic poate fi deja modificat (editat) pe un computer așa cum doriți.

3) Salvare într-un editor de text (butonul 4 Salvare)
Vă sfătuiesc să selectați TRANSFER TOATE PAGINILE ÎN MICROSOFT WORD

Primim

Aș dori să subliniez puncte importante în timpul procedurii de RECUNOAȘTERE. Există nuanțe atunci când lucrezi.
Imediat după recunoaștere, vă sfătuiesc să vă uitați la rezultat. Mai ales pe blocurile pe care le creează programul FineReader.

Acestea sunt zone evidențiate în cadre dreptunghiulare. Aceste rame sunt de diferite culori. Dacă este roșu, atunci acest bloc este recunoscut ca IMAGINE. Dacă este negru, atunci TEXT. Blocurile vin în diferite tipuri. Tipul de bloc poate fi găsit făcând clic pe bloc cu butonul DREAPTA al mouse-ului și selectând MODIFICARE TIP BLOC.

Un mic truc: puteți selecta o zonă arbitrară și o etichetați cu orice tip de bloc. De exemplu, să selectăm acea parte a textului care este prost recunoscută folosind butonul stâng al mouse-ului (clic, țineți apăsat și trageți, cadrul își schimbă dimensiunea).

Drept urmare, documentul din Word va avea un bloc de text și un bloc de imagini. Imaginea blocului va avea un aspect absolut neschimbat. Folosesc această metodă când salvez timbre, fonturi non-standard, imagini și fotografii.

PS: Cunoștințele și capacitatea de a lucra cu PDF, de a scana și de a recunoaște documente ajută foarte des în munca de birou. Cunoașterea vă economisește timp!

  • Serghei Savenkov

    un fel de recenzie „scurtă”... de parcă s-ar grăbi undeva