გამოსახულების ამოცნობის საფუძვლები FineReader-ის გამოყენებით. როგორ გამოვიყენოთ ABBYY FineReader Finereader ავტომატური შენახვა

გამარჯობა. დღეს მე ვისაუბრებ იმაზე, თუ როგორ გამოვიყენოთ Abbyy FineReader პროგრამა, რათა ამოიცნოთ ტექსტი იმ სურათიდან, რომელიც შესაძლოა სკანირების შედეგად მიიღოთ. თქვენი დასკანირებული ტექსტი მთლიანად იქნება Microsoft Word დოკუმენტში და ამ აღიარებული ტექსტის რედაქტირება შესაძლებელია! Abbyy Finereader-ის გამოყენებით ტექსტის ამოცნობა შეიძლება სასარგებლო იყოს მათთვის, ვინც სწავლობს, მუშაობს ტექსტებთან და თარგმანებთან. პროგრამა, სამწუხაროდ, ფასიანია. ერთხელ მქონდა შანსი მეცადა მსგავსი პროგრამების ერთ-ერთი უფასო ვერსია, მაგრამ ძალიან კარგად დასკანირებული ტექსტი უბრალოდ საშინლად იქნა აღიარებული... და Abbyy FineReader-ში ტექსტის ამოცნობა ძალიან მაღალი ხარისხის გამოდის! ახლა მე გაჩვენებთ, თუ როგორ გამოიყენოთ Abbyy FineReader პროგრამა, რათა სწრაფად ამოიცნოთ ტექსტი სურათიდან.

ABBYY FineReader-ს აქვს საცდელი ვერსია 30 დღის განმავლობაში, 100-მდე გვერდის ამოცნობის და დოკუმენტიდან არაუმეტეს 3 გვერდის შენახვის უნარით. იმათ. ამ დროის განმავლობაში შეგიძლიათ ნახოთ პროგრამის შესაძლებლობები და მიიღოთ ინფორმირებული გადაწყვეტილება – გჭირდებათ თუ არა ის, ღირს თუ არა ყიდვა.

როგორ დააინსტალიროთ Abbyy FineReader!

Abbyy Finereader-ის გამოყენებამდე თქვენ უნდა დააინსტალიროთ იგი. მოდით შევხედოთ ამ პროგრამის ინსტალაციის პროცესს...

პირველ რიგში, აირჩიეთ პროგრამის ენა. დააჭირეთ "OK".

ჩვენ ვეთანხმებით სალიცენზიო ხელშეკრულების პირობებს (სურვილის შემთხვევაში შეგიძლიათ წაიკითხოთ სალიცენზიო ხელშეკრულება თუ გაინტერესებთ რაზეა საუბარი). დააჭირეთ "შემდეგი".

შემდეგი, თქვენ უნდა აირჩიოთ ინსტალაციის რეჟიმი. ნორმალურ რეჟიმში, პროგრამა არ მოგთხოვთ და დააინსტალირებს პროგრამაში ნაგულისხმევად მითითებულს, კერძოდ, ყველა კომპონენტს: თავად Abbyy Finereader ტექსტის ამოცნობის პროგრამას, კომპონენტს Microsoft Office პროგრამებისთვის და კომპონენტს Windows Explorer-ისთვის (რომელიც საშუალებას გაძლევთ სურათების სწრაფად ამოცნობა პროგრამის ცალკე გახსნის გარეშე). მე გირჩევთ, შეამოწმოთ პერსონალური ინსტალაცია, რათა დააკონფიგურიროთ ის, როგორც გჭირდებათ. მეტიც, 15 წუთიც არ დასჭირდება :) ქვემოთ არის საქაღალდე, სადაც პროგრამა დაინსტალირდება. მიზანშეწონილია დატოვოთ ნაგულისხმევი არჩევანი, რათა მოგვიანებით არ შეგექმნათ პრობლემები პროგრამის გამოყენებისას. დააჭირეთ "შემდეგი".

პროგრამის კომპონენტები. ეს ფანჯარა გამოჩნდება, თუ აირჩევთ ინსტალაციის ტიპს "მორგებული". კომპონენტები არის რაღაც დამხმარე აპლიკაციები პროგრამისთვის. პირველი კომპონენტია „ინტეგრაცია Microsoft Office პროგრამებთან და Windows Explorer-თან“. ეს კომპონენტი გამოჩნდება Microsoft Office მენიუში და თუ დააწკაპუნებთ მაუსის მარჯვენა ღილაკით სურათზე თქვენს კომპიუტერში, იქნება ელემენტი ამ პროგრამით. ასე გამოიყურება თქვენი მენიუ Microsoft Office-ში ამ კომპონენტის დამატების შემდეგ.

აი, რა მოხდება, თუ დააწკაპუნებთ სურათზე მარჯვენა ღილაკით:

იმათ. გამოჩნდება მენიუ, რომელშიც შეგიძლიათ გააკეთოთ ტექსტის სწრაფი ამოცნობა და შედეგების გაგზავნა Word, Excel ან PDF-ში.

მეორე კომპონენტი საშუალებას მოგცემთ ამოიცნოთ ტექსტი თქვენი კომპიუტერის ეკრანიდან. ეს ნიშნავს, რომ თქვენ შეგიძლიათ გადაიღოთ სკრინშოტი და ასევე ამოიცნოთ ტექსტი. თუ არ გსურთ რომელიმე კომპონენტის დაყენება, ან არ გსურთ ორივეს დაყენება, მაშინ უნდა დააჭიროთ ქვემოთ ისარს და აირჩიეთ „ეს კომპონენტი არ იქნება ხელმისაწვდომი“. მაშინ კომპონენტი არ იქნება დაინსტალირებული. ორივე დავტოვე.

შემდეგი 4 ქულა. პირველი ნიშნავს, რომ ინფორმაცია იმის შესახებ, თუ როგორ იყენებთ Abbyy Finereader პროგრამას, გადაეცემა დეველოპერს. გირჩევთ, არ შეამოწმოთ ეს ელემენტი, რათა პროგრამა კიდევ ერთხელ არ გადავიდეს ინტერნეტში, რათა გამოაგზავნოთ ინფორმაცია მასთან მუშაობის შესახებ. უფრო მეტიც, თქვენ არასოდეს იცით რა სხვა ინფორმაცია გაიგზავნება :) მე-2 წერტილი ქმნის პროგრამის მალსახმობს დესკტოპზე. მე-3 ნიშნავს, რომ პროგრამა დაიწყება კომპიუტერის ჩართვისას, ხოლო მე-4 შეამოწმებს პროგრამის განახლებებს. ვტოვებ მხოლოდ მეორეს და გვერდით ვტოვებ ტკიპს. ჩვენ ვხურავთ Microsoft Office-ის ყველა აპლიკაციას, რადგან ინსტალერი ამას მოითხოვს და დააჭირეთ "ინსტალაციას".

თქვენ უნდა დაელოდოთ რამდენიმე წუთს პროგრამის ჩატვირთვისთვის და დააჭირეთ "შემდეგი".

ესე იგი, ინსტალაცია დასრულებულია! დააწკაპუნეთ "დასრულება".

როგორ გამოვიყენო Abbyy Finereader ტექსტის ამოსაცნობად დასკანირებული ან ნებისმიერი სხვა სურათიდან?

მოდით შევხედოთ როგორ გამოვიყენოთ პროგრამა. მაგალითად, თქვენ გაქვთ დასკანირებული ტექსტი. ახლა, Abbyy FineReader-ში ტექსტის ამოსაცნობად, გახსენით პროგრამა. დააჭირეთ "გახსნას".

აირჩიეთ ჩვენთვის საჭირო სურათი და დააჭირეთ გახსნას.

როდესაც გახსნით სასურველ დოკუმენტს, Abbyy Finereader დაიწყებს ტექსტის ამოცნობას. რაც უფრო დიდია დოკუმენტი, მით უფრო დიდი დრო დასჭირდება ამოცნობას. ერთი გვერდის ამოცნობას შეიძლება რამდენიმე წამი დასჭირდეს.

ტექსტის ამოცნობის შემდეგ, თქვენ მხოლოდ უნდა შეინახოთ შედეგი Microsoft Word დოკუმენტში, ასე რომ თქვენ შეგიძლიათ შეცვალოთ ყველაფერი მასში. ამისათვის დააწკაპუნეთ ღილაკზე „შენახვა“ ზედა ინსტრუმენტთა პანელზე, შემდეგ აირჩიეთ რომელ საქაღალდეში იქნება შენახული Word დოკუმენტი და რა სახელით.

თუ თქვენ გაქვთ სკანერი დაკავშირებული თქვენს კომპიუტერთან, მაშინ შეგიძლიათ დაიწყოთ სკანირება პირდაპირ პროგრამიდან და რის შემდეგაც დასკანირებული დოკუმენტი დაუყოვნებლივ იქნება აღიარებული. ამისათვის დააჭირეთ ღილაკს "სკანირება" ინსტრუმენტთა პანელზე. შემდეგი ნაბიჯები დამოკიდებული იქნება თქვენი პრინტერის დრაივერის პროგრამაზე. თქვენ მხოლოდ უნდა მიჰყვეთ სკანირების ოსტატის მითითებებს.

როგორც ხედავთ, ყველაფერი ძალიან მარტივი და სწრაფია. ახლა თქვენ იცით, როგორ გამოიყენოთ Abbyy FineReader სურათებიდან ტექსტის ამოსაცნობად! იმედია ეს ინფორმაცია ბევრს გამოადგება :) წარმატებებს გისურვებთ!

საუბარი იქნება ABBYY FineReader 12 პროგრამაზე, ანუ მის უახლეს ვერსიაზე. შორს რომ არ გავუხედავთ, შევარჩიეთ ABBYY-ის ყველაზე ცნობილი პროდუქტი, რომელიც, თავისი დამსახურებით, იდეალურად რუსიფიცირებულია. უკვე ერთი შეხედვით, Fine Reader (FR) ტოვებს პროგრამის შთაბეჭდილებას კარგი რუსულენოვანი მხარდაჭერით: ამ მხრივ, მართლაც, ყველაფერი კეთდება ძალიან ღირსეულ დონეზე, მათ შორის ფონური ინფორმაცია.

პირველი - უკან დახევა. ყოველთვის აქტუალურია კითხვა, თუ როგორ გადავიტანოთ არქივის მთელი ან ნაწილი ციფრულ ფორმატში (და რას იგულისხმება სიტყვა „ციფრული“). სკანერის ყიდვა ნაკლებად სავარაუდოა, რომ გადაჭრას ყველა პრობლემა. რა თქმა უნდა, ძალიან ხშირად სკანერის დოკუმენტაცია მოყვება დისკს ან რამდენიმე საკუთრებაში არსებულ პროგრამულ უზრუნველყოფას. თუმცა, უკვე გაწმენდის ეტაპზე ირკვევა, რომ სკანირების პროგრამის ხარისხი სასურველს ტოვებს ან ფორმატი, რომელშიც ხდება დაზოგვა, სამწუხაროდ, არ არის შესაფერისი შესანახად. რატომ? გრაფიკული ფორმატების უმეტესობა არ გამოყოფს ტექსტს დოკუმენტის არატექსტური სივრცისგან და, შესაბამისად, შეუძლებელია ასეთი ფაილიდან რომელიმე მონაკვეთის კოპირება.

სწორედ ასეთ შემთხვევებში მოდიან სამაშველოში ფუნქციონალური ტექსტის ამოცნობის პროგრამები, რომელთა შესაძლებლობები, კერძოდ, მოიცავს სურათიდან ტექსტის ამოღებას.

ABBYY FineReader-ის გაცნობა

პლასტიკური ჩანთა ABBYY Finereader 12- ოპტიკური სიმბოლოების ამოცნობის (OCR) სისტემა. შექმნილია როგორც დაბეჭდილი დოკუმენტების კომპიუტერში ავტომატური შეყვანისთვის, ასევე PDF დოკუმენტების და ფოტოების რედაქტირებად ფორმატებში გადასაყვანად (პროგრამის სახელმძღვანელოდან)

აკრონიმი "OCR" გამოიყენება მონაცემთა ამოცნობის ყველა აპლიკაციისთვის (არა მხოლოდ ტექსტისთვის). მონაცემთა მოპოვების წყარო შეიძლება იყოს ბეჭდური ან ელექტრონული დოკუმენტი. ოდესღაც, არც ისე დიდი ხნის წინ, ცოტამ თუ იცოდა OCR-ის შესახებ, ამა თუ იმ ფორმით, და ტექსტის ელექტრონულ ფორმაში გადაყვანის პროცესი უბრალო რუტინად გადაიქცა, ორიგინალური ტექსტის ხელით ხელახლა დაბეჭდვამდე. დღეს, ბრტყელი სკანერი (მხოლოდ რამდენიმე იყენებს სახლში მექანიკურ სკანერს) და finereader 12- დარწმუნებული იყავით, რომ სკანირებასა და ამოცნობაში სირთულეები არ იქნება.

მეექვსე ვერსიიდან დაწყებული, FineReader მხარს უჭერს იმპორტს და ექსპორტს PDF ფორმატში, დაპატენტებული Adobe-ის მიერ. ბევრ მკითხველს, ალბათ, შეექმნა სირთულეები ამ ფორმატიდან რომელიმე სხვაზე თარგმნისას (დოკუმენტი და ა.შ.), რადგან ამ სფეროში არც ისე ბევრი ნამდვილად სასარგებლო პროგრამაა (ერთადერთი ყურადღების ღირსია ABBYY-ის შვილობილი პროდუქტი, PDF Transformer). ფაქტია, რომ ასეთი პროგრამები მხოლოდ ერთხელ ასრულებენ ტექსტის ამოცნობას, რის შედეგადაც შედეგის „იდენტურობა“ საერთოდ არ არის მნიშვნელოვანი (დოკუმენტის სირთულიდან გამომდინარე), გარდა ამისა, დოკუმენტის ფორმატირება საკმაოდ იკარგება.

FineReader-ის შემთხვევაში ყველაფერი სხვაგვარადაა. პროგრამის მეცხრე ვერსია წარმოგიდგენთ ტექნოლოგიას სახელწოდებით Document OCR. იგი ეფუძნება დოკუმენტის ინტეგრალური ამოცნობის პრინციპს: იგი გაანალიზებულია და აღიარებულია როგორც ერთიანი მთლიანობა და არა გვერდი გვერდი. ამავდროულად, ყველა სახის სვეტი, სათაური, შრიფტი, სტილი, სქოლიო და გამოსახულება ხელუხლებელი რჩება ან იცვლება ორიგინალთან ახლოს.

პაკეტის დაყენება

Finereader 12-ის დემო ვერსია შეგიძლიათ ჩამოტვირთოთ Abbyy.ru-ს ვებსაიტზე, ჩამოტვირთვის განყოფილებაში, სრული ლიცენზირებული ვერსია ნაწილდება CD-ზე. შეძენის მეთოდების შესახებ შეგიძლიათ შეიტყოთ იმავე ვებსაიტზე, განყოფილებაში „ყიდვა“.

ABBYY დეველოპერების ვებსაიტზე შეგიძლიათ ჩამოტვირთოთ ABBYY FineReader პაკეტის ვერსიის 12-ის დემო ვერსია (ან სხვა, რომელიც დღეს აქტუალურია)

ABBYY FineReader განაწილებულია რამდენიმე ვერსიით: Professional Edition, Corporate Edition, Site License Edition და ა.შ. განსხვავება პროფესიონალურ ვერსიასა და სხვას შორის არის ის, რომ ის შექმნილია კორპორატიულ ქსელში სამუშაოდ, დოკუმენტების ამოცნობაზე თანამშრომლობის შესაძლებლობით. წინააღმდეგ შემთხვევაში, განსხვავება უმნიშვნელოა და დამოკიდებულია სალიცენზიო ხელშეკრულების პირობების არჩევანზე.

ძნელი წარმოსადგენია, რომ 12 წლის წინ იყო FineReader 2.0, რომელიც იკავებს დაახლოებით 10 მბ დისკზე. დროთა განმავლობაში, პაკეტი ათჯერ გაიზარდა და ახლა, ინსტალაციისას, 300 მბ-მდე სჭირდება. ბევრია თუ ცოტა - თავად განსაჯეთ. ახალი FR მხარს უჭერს 179 ამოცნობის ენას, მათ შორის ნაკლებად ცნობილ ხელოვნურ ენებს (იდო, ინტერლინგუალური, დასავლეთ და ესპერანტო), პროგრამირების ენები, ფორმულები და ა.შ. არ დავივიწყოთ სხვადასხვა ფორმატებისა და სკრიპტების მხარდაჭერა. ასე რომ, თუ რაიმე მიზეზით გსურთ შეზღუდოთ პაკეტის დაკავება სივრცეში, ინსტალაციის დროს აირჩიეთ მხოლოდ ის კომპონენტები, რომლებიც საჭირო იქნება მუშაობის დროს.

კომპონენტების არჩევანი გავლენას ახდენს ინსტალაციის ხანგრძლივობაზე, რომელსაც, თუმცა, დიდი დრო არ უნდა დასჭირდეს. ინსტალაციის პროცესში თქვენ გაეცნობით FR-ის ძირითად მახასიათებლებს. გააქტიურების შემდეგ (ინტერნეტის საშუალებით, ელექტრონული ფოსტით, მიღებული კოდის გამოყენებით და ა.შ.) პროგრამა მზად არის სრული ფუნქციონირებისთვის. დემო რეჟიმში, თქვენ ნამდვილად შეხვდებით სხვადასხვა შეზღუდვებს, რომლებიც, სამწუხაროდ, არ გაძლევთ საშუალებას სრულად გამოიყენოთ პაკეტი.

FineReader ინტერფეისი. ფუნქციონალობა

პროგრამის შესაძლებლობებზე წვდომა შესაძლებელია როგორც სკრიპტების საშუალებით, რომლებიც გამოჩნდება მთავარ მენიუში ინსტალაციის პროცესისთანავე, ასევე, ფაქტობრივად, მთავარი ინტერფეისის საშუალებით.


ეკრანმზოგი FineReader-ის გაშვებისას

პროგრამის გარეგნობა არ განიცდის რაიმე მნიშვნელოვან ცვლილებას ვერსიიდან ვერსიამდე: დეველოპერები ვერ ხედავენ მის რადიკალურად შეცვლას. დიდი ყურადღება ეთმობა ერგონომიკას, რაც შესამჩნევია ABBYY-ის ყველა პროდუქტში (Lingvo, PDF Transformer, FlexiCapture...). სხვა სიტყვებით რომ ვთქვათ, Fine Reader 12 ინტერფეისი კარგად არის გააზრებული და შესაფერისია ყველა მომხმარებლისთვის, მათ შორის დამწყებთათვის. პრინციპი "მიიღე შედეგი ერთი დაწკაპუნებით" მიმართავს მათ, ვინც არ არის მიჩვეული რაღაცის დაყენებასა და შეცვლას. მეორეს მხრივ, უფრო გამოცდილ მომხმარებლებს შეუძლიათ გულდასმით დააკონფიგურირონ FineReader პარამეტრების დიალოგის საშუალებით (ინსტრუმენტები -> ოფციები…). ერთადერთი გაფრთხილება: აპლიკაციაში კომფორტული მუშაობისთვის, მიზანშეწონილია დააყენოთ ეკრანის გარჩევადობა 1280×800-ზე, ისე რომ ყველა ხელსაწყო ყოველთვის, როგორც ამბობენ, ხელთ იყოს.

Fine Reader პროგრამის გაშვების შემდეგ გამოჩნდება ფანჯარა პროგრამის ფუნქციებზე სწრაფი წვდომის ღილაკებით. ეს მენიუ ასევე ხელმისაწვდომია Tools -> ABBYY FineReader მენიუს მეშვეობით, ღილაკის “Main Scripts” პროგრამის უკიდურეს მარჯვენა კუთხეში ან Ctrl+N კლავიშების კომბინაციის საშუალებით (Word-ის მსგავსი, სადაც ეს კომბინაცია ხსნის ახალ დოკუმენტს) .

Microsoft Word-ზე სკანირება: FineReader-ის მეცხრე ვერსიაში გამოჩნდა მხარდაჭერა Microsoft Word 2007-ისთვის, რომელიც ჯერ კიდევ არ გახდა პოპულარული, თავის მხრივ, "ბრენდირებული" წითელი ხატულა გამოჩნდება Microsoft Office აპლიკაციებში, დანამატების განყოფილებაში FR-ის ინსტალაციის შემდეგ.


მენიუ აღიარებული FineReader დოკუმენტის ექსპორტისთვის
ენების შერჩევა სკანირებისთვის და დოკუმენტების ამოცნობისთვის

Microsoft Office-ის გარდა, FR მხარს უჭერს Microsoft Outlook-თან ინტეგრაციას და ახორციელებს ამოცნობის შედეგებს Microsoft Word-ში, Excel-ში, Lotus Word Pro-ში, Corel WordPerect-სა და Adobe Acrobat-ში. ეს ფუნქციები გარკვეულწილად აადვილებს და აჩქარებს პროგრამასთან მუშაობას, განსაკუთრებით იმ შემთხვევაში, თუ რეგულარულად გიწევთ მასთან მუშაობა.

PDF ან სურათები Microsoft Word-ში:ამოიცნოს მონაცემები PDF-დან ან სხვა ტიპის გრაფიკული ფაილიდან, რომელიც მხარდაჭერილია Finereader 12-ის ვერსიით. უნდა აღინიშნოს, რომ PDF ფაილიდან ტექსტის FR-ში ამოღების ტექნოლოგია არ არის მხოლოდ ტექსტის შინაარსის „გამორთვა“ (ტექსტის ფენა PDF-ში შეიძლება არ იყოს) გრაფიკულიდან. სინამდვილეში, ამოცნობის ტექნოლოგია საკმაოდ რთულია: დოკუმენტის შინაარსის გაანალიზების შემდეგ, პროგრამა წყვეტს რა და როგორ გააკეთოს ტექსტთან: უბრალოდ ამონაწერი ან ამოცნობა და ასე შემდეგ თითოეული ტექსტის ფრაგმენტისთვის.

სკანირება Microsoft Excel-ში:სკანირება XLS-ზე (Microsoft Excel ფორმატი) შეიძლება გამართლებული იყოს, თუ დასკანირებული სურათი შეიცავს ცხრილებს.

სკანირება PDF-ზე: PDF-ზე სკანირების მრავალი მიზეზი არსებობს. ერთ-ერთი მათგანია უსაფრთხოება: ეს არის FR-სთვის ნაცნობი ერთადერთი ფორმატი, რომლის პარამეტრებშიც შეგიძლიათ პაროლის დაბლოკვის დაყენება. პაროლი დაყენებულია არა მხოლოდ დოკუმენტის გასახსნელად, არამედ მისი დაბეჭდვისა და სხვა ოპერაციებისთვის. შესაძლებელია აირჩიოთ დაშიფვრის სამი დონედან ერთი: 40-ბიტიანი, 128-ბიტიანი RC4 სტანდარტის საფუძველზე, 128-ბიტიანი დონე AES (Advanced Encryption Standard) სტანდარტის საფუძველზე.

გადაიყვანეთ ფოტო Microsoft Word-ში:ფაილის გარდაქმნა გრაფიკული ფორმატიდან (და ეს შეიძლება იყოს PDF ან მრავალგვერდიანი სურათი) DOC / DOCX-ად.

გახსენით Fine Reader-ში:გახსენით გრაფიკული ფაილი (PDF, BMP, PCX, DCX, JPEG, JPEG 2000, TIFF, PNG) FineReader-ის ამოცნობისთვის.

FineReader-ში მუშაობა

ახლა - მოკლედ პროგრამის მახასიათებლების შესახებ. მთელი პროცესი დაყოფილია სკანირებაზე, ამოცნობაზე და შედეგების შენახვაზე. მას შემდეგ, რაც აირჩევთ პროგრამის მოქმედების ტიპს, მიუთითეთ ფაილი ან მოწყობილობა სკანირებისთვის, FineReader ასრულებს თავის დავალებას ეტაპობრივად, რაც, სხვათა შორის, საკმაოდ რესურსზეა დამოკიდებული ცენტრალური პროცესორისთვის.

თუ თქვენ ხართ ორბირთვიანი პროცესორის იღბლიანი მფლობელი, მაშინ Fine Reader 12 პაკეტში მუშაობით შეგიძლიათ შეაფასოთ თქვენი კომპიუტერის მუშაობის ძალა. ფაქტია, რომ FR, რომელმაც აღმოაჩინა ორბირთვიანი პროცესორი, პარალელურად ცნობს დოკუმენტის არა ერთ, არამედ ორ გვერდს. ეს პატარა რამეა, მაგრამ სასიამოვნოა.

ჯერ მოდის სკანირება, შემდეგ დროებითი დოკუმენტის ამოცნობა და ექსპორტი არჩეულ ფორმატში.


PDF დოკუმენტის ამოცნობის პროცესი

სკანირება.სკანირებამდე არ არის საჭირო რაიმე წინასწარი პარამეტრების გაკეთება FineReader აპლიკაციაში (გარდა საკითხავი მოწყობილობის არჩევისა). სწორედ ამიტომ გამოიგონეს სკრიპტები: ისინი შექმნილია მსგავსი მოქმედებების შესრულების გასამარტივებლად.

აღიარება.გამარტივებამ სხვა წვრილმანებზეც იმოქმედა. ასე რომ, თუ გავიხსენებთ პროგრამის წინა ვერსიებს, მანამდე მოგვიწია დოკუმენტის ენის (ენების, თუ რამდენიმე იყო) ხელით შეცვლა. ახლა ეს ხდება ავტომატურად, თუმცა არა ყოველთვის. ამ უკანასკნელ შემთხვევაში, FR შეუმჩნევლად გვთავაზობს დოკუმენტის ენის შემოწმებას.

დავუბრუნდეთ FR ამოცნობის ტექნოლოგიას: რატომ სკანირებს პროგრამა პირველ რიგში მთელ დოკუმენტს მთლიანობაში და არა გვერდი-გვერდ? როგორც უკვე აღვნიშნეთ, ტექსტის ამოცნობა ხდება მთლიანი შინაარსის მიხედვით: არჩეულია მსგავსი ზომის/ტიპის შრიფტები, ცხრილები და საზღვრები, აბზაცები და ა.შ.

არ გაგიკვირდეთ, თუ FineReader 12 აჩვენებს შეტყობინებას, რომელშიც ნათქვამია, რომ გვერდის ამოცნობა შეუძლებელია, რადგან ტექსტის არ არის ნაპოვნი. ექსპერიმენტის გულისთვის, ჩვენ გადავიღეთ ტექსტური დოკუმენტის ფართობი მობილური ტელეფონის გამოყენებით LCD დისპლეის ეკრანიდან (თუმცა, შედეგი უკვე წინასწარ ვიცოდით). Fine Reader 12 არ ცნობდა სურათის ტექსტს, რადგან ის აშკარად იყო ხარისხის, რომელიც აშკარად არ იყო საკმარისი ამისათვის. მეორე ვიზიტისას ციფრული კამერით გადავიღეთ გვერდი ტექსტით ნორმალურ განათებაში.

FineReader-მა ამოიცნო პასაჟი უპრობლემოდ, შეინარჩუნა ფორმატირება და მარკერებით გამოკვეთა საეჭვო მომენტები ან სიმბოლოები, რომლებსაც შეიძლება ჰქონდეთ ცვლადი მართლწერა.

როგორც სურათზე ხედავთ, ეს არის ძირითადად წერტილები, დეფისები, მძიმეები - ზოგადად, პატარა სიმბოლოები. გარდა ამისა, აშკარად ჩანს, რომ პროგრამამ გაითვალისწინა გადაღებული გვერდის უთანასწორობა და გამრუდება და გაასწორა ტექსტის ხაზები. დასკვნა - FR-მ შესანიშნავად შეასრულა თავისი, თუმცა არც თუ ისე რთული ამოცანა.

ხანდახან, ზოგიერთი უმნიშვნელო პრობლემა შეიძლება შეუმჩნეველი დარჩეს Fine Reader პროგრამისთვის, მაგრამ მათი ხელით მარტივად გამოსწორება შესაძლებელია. საბედნიეროდ, პაკეტს აქვს საკუთარი WYSIWYG რედაქტორი, რომლის შესაძლებლობები საკმაოდ საკმარისია დოკუმენტის საბოლოო რედაქტირებისთვის. ასევე შესაძლებელია მართლწერის შემოწმება.

როგორ გავაუმჯობესოთ ამოცნობის სიზუსტე ისე, რომ ნაკლები დრო დავხარჯოთ ტექსტის რედაქტირებაზე? პირველ რიგში, შეგიძლიათ დააკავშიროთ პერსონალური Microsoft Word ლექსიკონი. მართალია, ძნელია ვიმსჯელოთ სიზუსტის ზრდაზე, გარდა, შესაძლოა, მართლწერის შემმოწმებლის ლექსიკის (მოდული, რომელიც ამოწმებს მართლწერასა და გრამატიკას). სხვა საკითხებთან ერთად, ამოცნობის გასაუმჯობესებლად, აზრი აქვს გაეცნოთ პროგრამის პარამეტრებს (ინსტრუმენტები -> ოფციები) და აირჩიოთ ორი რეჟიმიდან ერთი:

ფრთხილად აღიარება- მისი არჩევა შესაძლებელია ნებისმიერი „სირთულის“ დოკუმენტების ამოცნობისას: ცხრილებით ბადის ხაზების გარეშე, ტექსტით, გრაფიკებით, ცხრილებით ფერად ფონზე და ა.შ. ასევე შეიძლება დაეხმაროს დაბალი ხარისხის ამოცნობის წყაროს

სწრაფი ამოცნობა- ეს რეჟიმი რეკომენდირებულია მარტივი დიზაინის მქონე დოკუმენტების დიდი მოცულობის დასამუშავებლად ან იმ შემთხვევებში, როდესაც დრო არ იძლევა საფუძვლიან ამოცნობას. უმეტეს შემთხვევაში, როდესაც თქვენ გაქვთ შავი დაბეჭდილი ტექსტი თეთრ ფონზე, შეგიძლიათ დაკმაყოფილდეთ სწრაფი ამოცნობით.

ზოგადად, FineReader-ის მუშაობის ხარისხის გაუმჯობესება სასაუბრო ცალკე თემაა, რომლის დეტალები შეგიძლიათ გაიგოთ ოფიციალური დახმარებისგან, კერძოდ, განყოფილებაში „როგორ გავაუმჯობესოთ მიღებული შედეგები“.

დოკუმენტის შენახვა. Fine Reader 12 პროგრამაში მუშაობის ბოლო ეტაპი არის საბოლოო შედეგის შენახვა კონკრეტულ გრაფიკულ/ტექსტურ ფორმატში. წინასწარი შენახვის პარამეტრები შეიძლება მითითებული იყოს FR ოფციებში: ინსტრუმენტები -> ოფციები, "შენახვა" ჩანართში. თითოეულ ფორმატს აქვს საკუთარი პარამეტრები. DOCX ფორმატში შენახვისას, ფრთხილად უნდა იყოთ ფორმატის თავსებადობასთან დაკავშირებით (DOCX ფაილები არ არის აღიარებული Word 2003-ში<). В txt-файлах не забудьте проверить правильность кодировки (особенно в случае с текстом в кириллице).

ABBYY ეკრანის მკითხველი

ბევრ დიდ პაკეტში, დეველოპერებს ხშირად მოსწონთ მცირე სერვისის კომუნალური საშუალებების დამატება. ვთქვათ, რომ ცნობილი დისკის ჩაწერის აპლიკაცია Nero მოიცავს 3 - 5 კომუნალური პროგრამის კომპლექტს, რომელიც საშუალებას გაძლევთ გააკეთოთ ის, რაც თავად ნერონსაც კი არ შეუძლია. მიმოხილვა (ასევე შეგიძლიათ ჩამოტვირთოთ აქ, როგორც Fine Reader 12-ის ნაწილი).

რაც შეეხება FineReader-ს, ის შეიცავს ერთ პატარა აპლიკაციას, Screenshot Reader. მასთან ერთად შეგიძლიათ გადაიღოთ სკრინშოტი და სწრაფად გადაიყვანოთ იგი სასურველ ფორმატში FR-ის გამოყენებით. პროგრამა ხელმისაწვდომია დაწყების მენიუდან (დაწყება -> ყველა პროგრამა -> ABBYY FineReader 12.0 -> ABBYY ეკრანის წამკითხველი.).

Screenshot Reader-ის შესაძლებლობები უფრო ფართოა, ვიდრე ერთი შეხედვით ჩანს. (თორემ ამის გაკეთება შეგიძლიათ კლავიატურაზე „PrintScreen“ ღილაკის უბრალოდ დაჭერით). ეკრანის სკრინშოტის (ან უფრო ზუსტად, ეკრანის არჩეული უბნის) გადაღების გარდა, Screenshot Reader მჭიდროდ არის ინტეგრირებული FR-თან.

როდესაც დააჭირეთ ღილაკს „Snapshot“ Screenshot Reader პანელზე, კურსორი იცვლის ფორმას და გააქტიურებულია ეკრანის არეალის შერჩევის ინსტრუმენტი. სურათის არჩეული არე ჩარჩოშია ჩასმული ტექსტის შემდგომი ამოცნობისთვის (ის ავტომატურად მუშაობს).

ჩამოსაშლელ სიაში შეგიძლიათ აირჩიოთ სასურველი მოქმედება: ფაქტობრივად, Screenshot Reader აკოპირებს სწრაფ FR სკრიპტებს იმ განსხვავებით, რომ სკანერიდან სკრინშოტის ნაცვლად, ეკრანის ანაბეჭდი მიიღება შეყვანის სახით.

აღსანიშნავია, რომ პროგრამა მთელ პაკეტთან ერთად საჭიროებს გააქტიურებას. პროდუქტის რეგისტრაციისას, ABBYY FineReader 12 Professional Edition Screenshot Reader უფასოა, როგორც „ბონუსი“.

დასკვნა

FineReader არის შეუცვლელი პროგრამა გრაფიკული მონაცემების სკანირებისა და ამოცნობისთვის. რუსულენოვანი ინტერფეისი და პარამეტრების ხელმისაწვდომობა არ შეაშინებს გამოუცდელ მომხმარებელს. უახლესი ფორმატების მხარდაჭერა, ინოვაციური ტექნოლოგიები და, შედეგად, მაღალი ხარისხის აღიარება ხდის პროგრამას ოპტიმალურ არჩევანს, მით უმეტეს, რომ ABBYY FineReader-ს ჯერ კიდევ არ ჰყავს კონკურენტები ამ სფეროში.

FineReader 12 ცხელი კლავიშები

  • შექმენით ახალი ABBYY FineReader დოკუმენტი- CTRL + N
  • გახსენით ABBYY FineReader დოკუმენტი 12 - CTRL +SHIFT+N
  • გვერდების შენახვა- CTRL +S
  • შეინახეთ სურათი ფაილში- CTRL + ALT + S
  • დოკუმენტის ყველა გვერდის ამოცნობა- CTRL + SHIFT + R
  • მიმდინარე გვერდის დახურვა- CTRL + F4
  • ABBYY FineReader დოკუმენტის არჩეული გვერდების ამოცნობა- CTRL + R
  • გახსენით სცენარის მენეჯერი- CTRL + T
  • გახსენით Fine Reader Options დიალოგი- CTRL + SHIFT + O
  • გახსენით დახმარება- F1
  • გადადით დოკუმენტის ფანჯარაში- ALT +1
  • გადადით გამოსახულების ფანჯარაში- ALT +2
  • გადადით ტექსტის ფანჯარაში- ALT +3
  • გადადით ფანჯრის ახლო ხედზე- ALT +4

ასე რომ, ჩვენ გვაქვს FineReader დაინსტალირებული ჩვენს კომპიუტერზე. ჩართავთ სკანერს და რამდენიმე გვერდიან დოკუმენტს ციფრულად ვაქცევთ. დავარქვათ, პირობითად, „შეთანხმება“.

მოათავსეთ დოკუმენტის პირველი გვერდი სკანერის მინაზე და დახურეთ სახურავი. გაუშვით FineReader პროგრამა. დააჭირეთ ღილაკს "სკანირება" ან დააჭირეთ "Ctrl+K" კომბინაციას. იხსნება "ABBYY FineReader Scanning" ფანჯარა. 11-12 პუნქტიანი შრიფტით აკრეფილი ჩვეულებრივი ტექსტის გვერდის ციფრულიზაციისას, დატოვეთ ნაგულისხმევი პარამეტრები ფანჯარაში და დააჭირეთ ღილაკს „ნახვა“.

სკანერი მუშაობს და რამდენიმე წამის შემდეგ ჩვენ ვხედავთ ჩვენს გვერდს სანახავ ფანჯარაში. აქ ჩვენ შეგვიძლია შევცვალოთ სკანირების ზომა საჭიროების შემთხვევაში. და შემდეგ დააჭირეთ ღილაკს "სკანირება".

FineReader იწყებს ტექსტის ამოცნობის პროცესს და ერთ წუთში პროგრამის ფანჯარაში იხსნება გვერდის სურათი. ფანჯრის მარჯვენა მხარე ახლა სამ ნაწილად იყოფა. მარცხენა განყოფილებაში "სურათი" შეგვიძლია სურათის რედაქტირება. სურათის რედაქტირების შესახებ მეტი შეგიძლიათ წაიკითხოთ გაკვეთილზე: წიგნის სკანირება. მარჯვენა განყოფილებაში "ტექსტი" შეგიძლიათ დაუყოვნებლივ შეიტანოთ ცვლილებები ტექსტში - შეცვალოთ გვერდის შინაარსი მის შენახვამდეც კი. ეს ძალიან მოსახერხებელია, როდესაც გჭირდებათ, მაგალითად, სწრაფად შეცვალოთ თარიღები, დეტალები და გვარები დოკუმენტში.

აღიარებული გვერდის ხატი გამოჩნდება "გვერდების" ფანჯრის მარცხენა ნაწილში:

თუ არაფრის რედაქტირება არ გჭირდებათ, შეცვალეთ სკანერის შუშის პირველი გვერდი მეორე გვერდით და გაიმეორეთ ტექნოლოგია. ერთხელ დაარეგულირეთ სკანირების ზომები "ABBYY FineReader Scanning" ფანჯარაში "Preview" რეჟიმში პირველი გვერდისთვის, ახლა დაუყოვნებლივ დააჭირეთ ღილაკს "Scan". პირველი გვერდის პარამეტრები შენახულია და შემდგომი გვერდები სკანირებულია წინასწარი გადახედვის გარეშე. ასე რომ, ჩვენ ვამოწმებთ ჩვენი დოკუმენტის ყველა გვერდს.

ჩვენ დავასრულეთ და ახლა, ხატებზე სათითაოდ დაწკაპუნებით, ვხსნით გვერდებს, ვამოწმებთ მათ სწორ თანმიმდევრობას.

ამის შემდეგ, "გვერდების" ფანჯრის მარცხენა ნაწილში აირჩიეთ ყველა ხატულა ღილაკით: "რედაქტირება - აირჩიეთ ყველა" ან კლავიატურის მალსახმობი: "Ctrl + A". შემდეგ ჩამოსაშლელ სიაში "შენახვა" ღილაკის გვერდით აირჩიეთ ბრძანება: "შენახვა როგორც PDF დოკუმენტი":


ახლა დააჭირეთ ღილაკს თავად და შეინახეთ დოკუმენტი სახელწოდებით "Agreement.pdf" "Agreement" საქაღალდეში:


შედეგად, ჩვენ ვიღებთ მრავალგვერდიან ტექსტურ დოკუმენტს pdf ფორმატში - ჩვენი დოკუმენტის ელექტრონული ვერსია კოდის სახელწოდებით "შეთანხმება".

ასე რომ, ჩვენ ვაციფრებთ ტექსტურ დოკუმენტებს FineReader-ის გამოყენებით.

„ABBYY FineReader Scanning“ ფანჯარაში სკანირების რეჟიმის „ფერზე“ შეცვლით, ჩვენ ასევე შეგვიძლია ადვილად გავაციფროთ ფერადი სურათები და ფოტოები.

და კონტექსტური მენიუში, მაგალითად, ბრძანების დაყენებით: „შენახვა როგორც Microsoft Word 2007 დოკუმენტი“, ჩვენ ჩვენს პროექტს გარდაქმნით ერთ მრავალგვერდიან რედაქტირებად Word დოკუმენტად.

ზოგადად, პროგრამა ადვილად გასაგები, ინტუიციურია და ყველგან აქვს pop-up რჩევები.

ამჯერად გეტყვით, თუ როგორ უნდა გადააქციოთ ქაღალდის დოკუმენტები ელექტრონულ PDF ფორმატში, ასევე როგორ გადავიტანოთ ქაღალდის დოკუმენტი კომპიუტერში ტექსტის შესაცვლელად. ასე რომ, დავიწყოთ.
ხელში ქაღალდის საბუთი მაქვს.

სკანირება PDF-ზე

დავალება: გადაიტანეთ ეს დოკუმენტი კომპიუტერში (გადათარგმნეთ ელექტრონულ ფორმაში). უფრო მეტიც, ეს უნდა გაკეთდეს ზუსტად ამ ფორმით, რათა მომავალში არ შეიცვალოს (უხეშად რომ ვთქვათ, თქვენ უნდა გადაიღოთ დოკუმენტი). შემდეგ ეს ელექტრონული დოკუმენტი უნდა გაიგზავნოს ფოსტით ელექტრონული ფოსტის მისამართზე. უფრო მეტიც, კლიენტი ითხოვს მას pdf ფორმატში.

ეტაპების მიხედვით:
1) დოკუმენტს ვაბარებ სკანერის საშუალებით
2) მიღებულ ბეჭდვას pdf ფორმატში ვინახავ ჩემს კომპიუტერში
3) მიღებულ ფაილს ვაგზავნი ფოსტით
ჩემს საქმიანობაში ამ პრობლემის გადასაჭრელად ვიყენებ 2 პროგრამას:
Foxit Phantom ან ABBYY FineReader. სიცხადისთვის, მე ვამაგრებ ეკრანის სურათებს:
Foxit Phantom-ში, როდესაც სკანერი ჩართულია, მთავარ მენიუში უნდა აირჩიოთ FILE-CREATE PDF FROM SCANNER...
მოხდება სკანირება და მოგეთხოვებათ ფაილის შენახვა. აირჩიეთ ადგილმდებარეობა, ჩაწერეთ ფაილის სახელი და შეინახეთ.

ABBYY FineReader-ს აქვს უზარმაზარი ღილაკები ხელსაწყოთა ზოლში. ერთ-ერთ მათგანს ჰქვია SCAN to PDF. ჩვენ ვიყენებთ მას.

თუ გჭირდებათ მრავალგვერდიანი დოკუმენტის სკანირება, მაშინ ეტაპობრივად:
1) დააჭირეთ ღილაკს ნომერი 1 SCAN

ჩვენ ვიღებთ დასკანირებულ დოკუმენტს

ჩვენ ასევე ვამოწმებთ სხვა გვერდს (ხელახლა დააჭირეთ ღილაკს ნომერი 1 SCAN).
2) შეინახეთ როგორც PDF



შედეგად, ჩვენ ვიღებთ დასრულებულ მრავალგვერდიან დოკუმენტს PDF ფაილის სახით.

ახლა ეს ფაილი შეიძლება გაიგზავნოს ელექტრონული ფოსტით.

ტექსტის ამოცნობა

დავალება: გადაიყვანეთ ქაღალდის დოკუმენტი ელექტრონულ ფორმაში (კომპიუტერში)

ეტაპების მიხედვით:
1) სკანირება (ღილაკი 1 SCAN)

2) ამოცნობა (ღილაკი 2 ყველას ამოცნობა)

ამოცნობა უნდა გავიგოთ, როგორც ფოტოს (სურათის) ტექსტად (ასო, რიცხვი, ნიშნები) თარგმნის პროცესი. თუ თქვენ გადაიღეთ ტექსტის გვერდი, მაშინ ტექსტის 99% ქაღალდიდან ამოცნობის შემდეგ ის გადაიქცევა ელექტრონულ ტექსტად. ელექტრონული ტექსტის შეცვლა (რედაქტირება) უკვე შესაძლებელია კომპიუტერზე ისე, როგორც გსურთ.

3) ტექსტის რედაქტორში შენახვა (ღილაკი 4 შენახვა)
გირჩევთ აირჩიოთ TRANSFER ALL PAGE TO MICROSOFT WORD-ზე

ვიღებთ

მინდა აღვნიშნო მნიშვნელოვანი პუნქტები აღიარების პროცედურის დროს. მუშაობისას არის ნიუანსი.
აღიარებისთანავე გირჩევთ შეხედოთ შედეგს. განსაკუთრებით იმ ბლოკებზე, რომლებსაც FineReader პროგრამა ქმნის.

ეს არის ადგილები, რომლებიც ხაზგასმულია მართკუთხა ჩარჩოებში. ეს ჩარჩოები სხვადასხვა ფერისაა. თუ ის წითელია, მაშინ ეს ბლოკი აღიარებულია როგორც PICTURE. თუ შავია, მაშინ TEXT. ბლოკები სხვადასხვა ტიპისაა. ბლოკის ტიპი შეგიძლიათ იხილოთ ბლოკზე დაწკაპუნებით მაუსის მარჯვენა ღილაკით და აირჩიეთ CHANGE BLOCK TYPE.

პატარა ხრიკი: შეგიძლიათ აირჩიოთ თვითნებური ტერიტორია და დაასახელოთ მას ნებისმიერი ტიპის ბლოკი. მაგალითად, ავირჩიოთ ტექსტის ის ნაწილი, რომელიც ცუდად არის ამოცნობილი მაუსის მარცხენა ღილაკის გამოყენებით (დააწკაპუნეთ, გააჩერეთ და გადაიტანეთ, ჩარჩო იცვლის ზომას).

შედეგად, დოკუმენტს Word-ში ექნება ტექსტის ბლოკი და სურათების ბლოკი. ბლოკის სურათს ექნება აბსოლუტურად უცვლელი გარეგნობა. მე ვიყენებ ამ მეთოდს მარკების, არასტანდარტული შრიფტების, სურათების და ფოტოების შენახვისას.

PS: PDF-თან მუშაობის, დოკუმენტების სკანირებისა და ამოცნობის ცოდნა და უნარი ძალიან ხშირად ეხმარება საოფისე მუშაობაში. ცოდნა დაზოგავს თქვენს დროს!

მიუხედავად იმისა, რომ ბოლო 50 წლის განმავლობაში ხელოვნური ინტელექტის (AI) მიღწევებმა ჭკვიან მანქანებს ერთი იოტით არ დააახლოვა ადამიანის შემეცნებითი შესაძლებლობები, ამ მიმართულებით მიღწევების სრულად უარყოფა უსამართლო იქნებოდა. ყველაზე აშკარა და თვალსაჩინო მაგალითია ჭადრაკი (უფრო მარტივი თამაშები რომ აღარაფერი ვთქვათ). კომპიუტერს ჯერ კიდევ არ შეუძლია ჩვენი აზროვნების იმიტაცია, მაგრამ მას შეუძლია ამ ხარვეზის კომპენსირება დიდი რაოდენობით სპეციალიზებული მეხსიერებით და ძიების სიჩქარით. ვლადიმირ კრამნიკმა აღწერა Deep Fritz პროგრამის თამაში, რომელმაც დაამარცხა იგი 2006 წელს, როგორც "არაადამიანური", იმ გაგებით, რომ ხშირად ეწინააღმდეგებოდა სტრატეგიისა და ტაქტიკის დადგენილ (ადამიანურ) წესებს.

და სულ რაღაც ერთ წელზე მეტი ხნის წინ, IBM-ის კიდევ ერთმა იდეამ, რომელმაც ერთ დროს საფუძველი ჩაუყარა კომპიუტერების ტრიუმფალურ საჭადრაკო გამარჯვებებს (ცნობილი Deep Blue), სახელწოდებით Watson, მოახდინა ახალი გარღვევა, დაამარცხა პოპულარული ამერიკული ვიქტორინა Jeopardy-ის ორი ჩემპიონი. დიდი სხვაობით. თუმცა მნიშვნელოვანია, რომ მიუხედავად იმისა, რომ უოტსონმა დამოუკიდებლად გააჟღერა პასუხები, კითხვები მას ტექსტის სახით მაინც გადასცემდა. ეს იმაზე მეტყველებს, რომ წარმატებები ხელოვნური ინტელექტის აპლიკაციის ბევრ სფეროში - მეტყველებისა და გამოსახულების ამოცნობა, მანქანური თარგმანი - საკმაოდ მოკრძალებულია, თუმცა ეს ხელს არ გვიშლის დღეს მათი პრაქტიკაში გამოყენებაში. ყველაზე დიდ წარმატებებს, ალბათ, ასახავს ოპტიკური სიმბოლოების ამოცნობის სისტემები (OCR, Optical Character Recognition), რომელსაც კომპიუტერის თითქმის ყველა მომხმარებელი ასე თუ ისე იცნობს. უფრო მეტიც, რუსული განვითარება ამ სფეროში ღირსეულ ადგილს იკავებს მსოფლიოში - ვგულისხმობ ABBYY FineReader-ს.

ცოტა ისტორია

ABBYY FineReader-ის ამჟამინდელი ვერსია არის 11 ნომერი, ანუ აპლიკაციამ საკმაოდ გრძელი განვითარების გზა გაიარა და ამ პროცესის ისტორიაც კი გარკვეულ ინტერესს იწვევს. ამომწურავი ქრონიკის მოჩვენების გარეშე, მე მივცემ მხოლოდ მთავარ ეტაპებს ბოლო ათწლეულის განმავლობაში, რომლის დროსაც მეტ-ნაკლებად მივყვებოდი FineReader-ს:

წელიწადივერსიაძირითადი მახასიათებლები
2003 7.0 ამოცნობის სიზუსტის გაზრდა 25%-მდე. ეს ყველაზე მეტად აისახა ცხრილებში, განსაკუთრებით რთულ ცხრილებში, ფერადი უჯრედებით, ფარული გამყოფებით და ა.შ.
2005 8.0 ამოცნობის ალგორითმების შემდგომი ოპტიმიზაცია, უპირველეს ყოვლისა, მიზნად ისახავს მუშაობას არა სკანირებულ დოკუმენტებთან, არამედ ციფრულ ფოტოებთან. ამ მიზნით, გამოჩნდა ორიგინალების მომზადების დამატებითი ფუნქციები (დამახინჯების აღმოფხვრა, ხაზების გასწორება და ა.შ.).
2007 9.0 ADRT ტექნოლოგიის გაჩენა, რომელიც ითვალისწინებს მთელი დამუშავებული (მრავალგვერდიანი) დოკუმენტის ლოგიკურ სტრუქტურას და შეუძლია გამოყოს განმეორებადი ელემენტები (სათაურები და ქვედა კოლონტიტულები), დააკავშიროს „მიმდინარე“ ობიექტები (ცხრილები) და ა.შ.
2009 10.0 ADRT და ამოცნობის ალგორითმების შემდგომი გაუმჯობესება, დაბალი გარჩევადობის ორიგინალების დამუშავების სიზუსტის გაზრდა 30%-მდე.
2011 11.0 მთავარი ყურადღება ეთმობა პროგრამის სიჩქარეს. შავ-თეთრი რეჟიმის „მეორადი მოსვლა“, რომელიც კარგი ხარისხის ორიგინალებზე იძლევა დამატებით აჩქარებას 30%-მდე.

ბუნებრივია, ამავე დროს, FineReader-მა გააფართოვა დოკუმენტის ფორმატების მხარდაჭერა, გაუმჯობესებული ჩაშენებული ინსტრუმენტები და ინტერფეისი, გაუმჯობესდა ორიგინალების სტრუქტურის რეკონსტრუქცია და ა.შ. დამახასიათებელია რთული ცოდნის ინტენსიური სისტემებისთვის, როდესაც შემდეგი „გარღვევის“ შემდეგ მოჰყვება „მშვიდობის“ გარკვეული პერიოდი, რომელიც აუცილებელია ახალი ალგორითმების გასაუმჯობესებლად. ისინი წარმოადგენენ ნებისმიერი OCR პროგრამის მთავარ მნიშვნელობას და, შესაბამისად, მათ შესახებ ნებისმიერი დეტალური ინფორმაცია იშვიათად აღწევს მომხმარებლებს. თუმცა, ABBYY გულწრფელად დათანხმდა საიდუმლოების ფარდის მოხსნას და დღეს ჩვენ გვაქვს შესაძლებლობა შევხედოთ FineReader-ის სიწმინდეებს.

ძირითადი პრინციპები

ასე რომ, რადგან OCR ეკუთვნის AI-ს სფეროს, ლოგიკურია, რომ დეველოპერები ცდილობენ გარკვეულწილად მაინც მიბაძონ ჩვენი ტვინის აქტივობას. რა თქმა უნდა, ჩვენი ვიზუალური სისტემის სტრუქტურა წარმოუდგენლად რთულია, მაგრამ მისი ფუნქციონირების ძირითადი „დიდი ბლოკის“ პრინციპები საკმარისად არის შესწავლილი, როგორც წესი, სამი მათგანია:

  1. მთლიანობა- ობიექტი განიხილება, როგორც მისი ნაწილების ერთობლიობა და (ვიზუალური გამოსახულებისთვის) მათ შორის სივრცითი ურთიერთობები. თავის მხრივ, ნაწილები იღებენ ინტერპრეტაციას მხოლოდ როგორც მთელი ობიექტის ნაწილი. ეს პრინციპი გეხმარებათ ჰიპოთეზების აგებასა და გარკვევაში, სწრაფად აღმოფხვრის ნაკლებად სავარაუდოებს.
  2. მიზანდასახულობა- ვინაიდან მონაცემთა ნებისმიერი ინტერპრეტაცია კონკრეტულ მიზანს ატარებს, ამოცნობა არის ობიექტის შესახებ ჰიპოთეზების წამოყენებისა და მათი მიზანმიმართული ტესტირების პროცესი. ამ პრინციპის შესაბამისად მოქმედი სისტემა არა მხოლოდ გამოიყენებს გამოთვლით ძალას უფრო ეკონომიურად, არამედ დაუშვებს ნაკლებ შეცდომებს.
  3. ადაპტაცია- სისტემა ინახავს ოპერაციის დროს დაგროვილ ინფორმაციას და ხელახლა იყენებს, ანუ თავად სწავლობს. ეს პრინციპი საშუალებას გაძლევთ შექმნათ და დააგროვოთ ახალი ცოდნა და თავიდან აიცილოთ იგივე პრობლემების განმეორებითი გადაჭრა.

FineReader არის ერთადერთი OCR სისტემა მსოფლიოში, რომელიც მუშაობს ზემოთ აღწერილი პრინციპების შესაბამისად დოკუმენტების დამუშავების ყველა ეტაპზე. შესაბამისი ტექნოლოგია ე.წ IPA- ინგლისური ტერმინების პირველი ასოების მიხედვით. მაგალითად, მთლიანობის პრინციპის მიხედვით, გამოსახულების ფრაგმენტი განიმარტება, როგორც სიმბოლო მხოლოდ იმ შემთხვევაში, თუ ის შეიცავს მსგავსი ობიექტების ყველა სტრუქტურულ ნაწილს და მათ, რომლებიც გარკვეულ ურთიერთობებშია. ეს ხელს უწყობს დიდი რაოდენობით სტანდარტების ძიებას (მეტ-ნაკლებად შესაფერისის ძიებაში) გონივრული რაოდენობის ჰიპოთეზების მიზნობრივი ტესტით, რომელიც ეყრდნობა ადრე დაგროვილ ინფორმაციას აღიარებულ დოკუმენტში პერსონაჟის შესაძლო მონახაზების შესახებ. .

თუმცა, IPA პრინციპები გამოიყენება არა მხოლოდ ცალკეული სიმბოლოების (სავარაუდოდ) შესაბამისი ფრაგმენტების გაანალიზებისას, არამედ გვერდის მთელი წყაროს გამოსახულების გაანალიზებისას. OCR სისტემების უმეტესობა დაფუძნებულია დოკუმენტის იერარქიული სტრუქტურის ამოცნობაზე, ანუ გვერდი იყოფა ძირითად სტრუქტურულ ელემენტებად, როგორიცაა ცხრილები, სურათები, ტექსტის ბლოკები, რომლებიც, თავის მხრივ, იყოფა სხვა დამახასიათებელ ობიექტებად - უჯრედები, აბზაცები და ასე შემდეგ, ცალკეულ პერსონაჟებამდე.

ასეთი ანალიზი შეიძლება განხორციელდეს ორი ძირითადი გზით: ზემოდან ქვევით, ანუ შემადგენელი ელემენტებიდან ცალკეულ სიმბოლოებამდე, ან, პირიქით, ქვემოდან ზევით. ერთ-ერთი მათგანი ყველაზე ხშირად გამოიყენება, მაგრამ ABBYY-მ შეიმუშავა სპეციალური ალგორითმი MDA(მრავალდონიანი დოკუმენტის ანალიზი), რომელიც აერთიანებს ორივეს. მოკლედ, ასე გამოიყურება: გვერდის სტრუქტურა გაანალიზებულია ზემოდან ქვევით მეთოდის გამოყენებით, ხოლო ამოცნობის დასრულების შემდეგ ელექტრონული დოკუმენტის რეკონსტრუქცია ხდება ქვემოდან ზემოდან, თუმცა, ყველა დონეზე არსებობს დამატებითი უკუკავშირის მექანიზმი. შედეგად, მკვეთრად მცირდება მაღალი დონის ობიექტების არასწორ ამოცნობასთან დაკავშირებული უხეში შეცდომების ალბათობა.

ADRT

ისტორიულად, OCR სისტემები განვითარდა ინდივიდუალური პერსონაჟების ამოცნობით. ეს ამოცანა ჯერ კიდევ ყველაზე მნიშვნელოვანი და რთულია მასთან დაკავშირებული ყველაზე რთული ალგორითმები. თუმცა, მალე გაირკვა, რომ უფრო მაღალი დონის ინფორმაცია (მაგალითად, დოკუმენტის ენისა და აღიარებული სიტყვების სწორი მართლწერის შესახებ) შეიძლება დაეხმაროს ამ პრობლემის გადაჭრაში - ასე გამოჩნდა კონტექსტური და ლექსიკონის შემოწმება. შემდეგ, ფორმატის შენარჩუნებისა და დოკუმენტის ფიზიკური სტრუქტურის (ანუ სხვადასხვა ობიექტების შედარებითი პოზიციების) ხელახალი შექმნის სურვილმა გამოიწვია მთელი გვერდის დეტალური ანალიზის საჭიროება. ნათელია, რომ ეს ასევე მნიშვნელოვნად აისახება ამოცნობის საერთო ხარისხზე, რადგან ეს ხელს უწყობს მრავალსვეტიანი განლაგების, ცხრილების და ტექსტის „არაწრფივი“ მოწყობის სხვა მეთოდების სწორად დამუშავებას.

ყველაზე თანამედროვე OCR მოქმედებს ზუსტად ამ სამ დონეზე - სიმბოლოები, სიტყვები, გვერდები - პრაქტიკული, როგორც უკვე აღვნიშნეთ, ზემოდან ქვევით ან ქვემოდან ზევით მიდგომებით. თუმცა, ABBYY-მ, IPA-ს პრინციპების შესაბამისად, FineReader-ში შემოიტანა სხვა დონე - მთელი მრავალგვერდიანი დოკუმენტი. უპირველეს ყოვლისა, ეს იყო საჭირო ლოგიკური სტრუქტურის სწორად რეპროდუცირებისთვის, რომელიც სულ უფრო და უფრო რთული ხდება თანამედროვე დოკუმენტებში. მაგრამ არის დამატებითი ბონუსები: გაზრდილი სიზუსტე და განმეორებადი ობიექტების უფრო სწრაფი დამუშავება, უფრო სწორი იდენტიფიკაცია (და, შესაბამისად, ამოცნობა) ობიექტების "მოდინება" გვერდიდან გვერდზე.

სწორედ ამიტომ შეიქმნა იგი ADRT(Adaptive Document Recognition Technology) – დოკუმენტების ანალიზისა და სინთეზის ტექნოლოგია ლოგიკურ დონეზე. საბოლოო ჯამში, ის გეხმარებათ, რომ FineReader-ის შედეგი მაქსიმალურად დაემსგავსოს ორიგინალს. ამისათვის გაანალიზებულია მთელი დოკუმენტის გამოსახულება და აღიარებული სიტყვები გაერთიანებულია ჯგუფებად (კლასტერებად) დამოკიდებულია გვერდის სტილის, გარემოსა და მდებარეობის მიხედვით. ამ გზით, პროგრამა, როგორც ჩანს, ხედავს დოკუმენტის მარკირების „ლოგიკას“ და შეუძლია შემდგომში შედეგის დიზაინის გაერთიანება.

ADRT-ის წყალობით, FineReader-მა, დაწყებული 9.0 ვერსიით, ისწავლა შემდეგი სტრუქტურული ნაწილების და დოკუმენტის ფორმატირების ელემენტების აღმოჩენა, ამოცნობა და რეპროდუცირება:

  • ძირითადი ტექსტი;
  • ზედა და ქვედა კოლონტიტული;
  • გვერდის ნომრები;
  • იმავე დონის სათაურები;
  • სარჩევი;
  • ტექსტის ჩანართები;
  • წარწერები ნახატებისთვის;
  • მაგიდები;
  • სქოლიოები;
  • ხელმოწერის/ბეჭდის ზონები;
  • შრიფტები და სტილები.

აღიარების პროცესი

MDA ალგორითმის შესაბამისად, თავად ამოცნობა იწყება ზემოდან ქვემოდან, გვერდის დონიდან. გასაგებია, რომ რაც მეტი არასწორი გადაწყვეტილება მიიღება ამ პროცესის ადრეულ ეტაპებზე, მით მეტი იქნება შემდგომში. სწორედ ამიტომ ამოცნობის სიზუსტე დამოკიდებულია ორიგინალების ხარისხზე, მაგრამ მათი წინასწარი დამუშავების ალგორითმები ასევე შეიძლება იქონიონ მნიშვნელოვანი გავლენა. ამრიგად, როდესაც ფერადი დოკუმენტების პოპულარობა გაიზარდა FineReader-ში, გამოჩნდა ადაპტური ბინარიზაციის პროცედურა. AB). თუ დაუყონებლივ სკანირებთ დოკუმენტს შავ-თეთრ რეჟიმში, სადაც არის ჭვირნიშანი ან ტექსტი მდებარეობს ტექსტურირებული ან ფერადი სუბსტრატზე, მაშინ სურათზე უცვლელად გამოჩნდება „ნაგავი“, რომელიც შემდეგ საკმაოდ რთული იქნება „სასარგებლოსგან“ განცალკევება. ” სურათი (რადგან მის შესახებ ორიგინალური ინფორმაცია უკვე დაკარგულია). ამიტომ FineReader ურჩევნია მუშაობა ფერად ან ნაცრისფერ სურათებთან, დამოუკიდებლად გარდაქმნის მათ შავ-თეთრად (ამ პროცესს ბინარიზაცია ჰქვია). მაგრამ ეს ყველაფერი არ არის. ვინაიდან ტექსტისა და ფონის ფერები შეიძლება განსხვავდებოდეს გვერდზე და ცალკეულ ხაზებშიც კი, AB ამოიცნობს მეტ-ნაკლებად იგივე მახასიათებლების მქონე სიტყვებს და ირჩევს თითოეულისთვის ოპტიმალურ ბინარიზაციის პარამეტრებს ამოცნობის ხარისხის თვალსაზრისით. ეს არის ზუსტად ალგორითმის ადაპტაცია, რაც, შესაბამისად, MDA-ში უკუკავშირის გამოყენების მაგალითია. ნათელია, რომ AB-ის ეფექტურობა ძლიერ არის დამოკიდებული წყაროს დოკუმენტების დიზაინზე - ABBYY ტესტის ბაზაზე, ეს ალგორითმი უზრუნველყოფდა ამოცნობის სიზუსტის ზრდას 14,5%-ით.

მაგრამ ყველაზე საინტერესო, რა თქმა უნდა, იწყება მაშინ, როდესაც აღიარების პროცესი ყველაზე დაბალ დონეზე ეცემა. ეგრეთ წოდებული წრფივი დაყოფის პროცედურა ყოფს ხაზებს სიტყვებად და სიტყვებს ცალკეულ ასოებად; შემდეგ, IPA პრინციპის შესაბამისად, იგი აყალიბებს ჰიპოთეზების ერთობლიობას (ანუ შესაძლო ვარიანტები, თუ რა სახის სიმბოლოა ეს, რა სიმბოლოებზეა დაყოფილი სიტყვა და ა. სიმბოლოების ამოცნობის მექანიზმის შეყვანა. ეს უკანასკნელი შედგება რიგი ე.წ კლასიფიკატორები, რომელთაგან თითოეული ასევე წარმოქმნის უამრავ ჰიპოთეზას, რომლებიც დალაგებულია მათი მოსალოდნელი ალბათობის ხარისხით. ნებისმიერი კლასიფიკატორის ყველაზე მნიშვნელოვანი მახასიათებელია სწორი ჰიპოთეზის საშუალო პოზიცია. გასაგებია, რომ რაც უფრო მაღალია ის, მით ნაკლებია მუშაობა შემდგომი ალგორითმებისთვის - მაგალითად, ლექსიკონის შემოწმება. მაგრამ საკმარისად კარგად ჩამოყალიბებული კლასიფიკატორებისთვის ყველაზე ხშირად ფასდება ისეთი მახასიათებლები, როგორიცაა ამოცნობის სიზუსტე, რომელიც დაფუძნებულია პირველ სამ ჰიპოთეზაზე ან მხოლოდ პირველზე - ანუ, უხეშად რომ ვთქვათ, სწორი პასუხის გამოცნობის უნარი სამ ან ერთ მცდელობაში. ABBYY თავის სისტემებში იყენებს შემდეგი ტიპის კლასიფიკატორებს: რასტრული, მახასიათებელი, მახასიათებლების დიფერენციალი, კონტური, სტრუქტურული და სტრუქტურული დიფერენციალი - რომლებიც დაჯგუფებულია ორ ლოგიკურ დონეზე.

ოპერაციული პრინციპი RK, ან რასტრული კლასიფიკატორი, ეფუძნება პიქსელ-პიქსელ-პიქსელ შედარებას პერსონაჟის გამოსახულების სტანდარტებთან. ეს უკანასკნელი ყალიბდება სავარჯიშო კომპლექტიდან გამოსახულების საშუალო გაანგარიშების შედეგად და მცირდება გარკვეულ სტანდარტულ ფორმამდე; შესაბამისად, ზომა, ელემენტების სისქე და დახრილობა ასევე წინასწარ არის ნორმალიზებული ამოცნობილი სურათისთვის. ეს კლასიფიკატორი ხასიათდება განხორციელების სიმარტივით, მუშაობის სიჩქარით და გამოსახულების დეფექტებისადმი გამძლეობით, მაგრამ იძლევა შედარებით დაბალ სიზუსტეს და სწორედ ამიტომ გამოიყენება პირველ ეტაპზე - ჰიპოთეზების სიის სწრაფად გენერირებისთვის.

მახასიათებლების კლასიფიკატორი ( კომპიუტერი), როგორც მისი სახელი გვთავაზობს, ემყარება გამოსახულებაში კონკრეტული სიმბოლოს ნიშნების არსებობას. თუ სულ არის N ასეთი მახასიათებელი, მაშინ თითოეული ჰიპოთეზა შეიძლება წარმოდგენილი იყოს N-განზომილებიანი სივრცის წერტილით; შესაბამისად, ჰიპოთეზის სიზუსტე შეფასდება მისგან სტანდარტის შესაბამის წერტილამდე მანძილით (რომელიც ასევე შემუშავებულია სასწავლო კომპლექტზე). გასაგებია, რომ მახასიათებლების ტიპები და რაოდენობა დიდწილად განსაზღვრავს აღიარების ხარისხს, ამიტომ, როგორც წესი, საკმაოდ ბევრია. ეს კლასიფიკატორი ასევე შედარებით სწრაფი და მარტივია, მაგრამ არ არის ძალიან მდგრადი გამოსახულების სხვადასხვა დეფექტების მიმართ. გარდა ამისა, კომპიუტერი არ მუშაობს ორიგინალური გამოსახულებით, არამედ გარკვეული მოდელით, აბსტრაქციით, ანუ ის არ ითვალისწინებს ზოგიერთ ინფორმაციას: ვთქვათ, ზოგიერთი მნიშვნელოვანი ელემენტის არსებობის ფაქტი არ არის ნათქვამი. არაფერი მათი შედარებითი პოზიციის შესახებ. ამ მიზეზით, კომპიუტერი გამოიყენება არა მის ნაცვლად, არამედ RK-თან ერთად.

კონტურის კლასიფიკატორი ( QC) არის პერსონალური კომპიუტერის განსაკუთრებული შემთხვევა და განსხვავდება იმით, რომ აანალიზებს ორიგინალური სურათიდან ამოღებულ სავარაუდო სიმბოლოს კონტურებს. ზოგადად, მისი სიზუსტე უფრო დაბალია, ვიდრე სრულფასოვანი კომპიუტერის.

მახასიათებლების დიფერენციალური კლასიფიკატორი ( MPC) ასევე ჰგავს PC-ს, მაგრამ გამოიყენება მხოლოდ მსგავსი ობიექტების გასარჩევად, როგორიცაა "m" და "rn". შესაბამისად, ის აანალიზებს მხოლოდ იმ ტერიტორიებს, სადაც განსხვავებები იმალება და ის იღებს, როგორც შეყვანის სახით არა მხოლოდ ორიგინალური სურათები, არამედ ჰიპოთეზები, რომლებიც ჩამოყალიბებულია აღიარების ადრეულ ეტაპზე. თუმცა, მისი მუშაობის პრინციპი გარკვეულწილად განსხვავდება კომპიუტერისგან. ტრენინგის ეტაპზე N-განზომილებიანი სივრცეში ყალიბდება ორი შესაძლო მნიშვნელობის ორი „ღრუბელი“ (ქულების ჯგუფი), შემდეგ კი აგებულია ჰიპერთვითმფრინავი, რომელიც ჰყოფს „ღრუბლებს“ ერთმანეთისგან და დაახლოებით. მათგან თანაბარი დაშორებით. ამოცნობის შედეგი დამოკიდებულია იმაზე, თუ რომელ ნახევარ სივრცეში მოხვდება ორიგინალური გამოსახულების შესაბამისი წერტილი.

MPC თავისთავად არ წამოაყენებს ჰიპოთეზებს, არამედ მხოლოდ აზუსტებს არსებულებს (რომელთა ჩამონათვალი ზოგადად დალაგებულია ბუშტის მეთოდით), ისე, რომ მისი ეფექტურობის პირდაპირი შეფასება არ განხორციელდეს, არამედ ირიბად გაიგივდეს მახასიათებლებთან. OCR ამოცნობის მთელი პირველი დონე. თუმცა, ცხადია, რომ ეს დამოკიდებულია შერჩეული მახასიათებლების სისწორეზე და სტანდარტების ნიმუშის წარმომადგენლობაზე, რაც საკმაოდ შრომატევადი ამოცანაა.

სტრუქტურული დიფერენციალური კლასიფიკატორი ( KFOR) თავდაპირველად გამოიყენებოდა ხელნაწერი ტექსტების დასამუშავებლად. მისი ამოცანაა განასხვავოს მსგავსი ობიექტები, როგორიცაა "C" და "G". ამრიგად, SDK დაფუძნებულია სიმბოლოების თითოეული წყვილისთვის დამახასიათებელ მახასიათებლებზე, მისი სწავლის პროცესი კიდევ უფრო რთულია, ვიდრე MDC-ისა და მისი მუშაობის სიჩქარე უფრო დაბალია, ვიდრე ყველა წინა კლასიფიკატორის.

სტრუქტურული კლასიფიკატორი ( SK) ABBYY-ის სიამაყის წყაროა, ის თავდაპირველად შეიქმნა ეგრეთ წოდებული ხელნაწერი ტექსტის ამოცნობისთვის, ანუ როდესაც ადამიანი წერს „დაბეჭდილი“ ასოებით, მაგრამ მოგვიანებით გამოიყენებოდა ბეჭდვისთვის. იგი გამოიყენება აღიარების ბოლო ეტაპებზე და საკმაოდ იშვიათად შედის ძალაში, კერძოდ, მხოლოდ მაშინ, როდესაც მას მიაღწევს მინიმუმ ორი ჰიპოთეზა საკმარისად მაღალი ალბათობით.

ყველა კლასიფიკატორის ხარისხობრივი მახასიათებლები შეგროვებულია შემდეგ ცხრილში. ამასთან, ისინი მხოლოდ საშუალებას აძლევს შეაფასონ ალგორითმების ეფექტურობა ერთმანეთთან შედარებით, რადგან ისინი არ არიან აბსოლუტური, მაგრამ მიიღება კონკრეტული ტესტის ნიმუშის დამუშავების საფუძველზე. შეიძლება ჩანდეს, რომ აღიარების ბოლო ეტაპებზე ბრძოლა ფაქტიურად არის პროცენტის ფრაქცია, მაგრამ სინამდვილეში, თითოეული კლასიფიკატორი მნიშვნელოვან წვლილს შეიტანს ამოცნობის სიზუსტის გაზრდაში - მაგალითად, SC ამცირებს შეცდომების რაოდენობას შესამჩნევად. 20%.

RKკომპიუტერიQCMPC*KFOR **SK**
სიზუსტე პირველი სამი ვარიანტისთვის, %99,29 99,81 99,30 99,87 99,88 -
სიზუსტე პირველი ვარიანტის მიხედვით, %97,57 99,13 95,10 99,26 99,69 99,73

* ABBYY OCR ალგორითმის მთელი პირველი დონის შეფასება
** შეფასება მთელი ალგორითმისთვის შესაბამისი კლასიფიკატორის დამატების შემდეგ

თუმცა, საინტერესოა, რომ საკმაოდ მაღალი სიზუსტის მიუხედავად, თავად ამოცნობის ალგორითმი არ იღებს საბოლოო გადაწყვეტილებას. MDA პრინციპის შესაბამისად, ჰიპოთეზები წამოიჭრება თითოეულ ლოგიკურ დონეზე და მათი რიცხვი შეიძლება გაიზარდოს ექსპონენტურად. შესაბამისად, ყველა ჰიპოთეზის თანმიმდევრული ტესტირება ნაკლებად სავარაუდოა, რომ ეფექტური იყოს და, შესაბამისად, ABBYY OCR სისტემები იყენებენ ჰიპოთეზების სტრუქტურირების მეთოდს, ანუ მათ ამა თუ იმ მოდელზე მინიჭებას. ამ უკანასკნელთა რამდენიმე ათეულია, აქ არის მათი მხოლოდ რამდენიმე ტიპი: ლექსიკონის სიტყვა, არალექსიკონური სიტყვა, არაბული ციფრები, რომაული ციფრები, URL, რეგულარული გამოთქმა - და თითოეული შეიძლება შეიცავდეს ბევრ კონკრეტულ მოდელს (მაგალითად, სიტყვა ერთ-ერთ ცნობილ ენაზე, ლათინური, კირილიცა და ა.შ.).

ყველა საბოლოო მოქმედება ხორციელდება მოდელების გამოყენებით აგებული ჰიპოთეზებით. მაგალითად, კონტექსტური შემოწმება განსაზღვრავს დოკუმენტის ენას და დაუყოვნებლივ მნიშვნელოვნად შეამცირებს მოდელების ალბათობას არასწორი ანბანის გამოყენებით, ხოლო ლექსიკონის შემოწმება ანაზღაურებს შეცდომებს გარკვეული სიმბოლოების გაურკვეველ ამოცნობაში: მაგალითად, სიტყვა "მოქცევა" არის წარმოდგენილი ინგლისური ლექსიკონი - განსხვავებით "tum"-ისგან (ყოველ შემთხვევაში, ის არ არის პოპულარულთა შორის). მიუხედავად იმისა, რომ ლექსიკონის პრიორიტეტი ნებისმიერი კლასიფიკატორის პრიორიტეტზე მაღალია, ის სულაც არ არის უკანასკნელი საშუალება და ზოგადად არ წყვეტს შემდგომ შემოწმებას: ჯერ ერთი, როგორც ზემოთ აღინიშნა, არსებობს არალექსიკონური სიტყვის მოდელი და მეორეც. , ლექსიკონების სპეციალური ორგანიზაცია საშუალებას იძლევა მაღალი პროცენტული ალბათობით გამოიცნოს შეიძლება თუ არა რომელიმე უცნობი სიტყვა კონკრეტულ ენას ეკუთვნოდეს. თუმცა, ლექსიკონის შემოწმება (და ლექსიკონების სისრულე) მნიშვნელოვან გავლენას ახდენს ამოცნობის შედეგზე და ABBYY-ის საკუთარ ტესტებში ის თითქმის ორჯერ ამცირებს შეცდომების რაოდენობას.

არა მხოლოდ OCR

ბეჭდური დოკუმენტები შორს არის ერთადერთი ინტერესისგან მათი დიგიტალიზაციისა და ავტომატური დამუშავების თვალსაზრისით. ხშირად გიწევთ იმუშაოთ ფორმებთან, ანუ დოკუმენტებთან წინასწარ განსაზღვრული და ფიქსირებული ველებით, რომლებიც ივსება ხელით, მაგრამ შედარებით ზუსტად (ე.წ. ხელით დაბეჭდილი სიმბოლოები) - მაგალითად შეიძლება გამოდგეს სხვადასხვა კითხვარები. მათი დამუშავების ტექნოლოგიას აქვს ცალკე სახელი - ICR(ხასიათების ინტელექტუალური ამოცნობა) - და საკმაოდ მნიშვნელოვნად განსხვავდება OCR-ისგან. ასე რომ, რადგან ამ შემთხვევაში ამოცანა არ არის მთელი დოკუმენტის ხელახლა შექმნა, არამედ მისგან კონკრეტული მონაცემების ამოღება, ის იყოფა ორ მთავარ ქვეამოცნებად: საჭირო ველების პოვნა და მათი შინაარსის რეალურად ამოცნობა.

ეს საკმაოდ სპეციფიკური სფეროა და ABBYY გთავაზობთ სრულიად ცალკე პროგრამულ პროდუქტს, ABBYY FlexiCapture-ს. ის განკუთვნილია ავტომატური და ნახევრად ავტომატური სისტემების შესაქმნელად, გულისხმობს კონკრეტული ტიპის დოკუმენტების პერსონალიზაციას, რომლებისთვისაც იქმნება სპეციალური შაბლონები, შეუძლია ჭკვიანურად იპოვოთ სხვადასხვა ველები გვერდებზე და გადაამოწმოს მათში მონაცემები და ა.შ. თუმცა, მთავარია სიმბოლოების ამოცნობა. მსგავსი ალგორითმები, რომლებიც გამოიყენება FineReader-ში და ზოგადი სქემა ძალიან ჰგავს:

თუმცა, მაინც არის მნიშვნელოვანი განსხვავება: სტრუქტურული კლასიფიკატორი პროცესის სავალდებულო მონაწილეა - ეს განპირობებულია ხელით დაბეჭდილი სიმბოლოების სპეციფიკით. გარდა ამისა, ICR მოიცავს უამრავ სპეციფიკურ დამატებით შემოწმებას: მაგალითად, არის თუ არა სიმბოლო გადახაზული, თუ აღიარებული სიმბოლოები რეალურად ქმნიან თარიღს.