Skip to content

OCR

 

 

Ἐγκατάστασις Βασικοῦ πακέτου Python + Gamera + Psaltiki Toolkit

Κατεβάσατε τά κάτωθι 3 ἀρχεῖα .zip :

 

 1α)    32-bit  GameraOCR_3dot3py2dot3_for_BZQ.zip  Νέον  – New – Nuevo

ἢ τό ἂλλον ἀρχεῖον διά 64-μπιτον Η/Υ:

 1β)    64-bit  Gamera-install-27.zip 

2)      _Install_PSK_27.zip     Νέον –   New  –   Nuevo 2018

3)    Gamera Psaltiki Training files, Examples  Παραδείγματα “Training Files” (ἀρχεῖα διδασκαλίας) ἀπό διάφορα βιβλία Β.Μ

 

 

Ὁδηγίαι διά τό OCR

 

1) Πρῶτα κατεβάσατε τά ἀνωτέρω  3 ἀρχεῖα τύπου .zip

Τό πρόγραμμα Gamera OCR διατίθεται εἰς δύο ἐκδόσεις:
Version 2.3 (32 bits) ,
Version 2.7 (64 bits, νεωτέρα ἒκδοσις)

 

2) Ἀποσυμπιέστε τα εἰς τό C:\

 

3α) Διά(32-bit)  Gamera 2.3 ἀνοίξατε τόν φάκελον GameraOCR_3dot3py2dot3_for_BZQ,

α) ἐκτελέσατε τά ἀρχεῖα κατά σειράν(!) 1,2,3… κτλ μέ δεξί κλίκ ὡς ἑξῆς:
-ἐπιλέξατε “Run as Administrator” (“Ἐκτέλεσις ὡς Διαχειριστής”)
-ἢ ἐάν δέν ὑπάρχῃ αὐτή ἡ ἐπιλογή, ἐπιλέξατε “Install” (“Ἐγκατάστασις”)

β) ἀκολούθως ἀμέσως μετονομάσατε τόν φάκελον C:\Python23 εἰς C:\Python27 !

 

3β) Διά (64-bit) Gamera 2.7 ἀνοίξατε τόν φάκελον gamera-install-27,

α) ἐκτελέσατε τά ἀρχεῖα κατά σειράν(!) 1,2,3 κτλ μέ δεξί κλίκ ὡς ἑξῆς:
-ἐπιλέξατε “Run as Administrator” (“Ἐκτέλεσις ὡς Διαχειριστής”)
-ἢ ἐάν δέν ὑπάρχῃ αὐτή ἡ ἐπιλογή, ἐπιλέξατε “Install” (“Ἐγκατάστασις”)

 

4) Εἰς τόν φάκελον _Install_PSK_27 ἐκτελέσατε τό ἀρχεῖον
Install_PSK_27.bat

 

5) Ἐάν δέν ὑπάρχῃ, δημιουργήσατε τόν φάκελον C:\My Documents
(μέ ἓνα κενό διάστημα ἀνάμεσα στίς λέξεις My καί Documents)

 

6) Εἰς τόν φάκελον  C:\My Documents  βάλετε τόν φάκελον Pandouris1_1_1 (μή ἀλλάξητε τό ὂνομα).

 

7) Εἰς τό πρόγραμμα BZQ ἐπιλέξατε μενοῦ OCR καί ἐπιλογή:
“6 ‘ Επιλογή:    Pandouris…exe     Selection”

Τώρα δύνασθε πλέον νά χρησιμοποιήσητε καί τάς ὑπολοίπους ἐπιλογάς 1 ἓως 5.
Ὁ φάκελος C:\OCRbatch πρέπει νά περιέχῃ ὃλας τάς σκαναρισμένας σελίδας μιᾶς πᾶρτίδος καί ὃλα τά ἐπιθυμητά ἀρχεῖα τύπου .xml (training files).
Τά ὀνόματα σελίδων Β.Μ καί .XML δέν πρέπει νά ἒχουν κενά διαστήματα.
Ἐπίσης διά ταχεῖαν καί σωστήν σύγκρισιν τῶν δοκιμῶν, τά ὀνόματα τῶν σελίδων Β.Μ. πρέπει νά εἶναι σύντομα καί συστηματικά π.χ. κωδικόν ὂνομα βιβλίου μέ σταθερόν ἀριθμόν γραμμάτων είς τάς ἐργασίας σας π.χ. 10 γραμμάτων καί 3-ψήφιος ἀριθμός σελίδος, π.χ.
LEITOURGIK009.jpg
LEITOURGIK123.jpg

Τά όνόματα ἀρχείων .XML καλύτερα νά ἒχουν δύο μόνον γράμματα π.χ. ,
01.xml,
99.xml,
AB.xml κτλ

Ὁ λόγος τῶν ἁπλῶν ὀνομάτων εἶναι ὃτι δημιουργοῦνται νέα ἀρχεῖα μέ συνδυασμόν
 ὀνομάτων σελίδων καί XML καί πρέπει νά ἀναγνωρίζωνται εὐκόλως εἰς τάς διαφόρους συγκρίσεις.
 Παράδειγμα παραχθέντων ἀρχείων
 ἀρχική σελίς Β.Μ. LEITOURGIK123.jpg_
 OCR μέ τό 09.xml  LEITOURGIK123.jpg_09.xml.code
 ἀρχεῖον Πανδουρίς LEITOURGIK123.jpg_09.xml.code.pan

Ὁ ἲδιος φάκελος C:\OCRbatch περιέχει ὃλα τά ἀποτελέσματα τῶν ἐπιλογῶν 1 ἓως 6 καί τό ἀρχεῖον OcrLog.txt μέ στατιστικά στοιχεῖα.

Διά νά διακόψητε μίαν ἐργασίαν παρτίδος (batch), ἁπλῶς κλείσατε τό μαῦρο παράθυρον.

 

 

 

 

 

 

.

Advertisements
%d bloggers like this: