Tesseract 3 unter Visual Studio 2010 mit OpenCV

Hier erfahrt ihr wie man Tesseract 3 und OpenCV 2.4.3 unter Visual Studio 2010 zum laufen bekommt.

Für diesen Artikel müsst ihr erst Tesseract 3 zum laufen bekommen. Infos dazu findet ihr hier:

Tesseract 3 und Visual Studio 2010

Falls Ihr das geschafft habt kann es jetzt losgehen.

Ich verwende die OpenCV Version 2.4.3rc, welche ihr hier runterladen könnt.

Installiert OpenCV in das Verzeichnis C:\OpenCV2.4.3rc, sodass folgende Ordnerstruktur exisitert:

- C:\OpenCV2.4.3rc
  - 3rdparty
  - android
  - ...

Nun passe ich meine cpp Datei aus dem vorherigen Artikel so an, dass mit OpenCV ein Bild von der Festplatte geladen wird und mit Tesseract bearbeitet wird. Die cpp sieht dann so aus:

#include 
#include 
#include 
#include "baseapi.h"
using namespace std;
using namespace tesseract;
using namespace cv;

int main()
{
    TessBaseAPI tess;
    Mat image;

    image = imread("C:/image.jpg", CV_LOAD_IMAGE_GRAYSCALE); 

    int bytes_per_pixel = 1;
    int bytes_per_line  = bytes_per_pixel * image.cols;
    int width           = image.cols;
    int height          = image.rows;

    tess.Init("tessdata", "deu");

    char* text = tess.TesseractRect(image.data, bytes_per_pixel, bytes_per_line, 0, 0, width, height);

    tess.End();

    cout << text;
}

B

evor dieser Code fehlerfrei läuft müsst ihr noch folgende Schritte unternehmen:

Zunächst müsst ihr unter den Projekt Eigenschaften unter Configuration Properties->C/C++->General bei Additional Include Directories folgenden Eintrag hinzufügen:

C:\OpenCV2.4.3rc\build\include

Unter Configuration Properties->Linker->General braucht ihr unter dem Eintrag Additional Library Directories noch folgendes:

C:\OpenCV2.4.3rc\build\x86\vc10\lib

Falls ihr 32-Bit verwendet, ansonsten halt das x64 Verzeichnis.

Unter Configuration Properties->Linker->Input unter dem Eintrag Additional Dependencies fügt ihr noch folgendes ein:

opencv_core243d.lib
opencv_imgproc243d.lib
opencv_highgui243d.lib
opencv_ml243d.lib
opencv_video243d.lib
opencv_features2d243d.lib
opencv_calib3d243d.lib
opencv_objdetect243d.lib
opencv_contrib243d.lib
opencv_legacy243d.lib
opencv_flann243d.lib

Ich habe einfach alle libs hinzugefügt.

Falls ihr Texterkennung für die deutsche Sprache machen wollt, müsst ihr noch die entsprechende Trainings-Datei von der Tesseract Projektseite herunterladen und die Dateie deu.traineddata unter C:\tesseract-3.01\tessdata ablegen.

Nun müsst ihr noch die PATH Variable anpassen und folgendes hinzufügen:

C:\OpenCV2.4.3rc\build\x86\vc10\bin
C:\OpenCV2.4.3rc\build\common\tbb\ia32\vc10

Dazu empfehle ich das Tool Path Editor.

Falls ihr nun ein Bild unter C:\ abgelegt habt, sollte es kompilieren und auch funktionieren.

zp8497586rq
zp8497586rq

Comments are closed.