OCR-Software für Linux installiert
Ich habe mir mal des Themas OCR (optical character recognition) also Texterkennung in Linux angenähert. In der Vergangenheit habe ich die von der Post eingegangenen Sendungen zwar immer eingescannt, aber dann „nur“ als PDF-Datei abgespeichert. Gleichzeitig habe ich in meiner MongoDB Datenbank Collections erstellt, wo ich die einzelnen Postsendungen eingetragen habe. Jetzt ist mir aber die Idee gekommen, auch den Text von der Postsendung in die MongoDB Datenbank zu übertragen. Klar man könnte alles abtippen, was bei meiner Zehnfingersysteme (gelernt…