antoni@hackerspace.pl dixit (2014-12-02, 10:53):
Tesseract jest zajebisty.
Wczorajszy wątek zbiegł się bardzo z moją dzisiejszą potrzebą do zOCRowania pracowych dokumentów. Na ubuntu instalacja Tesseract jest bardziej skomplikowana bo nie ma go w repo, ale sprawdził się świetnie. Bardzo szybko kilkunastostronicowy dokument zeskanowany za pomocą fotek robionych telefonem, po naniesieniu tylko drobnych poprawek (nie zajęło mi to więcej jak 10 minut), był gotowy do edycji i wysłania.
Dzięki za polecenie!
Dla zainteresowanych, opis instalacji Tesseract3 na Ubuntu: https://help.ubuntu.com/community/Tesseract3 W ostatnim punkcie, gdy ściągamy traineddata wystarczy ell w adresach wgeta zastapić np. pol i eng. Nie wyświetlają się w downloads na stronie projektu, ale są na serwerze.
Pozdro sirmacik