[MontelLUG] Programma per OCR

Odeeno odeeno a yahoo.it
Lun 12 Set 2011 23:12:37 CEST


Kooka l'avevo trovato, ma non essendo nei repository di Fedora, non
l'ho ancora provato. Inoltre non riesco ad accedere al sito del
progetto http://kooka.kde.org/

Nel frattempo ho provato questo script, ma il risultato è stato
pessimo (pur avendo utilizzato un file a 600 dpi): quasi quasi
conviene riscrivere il testo da capo anzichè correggere gli errori.
---
PAGINE=11 # set to the number of pages in the PDF
SORGENTE=Statuto.pdf # set to the file name of the PDF
OUTPUT=Statuto.txt # set to the final output file
RESOLUTION=600 # set to the resolution the scanner used (the higher, the better)

touch $OUTPUT
for i in `seq 1 $PAGINE`; do
    convert -monochrome -density $RESOLUTION $SORGENTE\[$i\] page$i.tif
    tesseract page$i.tif page$i
    cat $OUTPUT page$i.txt > temp.txt
    rm $OUTPUT
    rm page$i.tif
    rm page$i.txt
    mv temp.txt $OUTPUT
done
---
L'ho trovato qui: http://wiki.ubuntu-it.org/Grafica/Ocr





Il 10 settembre 2011 13:34, LinuX de Lupis
<linus.de.lupis a virgilio.it> ha scritto:
>
> a memoria mi pare esita kooka. Non so se sia ancora sviluppato/supportato.
>
> _______________________________________________
> montellug mailing list
> montellug a montellug.it
> http://mail.montellug.it/mailman/listinfo/montellug_montellug.it
>




More information about the montellug mailing list