[MontelLUG] Programma per OCR
Odeeno
odeeno a yahoo.it
Lun 12 Set 2011 23:12:37 CEST
Kooka l'avevo trovato, ma non essendo nei repository di Fedora, non
l'ho ancora provato. Inoltre non riesco ad accedere al sito del
progetto http://kooka.kde.org/
Nel frattempo ho provato questo script, ma il risultato è stato
pessimo (pur avendo utilizzato un file a 600 dpi): quasi quasi
conviene riscrivere il testo da capo anzichè correggere gli errori.
---
PAGINE=11 # set to the number of pages in the PDF
SORGENTE=Statuto.pdf # set to the file name of the PDF
OUTPUT=Statuto.txt # set to the final output file
RESOLUTION=600 # set to the resolution the scanner used (the higher, the better)
touch $OUTPUT
for i in `seq 1 $PAGINE`; do
convert -monochrome -density $RESOLUTION $SORGENTE\[$i\] page$i.tif
tesseract page$i.tif page$i
cat $OUTPUT page$i.txt > temp.txt
rm $OUTPUT
rm page$i.tif
rm page$i.txt
mv temp.txt $OUTPUT
done
---
L'ho trovato qui: http://wiki.ubuntu-it.org/Grafica/Ocr
Il 10 settembre 2011 13:34, LinuX de Lupis
<linus.de.lupis a virgilio.it> ha scritto:
>
> a memoria mi pare esita kooka. Non so se sia ancora sviluppato/supportato.
>
> _______________________________________________
> montellug mailing list
> montellug a montellug.it
> http://mail.montellug.it/mailman/listinfo/montellug_montellug.it
>
More information about the montellug
mailing list