[MontelLUG] Pdf & disordine alfabetico: suggerimenti

Lun 15 Maggio 2006 17:33:18 CEST

2006/5/15, Davide Rondini <davide.rondini a gmail.com>:

>  Puoi cercare di individuare le pagine, se conosci il carattere che le
> separa. Se no a cosa servono sed, grep e awk? Però se la riga di testo con i
> nomi contiene un certo pattern riconoscibile ti conviene usare grep con le
> espressioni regolari. Salvi ciascuna riga con i nomi all'inizio, più il
> rispettivo numero di pagina in un file temporaneo con la lista, lo passi a
> sort e rinomini con la sequenza delle righe ottenute tutti i file PDF
> splittati. Un po' di tempo fa avevo trovato dei tool da riga di comando che
> facevano questa cosa sui pdf, mi ricordo però solo che il comando per unire
> si chiamava pdfmerge e che erano in python.
>
>  Have fun.

Sì, ho in mente di fare una cosa del genere, il problema è che la riga
ha dei bellissimi spazi come inizio, con la conseguenza che sto
diventando scemo per cercare di individuarla. A sto punto meglio che
faccia qualcosa che conti le righe e ogni tot (leggasi "giunto alla
riga desiderata") passa il contenuto a qualcos'altro che ne estrae
nome e cognome.

Daneel Olivaw (coi circuiti positronici fumanti)