[MontelLUG] Uso di wget

Odeeno odeeno a yahoo.it
Sab 28 Gen 2017 13:05:41 CET


Il 27/01/2017 19:32, Syslac via montellug ha scritto:
> 2017-01-27 17:24 GMT+01:00 Odeeno via montellug <montellug a montellug.it>:
>> b) i link ai moduli risultano <td valign=top><img
>> src="http://www..montellug.it/sito/modulistica/imm.gif" width="18"
>> height="18" border="0" onClick="javascript:openIt('modulo.doc')"></td>
> 
> Non mi sono ricontrollato il man di wget, ma scommetterei con buona
> certezza che il tuo problema è qui.
> Questi non sono link (i link in html sono i tag <a>); il "link" che tu
> pensi di vedere è una
> redirezione javascript e quindi non dovrebbe funzionare neanche in
> navigazione con javascript disabilitato, e quindi visto che wget non
> esegue e non può eseguire javascript, è normale che non li scarichi.
> 
> Bye,
> 
> Syslac

Ho trovato una soluzione brutale, ma ha funzionato.
Dal file html ho estratto una lista di nomi dei file collegati; poi ci
ho aggiunto davanti l'URL di dove si trovavano.
(L'ho fatto con LibreOffice Calc... si... lo so fa schifo, ma sono fuori
allenamento con il linguaggi di programmazione... in ogni caso le
funzioni di estrazione del testo hanno funzionato)

Poi ho dato un bel wget -i list.txt
e ha scaricato tutti i file linkati nella pagina.
Tutto funziona a meraviglia.



Maggiori informazioni sulla lista montellug