Descargar un sitio web completo con wget

Internet es maravillosa. Sin embargo, en ocasiones te puedes quedar con la miel en los labios. ¿No te ha ocurrido nunca que sabías donde encontrar justo la información que necesitabas, y cuando has ido a consultarla, ya no estaba? Para evitarlo, puedes descargarla cuando la encuentras y tenerla guardada en tu disco para cuando la necesites.

Para realizar este trabajo, existen programas realmente interesantes, pero también podemos hacerlo solamente usando el sistema operativo. Concretamente, el comando wget.
Es tan sencillo somo abrir una consola (Aplicaciones > Accesorios > Terminal) y escribir las siguientes líneas:

cd Descargas
wget –recursive –page-requisites –html-extension –convert-links –domains wordpress.com –no-parent http://sliceoflinux.wordpress.com

Nada más pulsar la tecla Intro, verás que comienza la descarga…
4c4e7261fd6d17fbff2a8b4fee105f2d Descargar un sitio web completo con wget
… y que se crea una carpeta en el directorio de destino, donde después tendrás todo el contenido del sitio.
8a9ca1601ca7ba8ebdff4e6c8adcbde7 Descargar un sitio web completo con wget
Lógicamente, habrá que cambiar el texto que aparece en azul, para que se adapte a tus necesidades. Debes tener en cuenta que el directorio donde se almacenen los archivos será el directorio actual. Por ese motivo, yo he creado un directorio, llamado Descargas, y lo utilizo para ese fin.

Si tienes curiosidad por saber qué hace cada uno de los atributos, puedes echarle un vistazo a la siguiente tabla:

Argumento — Significado
–recursive — Para indicar que debe descargarse el sitio completo.
–domains sitio — Evita que se sigan los enlaces fuera del sitio que estemos descargando.
–no-parent — Impide que se descarguen enlaces fuera del ámbito de descarga, aunque pertenezcan al mismo sitio.
–page-requisites — Descarga todos los recursos relacionados con cada documento descargado (imágenes, javascript, CSS, …).
–html-extension — Almacena los archivos utilizando la extensión .html.
–convert-links — Modifica los enlaces para que hagan referencia a los archivos locales.

Además, disponemos de dos atributos más, que pueden resultarte útiles en algunos momentos:

Argumento — Significado
–restrict-file-names=windows — Cambia los nombres de los archivos para que sean compatibles con Windows.
–no-clobber — Se utiliza para cuando se continúa una descarga que se había interrumpido. Evita que se vuelvan a escribir archivos que ya existían.

Como ves, se trata de una funcionalidad muy fácil de utilizar. El único peligro es que llenes tu disco duro antes de lo que tenías previsto. A pesar de todo, espero que te resulte útil.

Vía | sliceoflinux

Comparte!
Categorias Trucos/Tips
Tags , , .