Cómo descargar un sitio web completo con Wget
Wget es un software libre (GNU) para recuperar archivos mediante HTTP, HTTPS y FTP. Al ser una herramienta de línea de comandos no interactiva, puede llamarse desde scripts, cron jobs de cPanel o terminales sin entorno gráfico, lo que la hace ideal para descargar un sitio web completo —por ejemplo para consultarlo sin conexión, hacer una copia de seguridad o preparar una migración—.
El comando
wget --recursive --no-clobber --page-requisites --html-extension \
--convert-links --restrict-file-names=windows \
--domains website.org --no-parent www.website.org/tutorials/html/
Qué hace cada opción
--recursive: descarga el sitio siguiendo sus enlaces.--domains website.org: no sigue enlaces a dominios externos.--no-parent: no sube por encima del directorio indicado.--page-requisites: descarga también imágenes, CSS y demás recursos de cada página.--html-extension: guarda los archivos con extensión.html.--convert-links: reescribe los enlaces para que funcionen en local (offline).--restrict-file-names=windows: adapta los nombres de archivo para que sean válidos también en Windows.--no-clobber: no sobrescribe lo ya descargado (útil si la descarga se interrumpe y se reanuda).
Consejo: respeta el
robots.txty los términos del sitio, y añade--wait=1para no saturar el servidor de origen.
¿Necesitas migrar, clonar o hacer copias de seguridad de tu web sin dolores de cabeza? En TePublico.NET lo gestionamos por ti con nuestro servicio de mantenimiento web. Cuéntanos tu proyecto.