GNU/Linux >> Znalost Linux >  >> Linux

Proč „wget -r -e Robots=off Http://ccachicago.org“ nepůsobí rekurzivně?

Snažím se rekurzivně stáhnout http://ccachicago.org a dostávám přesně jeden soubor, kořenový adresář index.html , staženo.

Podíval jsem se na Download rekurzivně pomocí wget a začal jsem používat doporučený -e robots=off , ale stále se chová stejně.

Jak pomocí wget nebo nějaký jiný nástroj, mohu si stáhnout kopii webu?

Přijatá odpověď:

ptáte se wget provést rekurzivní stažení http://ccachicago.org , ale tato adresa URL neposkytuje žádný přímý obsah. místo toho je to jen přesměrování na http://www.ccachicago.org (což jste neřekli wget načíst rekurzivně)..

pokud řeknete wget ke stažení správné adresy URL bude fungovat:

wget -r -e robots=off http://www....

Linux
  1. Bash =~ Regex A Https://regex101.com/?

  2. Proč /bin/sh ukazuje na /bin/dash a ne /bin/bash?

  3. Jak používat wget ke stažení souboru přes proxy

  1. Nainstalujte binární soubory do /bin, /sbin, /usr/bin a /usr/sbin, interakce s --prefix a DESTDIR

  2. Django static_root v /var/www/... - žádná oprávnění ke collectstatic

  3. Kdy mám použít /dev/shm/ a kdy /tmp/?

  1. Jak zjistit, ze které složky běží proces?

  2. unix:///var/run/supervisor.sock žádný takový soubor

  3. echo nebo print /dev/stdin /dev/stdout /dev/stderr