GNU/Linux >> Znalost Linux >  >> Linux

Jak mohu extrahovat všechny externí odkazy webové stránky a uložit je do souboru?

Budete potřebovat 2 nástroje, lynx a awk , zkuste toto:

$ lynx -dump http://www.google.com.br | awk '/http/{print $2}' > links.txt

Pokud potřebujete očíslovat řádky, použijte příkaz nl , zkuste toto:

$ lynx -dump http://www.google.com.br | awk '/http/{print $2}' | nl > links.txt

Zde je vylepšení leltonovy odpovědi:vůbec nepotřebujete awk, protože rys má několik užitečných možností.

lynx -listonly -nonumbers -dump http://www.google.com.br

pokud chcete čísla

lynx -listonly -dump http://www.google.com.br

Linux
  1. Jak extrahovat soubor tar.gz v Linuxu pomocí příkazového řádku

  2. Jak extrahovat soubory .gz a .tar.gz v Linuxu

  3. Rozdíl mezi symbolickými a pevnými odkazy?

  1. Co jsou symbolické odkazy (Soft Links) a jak je vytvořit pod Linuxem

  2. Jak získat všechny soubory přesahující určitou velikost a smazat je

  3. Jak uložit výstup tohoto příkazu awk do souboru?

  1. Jak uložit příkazy Linuxu a používat je na vyžádání

  2. Vše je v tečkovém souboru – YADM a Homeshick

  3. Uložit veškerý výstup z terminálu do souboru?