Comment ne reproduire qu’une section d’un site Web?

Je ne peux pas obtenir wget pour refléter une section d’un site Web (un chemin de dossier sous la racine) – il semble seulement fonctionner à partir de la page d’accueil du site Web.

J’ai essayé de nombreuses options – voici un exemple

wget -rkp -l3 -np http://somewebsite/subpath/down/here/ 

Bien que je veuille uniquement mettre en miroir les liens de contenu sous cette URL, je dois également télécharger tous les éléments de la page qui ne se trouvent pas dans ce chemin.

Il semble fonctionner correctement pour la page d’accueil ( / ) mais je ne peux pas le faire pour les sous-dossiers.

Utilisez les --mirror ( -m ) et --no-parent ( -np ), ainsi que quelques options intéressantes, comme dans cet exemple:

 wget --mirror --page-requirejsites --adjust-extension --no-parent --convert-links --directory-prefix=sousers http://stackoverflow.com/users 

J’utilise habituellement:

 wget -m -np -p $url 

Je me sers de pavuk pour réaliser des miroirs, car cela semblait beaucoup mieux à cette fin dès le début. Vous pouvez utiliser quelque chose comme ceci:

 /usr/bin/pavuk -enable_js -fnrules F '*.php?*' '%o.php' -tr_str_str '?' '_questionmark_' \ -norobots -dont_limit_inlines -dont_leave_dir \ http://www.example.com/some_directory/ >OUT 2>ERR