Скачиваем сайты целиком (Linux)

Удивительно, но скачать все доступные страницы какого-либо сайта можно обычной командой wget:

wget --wait=10 --limit-rate=100K -r -p -U Mozilla http://www.site.ru


В данном примере параметр wait позволяет делать паузу в 10 секунд между каждым запросом, limit-rate ограничивает скорость. Это не помешает, так как на многих хостингах частые запросы с одного IP будут блокироваться.

Вот так, не торопясь, можно получить все доступные страницы сайта.

Комментарии (2)

RSS свернуть / развернуть
+
+1
Есть еще

wget --mirror http://www.site.ru


В последнее время всё чаще вместо wget используют curl. Сам не пробовал, но говорят он гибче.
avatar

yababay

  • 14 марта 2010, 12:10
+
0
Xa!
avatar

Markony

  • 14 марта 2010, 20:55

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.