GNU Wget 1.10 Manual
1 概要
GNU Wgetは,Webから対話的ではないファイルのダウンロードを行なうためのフ
リーのユーティリティです.http,https,そしてftpをサポー
トしていて,httpプロキシからの回収も同様にサポートしています.
この章は,Wgetの機能の部分的な概要となっています.
-
Wgetは対話的ではなく,つまりそれはユーザがログオンしていない間にバック
グラウンドで動作可能なことを意味しています.このため,Wgetに仕事を完了
させるため,回収を開始し,システムとの接続を終了する(システムと離れてい
る)ことが可能になっています.それと比較して,ほとんどのウェブブラウザは
常にユーザの存在を要求し,それは大量のデータを転送しているときは,大き
な障害となります.
-
Wgetは,htmlページとxhtmlページのリンクをたどり,遠隔地のウェ
ブサイトのローカルバージョンを作成し,それはオリジナルサイトのディレク
トリ構造を完全に再生成します.これは“再帰的なダウンロード”と言われる
こともあります.こうしている間,WgetはRobot Exclusion Standard
(/robots.txt)を考慮します.オフラインで閲覧するために,ダウンロー
ドされたhtmlファイルのリンクをローカルのファイルに変換するよう,
Wgetに指示することが可能です.
-
ファイル名のワイルドカードへの一致と,ディレクトリの再帰的なミラーは,
ftpで回収するときに利用可能です.Wgetは,httpサーバと
ftpサーバの両方でタイムスタンプ情報を読み込み,それをローカルに保
存することが可能です.それにより,Wgetはリモートファイルが前回の回収か
ら変化しているかどうかを理解し,変化がある場合は新しいバージョンを自動
的に回収することが可能になっています.これで,Wgetがホームページと同様
にftpサイトのミラーに適するようになっています.
-
Wgetは,遅く不安定なネットワークの接続越しでも耐性があるように設計され
てきました.ネットワークの問題でダウンロードに失敗した場合,ファイル全
体が回収されるまで再試行を続けます.サーバが再収集をサポートしている場
合,残っている場所からダウンロードを続けるようサーバに伝えます.
-
Wgetはプロキシサーバをサポートし,それはネットワークの負荷を軽くし,回
収の速度を上げ,そしてファイアーウォール経由でのアクセスを提供すること
を可能にします.しかし,socks形式のゲートウェイの使用が必要なファイアー
ウォール経由の場合,socksライブラリを入手しsocksサポートを用いてWgetを
ビルドすることで可能となります.Wgetは,受動的なftpダウンロードも
デフォルトでサポートしていて,アクティブftpはオプションとなってい
ます.
-
Wgetは次世代のIPであるIPバージョン6をサポートしています.IPv6はコンパイ
ル時に自動的に検出され,ビルド時または実行時に利用不可にすることが可能
です.IPv6サポートでビルドされたバイナリは,IPv4のみでも両方使える環境
でも,正しく動作します.
-
組込みの機能は,希望するリンクをたどることを調整するメカニズムを提供し
ます(see Following Links).
-
個別のダウンロードの進捗は,進捗表示機(progress gauge)を使用して表示さ
れます.対話的なダウンロードでは,“温度計”形式で表示されますが,対話
的ではないときはドットで表示され,それぞれのドットは受信したデータの固
定量(デフォルトで1KB)を表現しています.これらの表示は好みによりカスタマ
イズ可能です.
-
ほとんどの機能は完全に構成を変更することができ,それらは,コマンドライ
ンオプションや初期化ファイル.wgetrc(see Startup File)を通じ
て行います.Wgetでは,サイト設定に対してグローバル(global)なスター
トアップファイル(デフォルトで/usr/local/etc/wgetrc)で定義可能に
なっています.
-
最後になりますが,GNU Wgetはフリーソフトウェアです.このことは,Free
Software Foundationが出版しているGNU一般公有使用許諾書
(see Copying)の用語の下で,誰もが,使用し,再配布し,そして/または
修正が可能だということを意味します.