クローラーの基本的な動作を設定します。これらの設定は、すべてのドメインに共通して適用されます。
同時にクロールするページ数を設定します。
並列数を増やすとクロール速度は向上しますが、対象サーバーへの負荷も増加します。対象サーバーのリソースや、サイトの規模に応じて適切な値を設定してください。
ページ間のクロール間隔を設定します。
インターバルを長くすることで、対象サーバーへの負荷を軽減できます。一方で、クロール完了までの時間は長くなります。
クロール時に使用するUser-Agent文字列を設定します。
User-Agentは、クローラーがWebサーバーに対して自身を識別するための文字列です。設定することで、アクセスログでクローラーのアクセスを識別しやすくなります。