Webサイトには、クロールする必要がないページや、検索結果には表示したくないがリンクの抽出だけは行いたいページなどが存在します。クロール対象設定を使うことで、URLパス単位でこれらのページの扱いを制御できます。
クロール対象設定では、以下の4つのルールから選択できます。
指定したパスのページをクロールしません。リンクの抽出も、インデックスへの登録も行いません。
使用例: 管理画面、ログインページなど
ページをクロールしてリンクを抽出しますが、インデックスには登録しません。
使用例: 一覧ページ、カテゴリページなど(検索結果には表示したくないが、リンク先のページはクロールしたい場合)
ページをインデックスに登録しますが、ページ内のリンクは抽出しません。
使用例: リンク先をクロールしたくない場合
ページをクロールし、リンクを抽出して、インデックスにも登録します。(デフォルトの動作)
使用例: 通常のコンテンツページ
URLパスは、Globパターンで指定します。
複数の設定が同じパスに一致する場合、優先度の一番大きいもののみ適用されます。
| 優先度 | パス | ルール |
|---|---|---|
| 2 | /blog/category/** | リンク抽出のみ |
| 1 | /blog/** | リンク抽出・インデックスする |
この場合、/blog/category/ 配下のURLには「リンク抽出のみ」が適用され(優先度が高い)、それ以外の /blog/ 配下のURLには「リンク抽出・インデックスする」が適用されます。