クローラーは、指定されたWebサイトを巡回し、ページの内容を収集してインデックス化するプログラムです。neodigでは、このクローラーを使用して、お客様のWebサイトのコンテンツを検索可能な形式に変換します。
neodig クローラーはページの種別や更新頻度に応じて、クロール間隔を決定しクロールします。
他のページからリンクされていないページです。これらのページは、1週間後に自動的に削除されます。削除予定日時は、ページ詳細で確認できます。クローラー操作から即時削除することもできます。
neodigでは、設定を適用するURLをGlobパターンで指定します。Globパターンを使うことで、柔軟にURLを指定できます。
| パターン | 説明 | マッチする例 |
|---|---|---|
/item.php | 完全一致 | /item.php のみ |
/blog/* | 1階層のワイルドカード | /blog/post |
/blog/** | 複数階層のワイルドカード | /blog/2024/01/post |
/item*.php | 部分ワイルドカード | /item.php, /item_detail.php |
/page?.html | 1文字のワイルドカード | /page1.html, /pageA.html |
/item.php - /item.php のみに適用
/blog/* - /blog/ 直下のページに適用
/blog/** - /blog/ 配下のすべてのページに適用
/**/*.php - すべての .php ファイルに適用
/* - ルート直下のすべてのページに適用
** は複数階層にマッチし、* は単一階層内でのみマッチします。クローラーを利用するには、以下の順序で設定を行います。