HTML共通部分の除外

ヘッダー、フッター、サイドバーなどの共通部分を除外して検索精度を向上させます。

HTML共通部分の除外機能を使うことで、ヘッダー、フッター、サイドバーなどの共通部分を除外し、本文のみを抽出できます。

HTML共通部分の除外とは

多くのWebサイトでは、すべてのページに共通のヘッダー、フッター、ナビゲーションメニューなどが含まれています。これらの共通部分をインデックスに含めると、検索精度が低下します。 HTML共通部分の除外機能を使うことで、ページの本文のみを抽出し、検索精度を向上させることができます。

関連コンテンツなど、そのページとは直接的に関係のない要素も除外することをおすすめします。

CSSセレクタの指定

除外する要素は、CSSセレクタで指定します。

基本的なセレクタ

セレクタ説明
#idID指定#header
.classクラス指定.sidebar
tagタグ指定nav
tag.classタグとクラスの組み合わせheader.main-header

設定例

#header          - ID が header の要素を除外
.sidebar         - クラスが sidebar の要素を除外
nav              - nav タグの要素を除外
footer           - footer タグの要素を除外
複数のセレクタを指定することで、複数の要素を一度に除外できます。「+セレクタを追加」ボタンで追加してください。

パスの指定(Globパターン)

URLパスは、Globパターンで指定します。

優先度について

複数の設定が同じパスに一致する場合、優先度の一番大きいもののみ適用されます。