SharePoint Online の検索機能
2022年08月12日
SharePoint Online の検索機能 SharePoint Online の検索の仕組みについてご案内します
SharePoint Online の検索
SharePoint Online を検索において思ったようにヒットしないということがあります。
ここでは、SharePoint Online の検索の仕組みについてご説明します。
SharePoint Online の検索の仕組み
通常、検索システムでは、検索対象となる単語に "検索インデックス (見出し)" をつけますが、SharePoint Online では、サイトに追加されたコンテンツに対してクロール処理(自動的に情報を収集する処理)が実行され、コンテンツのテキスト情報を "ワード ブレーカー" と呼ばれるモジュールにより、単語に分割し "検索インデックス" に格納します。
例えば、「神奈川県」は、「神奈川」と「県」に、「本店営業部」は、「本店」、「営業」、「部」に分割されます。
また、ユーザーが入力した "検索キーワード" も、検索実行時にクエリ サーバーにより単語に分割されます。
ユーザーが検索した際、単語単位で "検索インデックス" と "検索キーワード" の照合が行われ、両者が完全に一致した場合に検索結果として表示されます。
ワード ブレーカーは、言語ごとに存在し、日本語と認識された文字列は、日本語用ワード ブレーカーによって分割されますが、アルゴリズムが複雑な日本語のような言語では、文章内の句読点や文字の並び、および漢字などの影響により、抽出される (分割される) 文字列が使用者の期待どおりにならないことがあります。
公開情報
● SharePoint の検索アーキテクチャ
※ SharePoint 2007 や SharePoint 2010 向けの情報ですが SharePoint の検索機能の仕組みについてわかりやすく記載されています。
アスタリスク [ * ] やダブル クォーテーション [ "" ] を利用した検索
SharePoint Online は既定で前方一致検索または完全一致検索となっています。
ワイルドカード [* (アスタリスク)] を用いた検索やダブル クォーテーション [""] でキーワードを囲んで検索することで、想定した検索結果が得られる可能性があります。
例)
“神奈川県“を検索する場合
・神奈川*
・神奈川県*
・”神奈川”
・”神奈川県”
“1234567890”を検索する場合
・”1234567890”
(”12345” や “7890” などでは検索できない)
“123456ABCD”を検索する場合
・123*
・”123456ABCD”
(”123456” や “ABCD” などでは検索できない)
“ABCD012345”を検索する場合
・ABC*
・”ABCD012345”
(”ABC” や “012345” などでは検索できない)