セマンティック検索
検索エンジンが 検索文(自然言語)の意味を理解 し、その意味に沿った検索結果を提供するセマンティック検索技術。 利用者の意図・目的に合った検索結果を得ることができる 検索技術の一部をご紹介します。
セマンティックとは?
『セマンティック(semantic)』
多くの方にとって耳慣れない言葉ではないでしょうか。セマンティックとは、一般的には『意味』『意味論』と訳される語で、IT業界においては『
データの持つ意味をコンピュータに理解させ処理する技術
』の意味で用いられています。以下では、セマンティック技術の代表格、セマンティック検索について詳しく見ていきましょう!
セマンティック検索とは?
セマンティック検索とは、検索エンジンが検索文の意味を理解しその意味に沿った検索結果を提供する技術 です。
QuickSolutionのセマンティック検索には以下の3つの特長があります。
(1)検索文(自然言語)の意味を理解
構文解析/意味解析を実施
(2)意味に沿う結果を高速に抽出
あいまい検索をさらに高度化し、検索文の意味に沿った検索結果を優先表示
(3)検索文の表現揺れに強い
動詞の類義語や活用形は同等の意味として扱う(例:抑制する、抑制します、抑えます)
セマンティックを活用した検索エンジンは、 利用者の意図・目的に沿った検索が可能 なため、 検索効率の向上 が期待できます。
セマンティック検索の例
「プランターで野菜を育てるには?」という検索文でセマンティック検索した場合を例に挙げています。
セマンティック検索を行うと、①のように、検索エンジンは 検索文と意味が近い表現を含むファイルを上位に表示 します。また、「育てる」の同義語として「栽培する」が挙げられるため、「野菜を栽培する」という表現でヒットしていることがわかります。
一方で、②のファイルには、①のファイルより多くのヒット箇所があるのですが、「畑で野菜を育てる」という内容のファイルで、検索文の意味から遠いため下位に表示されます。
さらに、③のように 検索にヒットした箇所の周辺に頻出する表現を「関連する表現」として抽出・表示 します。これによって、利用者に別の条件での再検索を促し(気付き支援)ます。 ワンクリックで再検索 できるので、 探している情報へのアクセス効率を高めます 。
セマンティック検索とあいまい検索の違い
QuickSolutionには、セマンティック検索と同じく、表記揺れを吸収し自然文での検索が可能なあいまい検索があります。いずれも 高度な検索エンジンに搭載される検索方法 ですが、以下のような違いがあります。
あいまい検索では、検索文を分解した各部分文字列の「出現頻度」や「出現集中度」に加え、その文字列の出現する位置も考慮してスコアを算出 します(スコア算出の詳細についてはあいまい検索をご参照ください)。検索に有効な部分文字列を文書の特定箇所に多く含むデータが高スコアとなりやすいため、利用者が意図したものが検索結果の上位に現れないというケースもあります。
一方、 セマンティック検索では、あいまい検索の利点を引き継ぎ ながら、さらに 構文解析/意味解析も行う ことで、 検索文の意味により近いものを検索結果の上位に表示 することが可能です。また、構文的・意味的に近くないデータは有用でないと判断し低スコアとなります。