みなさん、こんにちは。
今回はデジパンのデジタルカタログのキーワード検索機能について、技術的なご紹介をさせていただきます。
一般の方はご存じない方も多いのですが、検索エンジン等で皆さんが利用しているキーワード検索では、実は「日本語形態要素解析」というとても高度な技術が使用されています。
日本語形態要素解析とは?
日本語の文章を単語ごとに分割する技術のことを「分かち書き」というのですが、この技術の基本になっているのが「日本語形態要素解析」という技術です。
たとえば、「昨日は医者に行った」を「昨日/は/医者/に/行った」のように分割するためのテクノロジーを日本語形態要素解析と呼びます。
より正確な検索が可能に
この技術を利用すると「スキー」の中に含まれる「スキー」と「チャイコフスキー」の中に含まれる「スキー」を違う単語として区別することができるため、スキーと検索した際により正確な検索結果を提供することが可能になります。
つまり、「スキー」と検索しても「チャイコフスキー」や「スワロフスキー」が結果に含まれないで純粋に滑る「スキー」のみが検索されるのです。
検索結果の表示もスピーディー
プログラムによる検索にはインデックス(索引)を使用した検索と、そうでない検索があります。
専門的な話は割愛しますが、インデックスを使用した検索の場合、検索に必要な速度は非常に高速で、対象になる文書の文字数やページ数によって検索が遅くなることはほとんどありません。
一方でインデックスを使用していない検索の場合、検索速度は対象となる文書の文字数やページ数に比例して遅くなります。
そして、インデックスを使用した検索を行うには、日本語形態要素解析技術が必須になります。
デジパンのデジタルカタログのキーワード検索
デジパンのデジタルカタログのキーワード検索では、Yahooが提供する日本語形態素解析サービスで得られた結果をもとにした、インデックスによる日本語全文検索を行っています。
一方で他社のほとんどのデジタルカタログでは、インデックスを使用しない方法による検索を行っています。
したがって、デジパンのデジタルカタログでは、他社製品に比べて非常に正確で高速な全文検索が可能になっています。




