|
 |
サイト内検索(企業内検索) 膨大な情報の中から関心するものをすばやく見つけられるシステムを構築することで、知的な財産をもっと活用できるようになり、新たな価値を生み出すことができます。企業内部の大量文書検索、ECサイトの商品検索、Blog内容検索などには最適。
■ 検索対象は自由に定義できる
例:「本」と言うドキュメントを定義して、著者、タイトル、出版社、出版日付、紹介文などフィールドの定義を自由に行われて、各フィールドに対する検索ができる。
■ 強力な検索機能
単一のフィールドの検索だけではなく、複数条件の絞りこみ検索もできる。また範囲検索、パターン検索(前方一致など)、曖昧検索、密度検索、ロジック運算など豊富な検索方法を利用できる。
■ 複数の言語を混ぜているドキュメントも検索できる
中国語、日本語、韓国語の文書の対応はもちろん、複数の言語が混在している文書も対応できる。
■ 形態素解析を利用可能
日本語の場合、Senと言う形態素解析のライブラリを利用して、検索の精度が上がることは可能です。
■ 低コスト
オープンソースの製品を利用しているため、低価格で提供できる。
■ 高性能
スタンドアローンの場合、普通Xeonのサーバを使って、4Gのデータに対して検索を行って、結果は0.3秒で返した。データを分散化して、並列化システムを利用すると、TBレベルの全文検索も実現できる。
■ 柔軟性
予算と性能の要求と合わせて、柔軟なシステム設計はできる。
適用場面はいろいろがあって、典型的な導入事例を大きく分けると、次のように分けられます。
■ 大量文書の検索
大量のHTML、Word、PDFなどの文書を抱えてサイトや企業の場合、文書の利用者がこの膨大のリソースから、ほしいものをすばやく見つけられるシステムがありましたら、効率がよくなり、知的な財産をもっと活用できるようになって新たな価値を生み出すことができる。
■ ECサイトの商品検索
ショッピングサイトなどのシステムに使われている検索機能は単純なキーワードで検索するのはもの足りなくて、値段、日付、カテゴリなどの条件を組み合わせて、全文検索を行う機能を望まれている。
■ BlogなどCGM内容の検索
大型のBlogや掲示板システムで毎日数多くの投稿を飛び交われて、巨大な情報発信元になっていた、数多くの情報の中、自分が関心する情報を見つけ出すため、検索機能は欠けない。
|
|