文書検索エンジンである dtSearch に、ベイシス・テクノロジーのRosette言語解析機能をお使いいただけます。多くの言語での深い言語処理および高精度の検索結果を実現するために、大手企業の皆様に当社の製品をご使用いただいています。言語プラグインにより、アジア、ヨーロッパ、および中東の 20 を超える言語で高品質の多言語検索結果を実現します。
当社の商用サポートの検索用テキスト解析プラットフォームは、Google、Yahoo!、Bing などの大手検索エンジンで、アジア言語のテキストの文節処理、形態素解析による索引付けの改善、他の言語固有特性の適用による検索結果の適合率と再現率の向上を実現するために使用されています。エンタープライズ・サーチなど、お客様の検索アプリにも、dtSearch用コネクターを通して、Rosetteの言語解析機能をお使い頂けます。
従来、アジア言語、欧州言語、中東言語を同時にサポートするには、複数のベンダーによる複数のモジュールが必要でした。Rosetteは高速で高精度な多言語解析処理をdtSearchに提供します。同一のソースコードで対応しますので、サポート言語が1言語でも24言語でも、意識することなく実装できます。ベイシス・テクノロジーは、世界中のお客様に 15 年以上にわたってサポートを提供してきました。
インデックスおよびクエリー処理時に、Rosetteの 言語判別プロセッサーが瞬時に文書のエンコーディングを判別します。このプロセッサーは55言語と45のエンコーディングに対応しています。統計モデルによるアルゴリズムを用い、マニュアルで正確に編集したギガバイト単位のデータでトレーニングしています。
世界の言語のそれぞれが固有のものであるため、検索エンジンでは、最適な結果を得るために、各言語の固有の特性を理解する必要があります。Rosette は、語彙データ、ヒューリスティック規則、および統計モデルを組み合わせて、テキストの文節処理、形態素解析、固有表現抽出、名前のゆれの検索などを実行します。当社では、新しい言語解析アプローチを絶えず評価して、通常リリースでテクノロジーや語彙データを更新することで、お客様に最高の環境をお届けいたします。
当社のソフトウェアは、大手 Web 検索プロバイダーおよびエンタープライズ・サーチ・プロバイダーによって徹底的にテストされています。これらの大手企業は、20 を超える言語で高品質の検索結果を生成するために、Rosette を採用しています。当社のテクノロジーは、dtSearch環境で高スループットが得られるようにチューニングされており、また高い拡張性を誇っています。また弊社の知識豊富な技術陣が、日本語を始めとして、アラビア語、ロシア語など、あらゆる言語の検索をバックアップします。
Rosetteの機能をシームレスにお使い頂けるよう、dtSearch互換の言語アナライザーが付属しています。Windows用サンプルのビルド環境で生成したDLLを、dtSearchの言語アナライザーの所定のディレクトリーにコピーしてお使いください。アプリケーションに応じ、言語アナライザーのソースコードをカスタマイズすることもできます。評価版はここからお申し込みください。
dtSearch用Rosette言語アナライザーは、インデックスおよびクエリー時に、Rosette言語判別プロセッサーや形態素解析などと併用することが可能です。
言語判別プロセッサーは55言語と45のエンコーディングに対応: 多くの文書のインデックスにお使い頂けます。
ドイツ語、オランダ語、朝鮮語などの複合語を分解し、検索の再現率を向上します。
トークンの基本形化を行い、検索の再現率と適合率を向上します。
品詞出力を行い、検索の適合率と再現率を向上します。
固有表現抽出では固有表現を検出したり、それを用いたファセット検索を可能にします。