適用分野
ホーム»適用分野»dtSearch

対応言語

  • 日本語
  • 中国語簡体字
  • 中国語繁体字
  • 朝鮮語
  • 英語
  • フランス語
  • ドイツ語
  • イタリア語
  • スペイン語
  • アラビア語
  • アルバニア語
  • ブルガリア語
  • カタロニア語
  • クロアチア語
  • チェコ語
  • デンマーク語
  • オランダ語
  • エストニア語
  • フィンランド語
  • ギリシャ語
  • ヘブライ語
  • ハンガリア語
  • インドネシア語
  • ラトビア語
  • マレー語
  • ノルウェー語
  • パシュトゥ語
  • ペルシャ語
  • ポーランド語
  • ポルトガル語
  • ルーマニア語
  • ロシア語
  • セルビア語
  • スロバキア語
  • スロベニア語
  • スウェーデン語
  • タイ語
  • トルコ語
  • ウクライナ語
  • ウルドゥ語

dtSearchエンジン用Rosetteコネクター

dtSearch用多言語サポート

文書検索エンジンである dtSearch に、ベイシス・テクノロジーのRosette言語解析機能をお使いいただけます。多くの言語での深い言語処理および高精度の検索結果を実現するために、大手企業の皆様に当社の製品をご使用いただいています。言語プラグインにより、アジア、ヨーロッパ、および中東の 20 を超える言語で高品質の多言語検索結果を実現します。

dtSearch logo

Web 検索大手によって選択される言語処理

当社の商用サポートの検索用テキスト解析プラットフォームは、Google、Yahoo!、Bing などの大手検索エンジンで、アジア言語のテキストの文節処理、形態素解析による索引付けの改善、他の言語固有特性の適用による検索結果の適合率と再現率の向上を実現するために使用されています。エンタープライズ・サーチなど、お客様の検索アプリにも、dtSearch用コネクターを通して、Rosetteの言語解析機能をお使い頂けます。

dtSearchで多言語サポートを簡単に実現

従来、アジア言語、欧州言語、中東言語を同時にサポートするには、複数のベンダーによる複数のモジュールが必要でした。Rosetteは高速で高精度な多言語解析処理をdtSearchに提供します。同一のソースコードで対応しますので、サポート言語が1言語でも24言語でも、意識することなく実装できます。ベイシス・テクノロジーは、世界中のお客様に 15 年以上にわたってサポートを提供してきました。

言語ごとの正確なインデックス処理

インデックスおよびクエリー処理時に、Rosetteの 言語判別プロセッサーが瞬時に文書のエンコーディングを判別します。このプロセッサーは55言語と45のエンコーディングに対応しています。統計モデルによるアルゴリズムを用い、マニュアルで正確に編集したギガバイト単位のデータでトレーニングしています。

あらゆる言語的問題に対するソリューション

世界の言語のそれぞれが固有のものであるため、検索エンジンでは、最適な結果を得るために、各言語の固有の特性を理解する必要があります。Rosette は、語彙データ、ヒューリスティック規則、および統計モデルを組み合わせて、テキストの文節処理、形態素解析、固有表現抽出、名前のゆれの検索などを実行します。当社では、新しい言語解析アプローチを絶えず評価して、通常リリースでテクノロジーや語彙データを更新することで、お客様に最高の環境をお届けいたします。

信頼性の高いスピードおよび精度

当社のソフトウェアは、大手 Web 検索プロバイダーおよびエンタープライズ・サーチ・プロバイダーによって徹底的にテストされています。これらの大手企業は、20 を超える言語で高品質の検索結果を生成するために、Rosette を採用しています。当社のテクノロジーは、dtSearch環境で高スループットが得られるようにチューニングされており、また高い拡張性を誇っています。また弊社の知識豊富な技術陣が、日本語を始めとして、アラビア語、ロシア語など、あらゆる言語の検索をバックアップします。

数時間で評価とデプロイ可能

Rosetteの機能をシームレスにお使い頂けるよう、dtSearch互換の言語アナライザーが付属しています。Windows用サンプルのビルド環境で生成したDLLを、dtSearchの言語アナライザーの所定のディレクトリーにコピーしてお使いください。アプリケーションに応じ、言語アナライザーのソースコードをカスタマイズすることもできます。評価版はここからお申し込みください。

dtSearch用Rosette言語アナライザーは、インデックスおよびクエリー時に、Rosette言語判別プロセッサーや形態素解析などと併用することが可能です。

  • 言語判別プロセッサーは55言語と45のエンコーディングに対応: 多くの文書のインデックスにお使い頂けます。

  • 中国語日本語朝鮮語など、単語間のスペースのない言語でも、正確に分節を行ないます。

  • ドイツ語、オランダ語、朝鮮語などの複合語を分解し、検索の再現率を向上します。

  • トークンの基本形化を行い、検索の再現率と適合率を向上します。

  • 品詞出力を行い、検索の適合率と再現率を向上します。

  • 固有表現抽出では固有表現を検出したり、それを用いたファセット検索を可能にします。

お問い合わせ

Error

詳細は以下のフォームからお問い合わせください。折り返しご連絡差し上げます。

「* 印の項目は必ず入力してください」