Rosette® 固有表現抽出システム (REX: Rosette Entity Extractor) は、高度な言語学技術を駆使した、キーワードを検出および抽出するシステムです。Eメール、文書ファイル、あるいはインターネット経由で入手される、大量のデータを処理するシステムにおいて、人名、地名、メールアドレス、URLなど、特定の単語やフレーズ(句)などの固有表現の抽出ができ、効率よいテキスト処理ができます。
REX は、抽出すべき語の「文脈パターン」を事前学習させて抽出させるシステムで、情報検索、CRM、ビジネスインテリジェンスなどのアプリケーションに使用されます。REX の言語モデルに、そのパターンが既に組み込まれているので、ユーザーによるプログラミングや学習の必要はありません。
抽出できる語句(例)は以下のとおりです。
抽出すべき語の「文脈パターン」を事前学習し、抽出。人名、地名、組織名を識別。
与えられた正規表現と一致するパターンの文字列を抽出。 ※ ユーザー定義のパターン抽出も可能。
日時、電話番号、URL、Eメールアドレス、クレジットカード番号、通貨など。
ユーザーが指定した語句と一致したものを抽出。
情報検索、テキストマイニング、デジタル・フォレンジックをはじめ、コンピューターを利用した犯罪調査、および防衛・諜報分野やその他多くのソフトウェアシステムに、より高度なキーワード抽出を可能にします。
日本語版のほか、以下の言語対応版も用意しております。
朝鮮語、中国語、アラビア語、チェコ語、オランダ語、英語、近代ペルシア語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、イタリア語、ポーランド語、ポルトガル語、パシュトゥ語、ロシア語、スペイン語、ダリ語、ウルドゥ語