メディア(媒体)解析(DOCEX)のトリアージと分析

日常データから意味のある情報取得をソフトウェアがサポート

弊社ソフトウェアは「見えない点」を「見える」ようにし、捜査官が情報と情報を結びつけられるようサポートします。「見えない点」とは、例えば膨大な押収データや携帯電話に含まれるアラビア語チャットのアルファベットのように、英語以外で表記されたデータです。

Basis Technologyの技術に各国の政府機関が注目

各国の政府機関や米国防総省、米国連邦捜査局(FBI)などをはじめとした米政府機関が、中国語、アラビア語、ダリ語、ファルシ語、パシュトゥ語、ウルドゥ語などの情報収集にベイシス製品を使用しています。弊社の言語解析技術や人名・地名抽出システムが的確な情報収集を実現し、またテロリストや要注意人物リストとの照合を行い、アナリストや言語学者の仕事をサポートします。

DOCEXをすべての言語に展開

Rosette言語処理プラットフォームは、膨大なデータから55カ国の言語を自動的に判別し、人名や地名を抽出します。また英語以外で書かれたデータから、人名・地名を英語表記に変換することもできます。処理結果はレポートとして見やすい形に加工したり、警報システムに送ることも可能です。

DOCEXスクリーニング・プラットフォームの構築に

処理能力が高く拡張性の高い弊社のDOCEXコンポーネントは、緊急性の高いデータから情報を迅速に取得するDOCEXアプリケーション構築に欠かせません。また処理速度に影響を及ぼすことなく既存のアプリケーション組み込んで、必要な機能と言語を実装することもできます。

固有表現抽出および人名・地名照合がリンク解析や警報システムをサポート

弊社のDOCEXコンポーネントは、固有表現抽出(人名、場所、組織など)と人名・地名照合機能を提供します。これらの情報はリンク解析や警報システムに欠かせない、基本となるデータです。Rosette固有表現抽出モジュールは17の言語に対応しています。またユーザーが固有表現を追加することもできます。Rosette名称照合モジュールは、つづりの違いや表記ミス、外国語表記など、あらゆる表記に対応し、人名・地名を照合することができます。中国語、英語、アラビア語、ダリ語、パシュトゥ語などに対応しています。

完結したDOCEXパイプライン

sample-rnt-5

Rosette固有表現抽出モジュールが、データから人名や地名を抽出します。英語以外で表記された人名・地名は、Rosette名称翻訳モジュールが英語表記に変換しますので、言語学者がいなくても、大まかな情報を把握することができます。検索アプリケーションに組み込めば、Rosette人名・地名照合モジュールがインデックスを処理しますので、アラビア語、朝鮮語、ペルシャ語、パシュトゥ語などのデータでも、すべて英語で検索することができるようになります。

Rosette固有表現抽出モジュールとRosette名称翻訳モジュールの組み合わせは、人名・地名の抽出を行なってから、それらを変換しますので、商用の機械翻訳システムよりも処理能力に優れています。

Supported Platforms

Linux, Unix, Windows, Mac