ビッグデータから情報を引き出すテキスト解析


今日、多くの企業に於いて市場分析や意思決定にビッグデータの重要性が認識されていますが、ビッグデータの80%が、実はビッグテキストという事実はあまり知られていません。ビッグテキストは、文書、ウェブページ、およびデータベースに含まれている大量の「非構造化」テキストです。これらすべてはビッグデータの特質である3つの要素(量、速度、および種類)を備えています。ビッグテキストは、多くの言語を含み、複雑で困難な問題を抱えています。

非構造化テキストを有益な情報に変換する3ステップ:

text analytics

文書の収集・選択

text analytics

エンティティの抽出

text analytics

情報を結び付ける

テキスト解析がデータの活用を促進

非構造化テキストは、その性質上、一般の企業データソリューションでは不十分で、せっかくの情報の宝庫も、なかなか活用することができません。言語解析、統計モデリング、機械学習を組み合わせた高性能のテキスト解析は、ビッグテキストを正確に処理し、価値ある情報や有益なデータを取り出すのに役立ちます。

テキスト解析の適用分野:

  • 情報検索
  • ビジネスインテリジェンス
  • eディスカバリー
  • デジタルフォレンジック
  • 金融コンプライアンス
what is text analytics

Basis Technology のテキスト解析ソフトウェア

Rosette SDKs

ベイシステクノロジーの Rosette® は多言語対応のテキスト解析ソフトウェア群です。アプリケーションに統合することで、多量のテキストから情報を取り出すために必要な言語解析機能を簡単に追加できます。

もっと見る

Rosette API

多言語テキストから有益な情報を取り出すのに役立つ多様な言語解析機能を Cloud API で手軽に使用できます。製品評価、研究、新サービスの立ち上げなどに最適です。簡単な契約で無料試用から開始できます。

もっと見る