今日、多くの企業に於いて市場分析や意思決定にビッグデータの重要性が認識されていますが、ビッグデータの80%が、実はビッグテキストという事実はあまり知られていません。ビッグテキストは、文書、ウェブページ、およびデータベースに含まれている大量の「非構造化」テキストです。これらすべてはビッグデータの特質である3つの要素(量、速度、および種類)を備えています。ビッグテキストは、多くの言語を含み、複雑で困難な問題を抱えています。
非構造化テキストを有益な情報に変換する3ステップ:



テキスト解析がデータの活用を促進
非構造化テキストは、その性質上、一般の企業データソリューションでは不十分で、せっかくの情報の宝庫も、なかなか活用することができません。言語解析、統計モデリング、機械学習を組み合わせた高性能のテキスト解析は、ビッグテキストを正確に処理し、価値ある情報や有益なデータを取り出すのに役立ちます。
テキスト解析の適用分野:
- 情報検索
- ビジネスインテリジェンス
- eディスカバリー
- デジタルフォレンジック
- 金融コンプライアンス
