アラビア語チャット翻訳

Rosette チャット翻訳モジュール‐アラビア語

アラビア語のチャットを標準アラビア語に翻訳します

本製品はアルファベット表記されたアラビア語のチャットを、標準アラビア文字に変換します。あらゆるアプリケーションに組み込んで使うことができる、アラビア語ソーシャルメディアモニタリングに欠かせないツールです。

実績ある言語処理技術

Basis Technologyの言語処理技術はGoogle、Yahoo!、Bingなど、大手検索エンジンや政府機関から採用された実績を持ち、各国語の解析や検索に役立っています。弊社製品は、常に最新のデータセットでトレーニングされ、精度の高さと幅広い適応能力を誇ります。

アルファベット表記のアラビア語チャットをアラビア文字に変換

アラビア語チャット(別名Arabizi)は、その入力の手軽さからTwitterやブログ、チャットアプリなどのソーシャルメディアで広く使われています。しかし今日までこのようなテキスト情報を解析できるツールはありませんでした。チャットではアラビア文字を、音や形の似た数字やアルファベットに置き換えて入力しますが、書く人によって表記方法は様々です。

sample-chat-to-standard


どんなアプリにも組み込めます

Rosette®チャット翻訳モジュールーアラビア語(RCT: Rosette Chat Translator for Arabic)は、JavaのクラスライブラリーやWebサービスなどあらゆるソフトウェア環境に組み込むことができます。マルチスレッドやマルチコアに対応した、処理能力と拡張性の高い製品です。

「方言」から書き手の地域を特定

アラビア語のチャットにはいわゆる「方言」が存在し、それを元に書き手がどの地域かを特定できます。アラビア語の発音自体にも各地でばらつきがありますし、使われる語彙も異なるため、アルファベット表記もそれに応じて各地で異なります。Rosetteはチャット情報を標準アラビア語に変換すると同時に、チャットの「方言」から書き手の地域を特定します。

アラビア語は25カ国以上で使われている言語で、これらの「方言」を理解することはチャット情報を標準アラビア語に変換する際に欠かせません。例えば“陰謀”という語に相当するアラビア語は、エジプト、サウジアラビア、モロッコで以下のように異なったアルファベット表記を用います。

sample-conspiracy-in-chat

Rosetteチャット翻訳モジュール-アラビア語は

  • 「方言」からチャットの書き手の地域を特定
  • 地域によって異なるアルファベット表記のチャットを標準アラビア語に変換

億単位のチャット語彙によるトレーニング

辞書に依存する従来の機械翻訳と違い、RCTはアルゴリズムと統計的手法を採用しています。アルゴリズムは形態素解析を行い、各語の最適な変換候補を導き出します。数千にも及ぶウェブサイトから3億以上のチャット語彙を収集し、それを元にトレーニングされた統計モデルは、アルゴリズムの導き出した変換候補のランク付けを行ないます。

アラビア語ソーシャルメディアモニタリングの実現

Rosetteの言語処理機能と組み合わせて、チャット翻訳システムが変換した標準アラビア語テキストを言語判別し、基本言語解析や固有表現抽出(キーワード抽出)も行なえます。Rosetteがあれば、アルファベット表記であれ、標準アラビア語であれ、ウェブ上に存在するあらゆるアラビア語情報を解析できます。


お問合せフォーム

詳細は以下のフォームからお問い合わせください。折り返しご連絡差し上げます。
但し、個人の方からのお問い合わせには、ご対応いたしかねます。ご了承ください。
「* 印の項目は必ず入力してください」

This is a unique website which will require a more modern browser to work! Please upgrade today!