Rosette 欧州語形態素解析システム
様々な欧州語を適切に形態素解析
欧州言語テキストをより正確にテキストマイニングおよび情報検索するためには、事前に文書を形態素解析する必要があります。Basis TechnologyのRosette 形態素解析システムは、ドイツ語でよく使われる複合名詞や、フランス語の短縮形(“l’eau” の ”l”) などの処理を適確におこない、アプリケーションにおける言語特有な処理の課題解決に役立ちます。
特長
-
基本化および見出し語出力
-
品詞解析
| 入力 | 出力 |
|---|
| éditeurs | Plural Noun |
| Heiße | Adjective |
-
複合名詞
| 入力 | 出力 |
|---|
| Kontrollsysteme | [Kontroll] [systeme] |
| Jugendarbeit | [Jugend] [arbeit] |
欧州語形態素解析システムは、チェコ語、オランダ語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、イタリア語、ポーランド語、ポルトガル語、ロシア語、スペイン語を現在リリースしており、その他の言語版も開発中です。今後のリリース等に関するお問合せは、info@basistech.com までご連絡ください。
「Basis Technologyの欧州語形態素解析システムは、InQuira6のオンラインセルフサービス用プラットフォームの多言語機能強化に役立っています。 Basis Technologyの製品を採用した理由は、同社の提供する、優れた情報検索のための言語ツールおよび卓越した製品サポートにおける実績によるものです。Basis Technologyの技術により、弊社製品をグローバル企業の顧客にすばやく提供できるようになりました。」
InQuira、
Vice President of Product Management、
— Willie Kim氏 —