Rosette Name Indexer
様々な表記の名称を膨大なデータベースと照合
類似度評価により高精度でもれなく検出
製品概要
多様に表記された名前の的確な照合
ニックネーム、イニシャル、肩書き等、名前には様々なバリエーションがあります。また、他の言語での表記や綴りの間違いも考慮しなければなりません。その処理は公共機関や企業にとって大きな課題です。Rosette Name Indexer (多言語名称照合)は、共通の万能なインデックスにより、様々なバリエーションに左右されることなく、人名、地名、および組織名を、言語を超えて照合することができます。
言語学とコンピューター技術を熟知した専門家集団Basis Technologyは、サポート言語の追加、機能のアップデート、学術界からの最新技術の導入など、Rosette製品の改善を絶えず続けています。Name Indexer の照合技術は、業界最高レベルです。最先端技術を企業でもフルにご活用下さい。
異なる言語で表記された名前 | Mao Zedong ↔ Мао Цзэдун ↔ 毛泽东 |
意味の類似した名称 | Eagle Pharmaceuticals, Inc. ↔ Eagle Drugs |
金融コンプライアンス
昨今、テロリストによる資金アクセスの阻止は大きな課題ですが、金融機関ではRosette Name Indexer を利用して、警戒リストを管理・アップデートしてビジネスリスクの回避に役立てています。また、詐欺予防、マネーロンダリング、申請書類の調査などにもご利用頂いています。
製品の特長
- 22言語、13種類の表記ゆれパターンに対応
- Rosette SDKのコンポーネント
- シンプルなAPI
- 高い拡張性と処理能力
- 強力なサポート
- 簡単なインストール
- 柔軟でカスタマイズ可能
- 人名、地名、組織名と照合
- 一般の検索システムにはできない名前に特化した検索精度の向上
- 類似スコアで検出結果を評価
特徴
業界トップの名称照合技術
Rosette Name Indexer (多言語名称照合) は索引データに含まれる名前と照合し、信頼性スコアとともに結果を出力します。この「曖昧」検索機能は、雑多な文書や非構造化データから、欲しい名前を自動的に見つけ出すことができます。データベースに埋もれてしまった名前データを探す際にも有効です。
高価でありながら精度の低かった、異表記リストを使った従来のソリューションと異なり、Name Indexer は名称の要素の固有構造を解析し、言語学に基づいたアルゴリズムで高度な照合を行います。このアプローチは、異表記リスト以外の表記にも対応できますので、「誤検出」(一致間違い)および「検出漏れ」(ゼロヒットまたは一致逃れ)の両方を軽減します。名前の構成要素の一部のみが一致する場合、Name Indexer は入力された名前を調整して部分一致を認識します。
ニーズに沿ったカスタマイズが可能
Name Indexer の照合機能はは広範な名前に対応できますが、さらに、ユーザ設定機能を利用して、個々のニーズに合わせたカスタマイズも可能です。
- 信頼性スコアの最低閾値を設定して、検索結果の精度および再現性を調整
- タイトル、敬称などを停止語リストに追加し、照合時の名称から削除
- 特定の構成要素を、指定した信頼性スコアで強制一致(例:「Elizabeth」と「Lisbeth」は常に90%一致など)
- 特定の構成要素を、指定した信頼性スコアで強制一致(例:「John Doe」と「Joe Bloggs」は常に95%一致など)
- 複数の名前を一人の人物にリンク(例:「Marilyn Monroe」および「Norma Jeane Mortensen」の検索が同一人物を返す)
信頼性スコア
Name Indexerは、類似度の低い名前には、漸進的に信頼性スコアを下げます。
索引データ: Jesus Alfonso Lopez Diaz と照合した場合の信頼性スコア
スコア | 照合名 | 相違点 |
92 | Jesus Alfonso Lobez Deaz | +姓の綴り間違い |
84 | Jesus Alfonso Deaz | +母方の祖父の名前が欠落 |
80 | Jesus A. Deaz | +ミドルネームをイニシャルと置換 |
78 | Chuy A. Deaz | +ファーストネームをニックネームと置換 |
58 | Deaz, Chuy A. | +名称の要素の順番が逆 |
スペック
ご利用可能なプラットフォームなど
提供形態: | |
プラグイン: | |
プログラミング: |
対応言語
アラビア語 | フランス語 | 韓国語 | ロシア語 | ドイツ語 | パシュトゥ語 | |
ペルシャ語 | ウルドゥ語 | スペイン語 | 中国語(繁体字) | 英語 | 日本語 | |
ギリシャ語 | ハンガリー語 | タイ語 | ベトナム語 | ヘブライ語 | 中国語(簡体字) | |
イタリア語 | ポルトガル語 | ビルマ語 | クメール語 |
照合機能
同音で複数の綴りがある名称 | Jesus ↔ Heyzeus ↔ Haezoos |
音訳した際に複数の綴りがある名称 | Abdul Rasheed ↔ Abd al-Rashid |
さまざまな ニックネーム | William ↔ Will ↔ Bill ↔ Billy |
空白文字やハイフンが欠落している名称 | MaryEllen ↔ Mary Ellen ↔ Mary-Ellen |
称号と敬称 | Dr. ↔ Mr. ↔ Ph.D. |
名称の省略形 | McDonalds ↔ McDonald ↔ McD |
要素が一部欠落した名称 | Phillip Charles Carr ↔ Phillip Carr |
要素の順番が入れ替わった名称 | Diaz, Carlos Alfonzo ↔ Carlos Alfonzo Diaz |
名称のイニシャル | J. E. Smith ↔ James Earl Smith |
複数のデータベースフィールドに異なった組み合わせで要素が格納された名称 | Dick. Van Dyke ↔ Dick Van . Dyke |
多言語で書かれた同一人物の名称 | Mao Zedong ↔ Мао Цзэдун ↔ 毛泽东 ↔ 毛澤東 |
意味の類似している名称 | Eagle Pharmaceuticals, Inc. ↔ Eagle Drugs, Co. |
名称の多言語表記 | Nippon Telegraph and Telephone Corporation ↔ 日本電信電話株式会社 |
Demo
Cloud
Easy to use
Built for the most demanding text analytics applications and engineered to deliver high accuracy without sacrificing speed, Rosette Cloud is instantly accessible and offers a variety of plans to suit both startups and enterprises.
Our matching endpoint supports only pairwise matching, generating a match score for any two names, locations, or organizations entered by the user. If you need to search for name matches against extensive databases of entities, talk to our customer engineering team about evaluating our on-premise name indexing.
Try name matching and the rest of Rosette Cloud’s endpoints, signup today for a 30-day free trial!
Quality documentation and support
Customers love our thorough and responsive support team. We also provide in-depth documentation that lists all the features and functions of the various Rosette Cloud endpoints along-side examples in the binding of your choice.
Visit our GitHub for the binding and documentation.
Enterprise ready
Evaluate Rosette’s functional fit with your business and data needs on Rosette Cloud knowing that scalable, customizable, enterprise deployments are available if you need them.
{ "name1": { "text": "Влади́мир Влади́мирович Пу́тин", "language": "rus", "entityType": "PERSON" }, "name2": { "text": "Vladimir Putin", "language": "eng", "entityType": "PERSON" } } { "result": { "score": 0.9486632809417912 } }
Enterprise
ニーズに合わせたカスタマイズが可能
Docker コンテナなどでローカルにインストールでき、オンプレミス環境下でWeb API またはSDK でご利用でいただけます。
膨大なデータ量を抱え、独自の統合ニーズを持ちながらもデータセキュリティに制約のある組織向けに、社内サーバー上にホストされる Rosette Enterprise をご用意しております。
弊社製品に関するお問い合わせおよび Enterprise版のご利用をご希望の方は、下記のフォームに必要事項をご記入のうえ、お気軽にご相談ください。
連絡
EMAIL:
info@basistech.jp
電話:
03-6807-5928