Airbnb


Case Study

柔軟な人名照合で確実な身元認証 ゲストもホストも安心予約

Airbnb について

Airbnb (エアビーアンドビー)は、部屋、アパート、別荘等を貸し出す個人の家主と、1 泊、1 週間、あるいは 1 カ月滞在する旅行者をつなげるユニークなサービスを提供しています。このコミュニティー・マーケットプレイス型宿泊施設の輪は、世界190 カ国、34,000 都市に広がっています。登録者は 1,700 万人を超えており、800,000 件を超える宿泊施設リストからどこに泊まるかを選択できます。

ユーザーは、Web または携帯電話を利用して、宿泊施設を予約したり、逆に自分の部屋や空きスペースなどを貸して、賃料を得ることができます。オンラインの世界とオフラインの世界をつないで十分な情報を得て意思決定するためのツールをユーザーに提供する新しい手段が求められるようになりました。そのため、Airbnb は(本人確認として)認証済み ID を導入しました。

“事業がグローバルに展開されているため、Airbnb の認証済み ID プロセスでは、さまざまな言語で名前を照合できるようになっています。また、使用される文字はA から Z までのローマ字だけではありません。”

課題

「信頼」は、シェアリング・エコノミー (共有型経済)の基盤です。信頼に基づいたコミュニティーにおいて匿名はありえません。そのため、Airbnb は、できる限り最適な意思決定ツールをユーザーに提供することを第一に考えてきました。創業以来、プロフィールとレビュー情報が Airbnb を利用する際の唯一の判断材料となっていましたが、オンラインの世界とオフラインの世界をつないで十分な情報を得て意思決定するためのツールをユーザーに提供する新しい手段が求められるようになりました。そのため、Airbnb は(本人確認として)認証済み ID を導入しました。

認証済み ID により、オンラインの ID とオフラインの ID を関連付けることができます。Airbnb ユーザーは、既存の Airbnb でのレビュー、LinkedIn、または Facebook によってオンライン ID を提供し、個人情報の確認や写真付き身分証明書のスキャンなどによってオフラインとオンラインの情報を関連付けることで、「認証済み ID」バッジを獲得できます。認証を成功させるには、オンラインとオフラインにおける ID の名前が一致している必要があります。

人名照合とは?

人名照合は、認証済み ID プロセスにおける重要な要素です。事業がグローバルに展開されているため、Airbnb の認証済み ID プロセスでは、さまざまな言語で名前を照合できるようになっています。また、使用される文字はA から Z までのローマ字だけではありません。ユーザーは以前から、キリル文字(ロシア語、ブルガリア語、セルビア語などで使用)で名前を入力していました。

machine learning-powered name matching

人名照合が難しい理由

Airbnb には多数の優秀なエンジニアが在籍しているため、当初Airbnb では、人名照合機能の自社構築を検討しました。そしてその結果について、McCabe 氏は次のように述べています。「多言語の課題は複雑で、多くのリソースが必要であることがわかりました。さらに、購入可能なソリューションはそれほど多くありませんでした」

通常、人名照合は、他業種において異なる用途で使用されており、多くの場合、非常に大規模なソリューションにおけるコンポーネントの一つです。こうしたソリューションは通常、非常に高価である上、扱いにくくて複雑です。

結果として、社内における独自の人名照合機能の構築も、既存システムの購入も選択肢としてありませんでした。

Basis Technologyを選んだ理由

最終的に、コストと柔軟性が決定要因になりました。

Basis Technology の Rosette 名称照合モジュール は、非常に柔軟性が高く正確なソフトウェアです。Rosette 名称照合モジュールでは、さまざまな言語および文化における名前の由来と構造を考慮に入れたアルゴリズムに基づいて、名前を照合します。この人名照合機能は、システムに組み込むか、アプリケーションから Web サービスとして呼び出すことができます。

challenges of name matching

Rosette 名称照合モジュール では、10 カ国語それぞれの文字体系において、人名、地名、組織名の照合時に表記揺れを考慮しています。このモジュールのファジー照合では、音韻による表記ゆれ(「Cairns」、「Kearns」、「Kerns」)、ニックネーム(「William」、「Will」、「Bill」、「Billy」)、語順の入れ替え(「Ichiro Suzuki」と「Suzuki Ichiro」)、多言語照合と翻訳による翻訳ゆれ(「Sergei Rachmaninoff」、「Sergey Rachmaninov」、「Серге́й Васи́льевич Рахма́нинов」)などが認識されます。

McCabe 氏は次のように述べています。「採用可能であった他のソリューションは、政府や金融機関など、別の用途向けに構築されていました。当社の場合は、そうしたものよりもシンプルでした。そのため、人名照合機能を従来とは異なる用途に使用する当社を快く支援してくれる Basis Technology のような会社は、非常にありがたいものでした」。

問題の解決

Basis Technology の Rosette を選択した後に、Airbnb のエンジニアは人手によるテストを実施し、十分に信頼できる照合が実現されていると結論付けました。

McCabe 氏は次のようにも述べています。「Basis が、ソリューションをつなげる役割を果たしてくれたので、人名照合機能を扱うために当社がしなければならないことはほとんどありませんでした。人名照合機能は基盤となるコンポーネントですが、同時に、ソリューションに組み込んだ後にすべき作業はほとんどありません。最終的に、数カ国語で既に構築されているものを採用することで非常に満足しています。これにより、多くの時間を節約して、認証コンポーネント自体に注力することができました」

2014 年 1 月現在、Airbnbの登録者は 1,700 万人おり、その数は毎月 100 万人ほど増加しています。2012 年にはAirbnb で 2 秒に 1 泊の予約が記録されています。

rosette

世界中で利用されている多言語対応の
テキスト解析ソフトウェア

Do even more with Rosette

Relationship Extraction · Sentiment Analysis

Categorization

Learn More
autopsy

世界で最も多く利用されている簡単操作のオープンソース・デジタルフォレンジックツール

Learn More
cyber-triage

実用的、自動的、エージェントレスなエンドポイントレスポンス

Learn More
konasearch

Salesforce search that works

Learn More
rosette

Natural language understanding for enterprise applications

Do even more with Rosette

Relationship Extraction · Sentiment Analysis

Categorization

Learn More
autopsy

The premier open source platform for forensic investigators and tool developers

Learn More
cyber-triage

Practical, automated, agentless endpoint response

Learn More
konasearch

Salesforce search that works

Learn More