Airbnb


Case Study

柔軟な人名照合で確実な身元認証 ゲストもホストも安心予約

19 7月 2018
Download PDF

Airbnb について

Airbnb (エアビーアンドビー)は、部屋、アパート、別荘等を貸し出す個人の家主と、1 泊、1 週間、あるいは 1 カ月滞在する旅行者をつなげるユニークなサービスを提供しています。このコミュニティー・マーケットプレイス型宿泊施設の輪は、世界190 カ国、34,000 都市に広がっています。登録者は 1,700 万人を超えており、800,000 件を超える宿泊施設リストからどこに泊まるかを選択できます。

ユーザーは、Web または携帯電話を利用して、宿泊施設を予約したり、逆に自分の部屋や空きスペースなどを貸して、賃料を得ることができます。オンラインの世界とオフラインの世界をつないで十分な情報を得て意思決定するためのツールをユーザーに提供する新しい手段が求められるようになりました。そのため、Airbnb は(本人確認として)認証済み ID を導入しました。

“事業がグローバルに展開されているため、Airbnb の認証済み ID プロセスでは、さまざまな言語で名前を照合できるようになっています。また、使用される文字はA から Z までのローマ字だけではありません。”

課題

「信頼」は、シェアリング・エコノミー (共有型経済)の基盤です。信頼に基づいたコミュニティーにおいて匿名はありえません。そのため、Airbnb は、できる限り最適な意思決定ツールをユーザーに提供することを第一に考えてきました。創業以来、プロフィールとレビュー情報が Airbnb を利用する際の唯一の判断材料となっていましたが、オンラインの世界とオフラインの世界をつないで十分な情報を得て意思決定するためのツールをユーザーに提供する新しい手段が求められるようになりました。そのため、Airbnb は(本人確認として)認証済み ID を導入しました。

認証済み ID により、オンラインの ID とオフラインの ID を関連付けることができます。Airbnb ユーザーは、既存の Airbnb でのレビュー、LinkedIn、または Facebook によってオンライン ID を提供し、個人情報の確認や写真付き身分証明書のスキャンなどによってオフラインとオンラインの情報を関連付けることで、「認証済み ID」バッジを獲得できます。認証を成功させるには、オンラインとオフラインにおける ID の名前が一致している必要があります。

人名照合とは?

人名照合は、認証済み ID プロセスにおける重要な要素です。事業がグローバルに展開されているため、Airbnb の認証済み ID プロセスでは、さまざまな言語で名前を照合できるようになっています。また、使用される文字はA から Z までのローマ字だけではありません。ユーザーは以前から、キリル文字(ロシア語、ブルガリア語、セルビア語などで使用)で名前を入力していました。

machine learning-powered name matching

人名照合が難しい理由

Airbnb には多数の優秀なエンジニアが在籍しているため、当初Airbnb では、人名照合機能の自社構築を検討しました。そしてその結果について、McCabe 氏は次のように述べています。「多言語の課題は複雑で、多くのリソースが必要であることがわかりました。さらに、購入可能なソリューションはそれほど多くありませんでした」

通常、人名照合は、他業種において異なる用途で使用されており、多くの場合、非常に大規模なソリューションにおけるコンポーネントの一つです。こうしたソリューションは通常、非常に高価である上、扱いにくくて複雑です。

結果として、社内における独自の人名照合機能の構築も、既存システムの購入も選択肢としてありませんでした。

Basis Technologyを選んだ理由

最終的に、コストと柔軟性が決定要因になりました。

Basis Technology の Rosette 名称照合モジュール は、非常に柔軟性が高く正確なソフトウェアです。Rosette 名称照合モジュールでは、さまざまな言語および文化における名前の由来と構造を考慮に入れたアルゴリズムに基づいて、名前を照合します。この人名照合機能は、システムに組み込むか、アプリケーションから Web サービスとして呼び出すことができます。

challenges of name matching

Rosette 名称照合モジュール では、10 カ国語それぞれの文字体系において、人名、地名、組織名の照合時に表記揺れを考慮しています。このモジュールのファジー照合では、音韻による表記ゆれ(「Cairns」、「Kearns」、「Kerns」)、ニックネーム(「William」、「Will」、「Bill」、「Billy」)、語順の入れ替え(「Ichiro Suzuki」と「Suzuki Ichiro」)、多言語照合と翻訳による翻訳ゆれ(「Sergei Rachmaninoff」、「Sergey Rachmaninov」、「Серге́й Васи́льевич Рахма́нинов」)などが認識されます。

McCabe 氏は次のように述べています。「採用可能であった他のソリューションは、政府や金融機関など、別の用途向けに構築されていました。当社の場合は、そうしたものよりもシンプルでした。そのため、人名照合機能を従来とは異なる用途に使用する当社を快く支援してくれる Basis Technology のような会社は、非常にありがたいものでした」。

問題の解決

Basis Technology の Rosette を選択した後に、Airbnb のエンジニアは人手によるテストを実施し、十分に信頼できる照合が実現されていると結論付けました。

McCabe 氏は次のようにも述べています。「Basis が、ソリューションをつなげる役割を果たしてくれたので、人名照合機能を扱うために当社がしなければならないことはほとんどありませんでした。人名照合機能は基盤となるコンポーネントですが、同時に、ソリューションに組み込んだ後にすべき作業はほとんどありません。最終的に、数カ国語で既に構築されているものを採用することで非常に満足しています。これにより、多くの時間を節約して、認証コンポーネント自体に注力することができました」

2014 年 1 月現在、Airbnbの登録者は 1,700 万人おり、その数は毎月 100 万人ほど増加しています。2012 年にはAirbnb で 2 秒に 1 泊の予約が記録されています。

Airbnb


Case Study

Rosette Name Matching Keeps Guests and Hosts Booking “Without Reservations”

Download PDF

About Airbnb

Airbnb puts the “unique” into travel by connecting private owners renting out a room, apartment, castle, or villa to travelers staying a night, a week, or a month. This community marketplace of accommodations spans 34,000 cities and 190 countries. More than 17 million guests have over 800,000 listings to choose from. People can book accommodations or monetize extra space through the web or their mobile phone.

“given the international nature of their business, Airbnb’s Verified ID process helps users match names that originate in multiple languages, and in more than just the Roman A-to-Z alphabet”

The Challenge

Trust is foundational to the sharing economy. There is no place for anonymity in a community based on trust. That’s why Airbnb is dedicated to providing their users with the best decision-making tools possible. While profiles and reviews have been core to the Airbnb experience since the beginning, it became more important to find new ways to connect the online and offline worlds to provide users with even more tools to make informed decisions. That’s why Airbnb introduced Verified ID.

Verified ID helps provide a connection between the online and offline identities. Airbnb users can earn a “Verified ID” badge on their profile by providing their online identity (via existing Airbnb reviews, LinkedIn, or Facebook) and matching it to offline ID documentation, such as confirming personal information or scanning a photo ID. The name provided by both channels must match for verification to succeed.

What Is Name Matching?

Name matching is a key component of the Verified ID process. And, given the international nature of their business, Airbnb’s Verified ID process helps users match names that originate in multiple languages, and in more than just the Roman A-to-Z alphabet. Users were already inputting their names using the Cyrillic alphabet (used by Russian, Bulgarian, Serbian, among other languages).
machine learning-powered name matching

What’s So Hard About Name Matching?

Airbnb is loaded with talented engineers, so their first thought was to ask their developers to investigate building a name matcher exclusively in-house. Once they got into scoping out the work though, “We started to see the challenges across languages to be resource intensive and complex,” said Marc McCabe, Airbnb’s Business Development Lead. “And there just aren’t many solutions out there.”

Most commonly, name matching is used in other industries for different use cases. Name matching functionality is often a component of a much larger solution that is typically expensive, unwieldy, and complex.

So building their own name matcher wasn’t an attractive solution, but neither was buying an existing system.

Why Choose Basis Technology?

In the end, the choice came down to cost and flexibility.

Basis Technology’s name matching is a functionality of Rosette®, highly flexible and accurate text analytics software. It intelligently matches names based on algorithms that take into account the origins and structure of names from different languages and cultures. The name matching functionality can be plugged into a system through a software development kit, or called as a web API by applications of any type.

challenges of name matching

Rosette recognizes spelling variations when matching names of people, places, and organizations in 15 languages in their native scripts.  Its fuzzy matching recognizes differences such as phonetic variation (“Cairns”, “Kearns”, “Kerns”); nicknames (“William”, “Will”, “Bill”, “Billy”); swapped word order (“Ichiro Suzuki” and “Suzuki Ichiro”); cross-lingual matching and transliteration variations (“Sergei Rachmaninoff,” “Sergey Rachmaninov,” “Серге́й Васи́льевич Рахма́нинов”), and more.

“Other solutions that we could have adopted were built for different use cases, such as government and finance. We had a simpler use case,” McCabe said. “So for us to find a company like Basis Technology willing to work with us to use a name matcher in other ways was very helpful.”

Problem Solved

Once Airbnb chose Basis Technology’s Rosette, their engineers did some manual tests and concluded the matches provided a good level of confidence.
“Basis is the glue in the solution for us. It’s successful by how little we need to deal with it [the name matcher]. It’s a fundamental piece, and also the piece we have to interact with the least once we integrated the solution,” McCabe said. “In the end, we were much happier to go with something already built out in a few languages. It saved us a lot of time to focus on the actual verification piece,” McCabe said.

In January of 2014, Airbnb is at 17 million guests all time and is adding about one million guests per month.  In 2012, Airbnb estimated that a night was being booked every 2 seconds!

autopsy

世界で最も多く利用されている簡単操作のオープンソース・デジタルフォレンジックツール

Learn More
cyber-triage

実用的、自動的、エージェントレスなエンドポイントレスポンス

Learn More
rosette

Natural language understanding for enterprise applications

Do even more with Rosette

Relationship Extraction · Sentiment Analysis

Categorization

Learn More
autopsy

The premier open source platform for forensic investigators and tool developers

Learn More
cyber-triage

Practical, automated, agentless endpoint response

Learn More
konasearch

Salesforce search that works

Learn More