Facebookで何を「いいね！」したか？という情報だけを元にあなたの特性を予測できるという事が、いかに危険か／ジェニファー・ゴルベック

＠動画 > 科学・技術 > Facebookで何を「いいね！」したか？という情報だけを元にあなたの特性を予測できるという事が、いかに危険か／ジェニファー・ゴルベック

2014年4月18日科学・技術タグ: TED, ビッグデータ

Facebookで何を「いいね！」したか？という情報だけを元にあなたの特性を予測できるという事が、いかに危険か／ジェニファー・ゴルベック

コンピュータ科学者のジェニファー・ゴルベックさんが、FaceBookで何かを「いいね！」したとき、それとは直接関係のない「あなたの性格」をつかまれてしまう事を、どうやってそんなことが可能なのか？という技術的な観点から解説し、この技術の応用が必ずしも好ましいとは限らないことを警告。自分の情報をコントロールする力をユーザーの手に戻すべきであると主張しています。

（所要時間：約10分）

この動画を大きい画面で見る

動画の内容 （全文書き起こし）

ウェブが最初の10年間どんなだったか覚えていますか？固定的なものでしたネットにつなげサイトを見ることはできましたが当時それはそのための部署を持つ組織やコンピュータに精通した個人が立ち上げたものでした 2000年代初期にソーシャルメディアやソーシャルネットワークが登場するとウェブは大きく変容を遂げ今や私たちの見るコンテンツの大部分が一般的なユーザーによる YouTubeのビデオ、ブログ製品のレビューやソーシャルメディアでの投稿で占められていますまた人々が互いにやり取りをする場へと変化していますコメントしたり情報を共有したりしただ情報を見るだけではないのです

フェイスブックはこのような場として唯一ではないものの最大です数字を見れば分りますフェイスブックには月間ユーザーが12億いますつまり地球上のインターネット人口の半分がフェイスブックを利用しています他のサイトと同様に ITのスキルが殆どなくてもネット上の人格を作ることができるそんなサイトであり人々は個人的な情報を大量に投稿してきたのです

その結果何億という人々の行動パターン好みや人口統計データなどが得られるのですこんなことは過去には有りませんでした私のようなコンピュータ科学者にとってこれは意味深く私は人々が共有した情報から本人が公開しているとは思いもしない多くの隠された特性を予測できるモデルを構築することができました科学者はそれによって人々のネット上での交流を手助け出来るのですがそんなに利他的でない応用もあります

問題はユーザーがこの様な技術の存在やしくみを理解せずたとえ知っていたとしてもコントロールする手段が無いことです私が今日お話ししたいことはこういうことに対して我々が何をできるかそして我々の手にいくらかコントロールを取り返すアイデアについてです

これはTargetという会社のロゴこの哀れな妊婦のお腹にロゴを意味もなく貼りつけたのではありません雑誌フォーブスに載った逸話をご覧になったかもしれません Targetはこの15歳の少女が親に妊娠を打ち明ける2週も前に哺乳瓶、おむつ、ベビーベッドの広告とクーポン券を送りつけたのです父親は激怒しました Targetは親さえ知らない高校生の少女の妊娠をどうして知っていたのか？

判明したことは彼らには何十万という顧客の購入履歴データがあり彼らが言う所の妊娠スコアというものを計算したのです単に妊娠の判断だけでなく予定日の推定さえするのですすぐそれと分かる購入品例えばベビーベッドや赤ちゃん服だけでなくいつもよりビタミン剤を多めに買ったとかおむつを入れるのに必要であろう大きな手さげカバンを買ったということから推測するのですそれぞれの物は購入したからと言って何かがばれる訳ではなさそうですがそういった購入行動のパターンを他の数千人の人々のデータと照らし合わせることによってその意味が見えてきます

このようにして我々はソーシャルメディアを通して皆さんの事を分析しています我々は数百万の人々のこの様なささいな行動パターンから様々なことを見出そうとしているのです

私の研究所では仲間たちと様々なことを正確に予測する手法を開発しました人々の政治的傾向個性性別性的傾向宗教年令知能それに加え知人をどの程度信頼しどれくらい深い関係かといったことですかなり上手くいきました 繰り返しますが直接的でない情報から結果が得られるのです

私が特に気に入っている事例は米国科学アカデミー紀要に載った今年の論文でグーグルで検索すれば見つかるでしょう 4ページの論文ですぐに読めますここではフェイスブックで何を「いいね！」したかという情報だけを元に先ほど挙げたような個人の特性を予測しています

この論文では高い知能と関連性の高い 5つの「いいね！」の対象をリストしましたその一つがカーリー・フライのページです (笑) カーリー・フライは確かに美味しいですがカーリー・フライが好きなこと自体が平均以上の知性を意味するのではありませんではどうして対象物が予測しようとする性質と無関係なのにこれが知性と関連性の高い指標となるのでしょうこれを説き明かすために背後にあるありとあらゆる理論に着目すべきことが分りましたその一つが社会学で「同類性」といわれるもので人間は基本的に似た者同士が集まるというものです賢い人は賢い人達と仲間になる傾向があり若者は若者同士で集まるといったことでこれは何百年もの前に確立された理論です情報がネットワークによりどう広がるかもよく分かっています話題になるビデオやフェイスブックの「いいね！」のような情報はまるで病気が伝染するようにソーシャルネットワークを通して広がるのです

こういうことは長年研究され良い予測モデルがありますこういったことを合わせて考えてみればなぜあんな予測がなされるのか分ってきますそこで仮説を示すとすれば― そのページを作った人かあるいは初期に「いいね！」をした一人が知性の高い人だったのでしょう彼らが気に入ってそしてその友達がこれを見て類が友を呼び ― きっと彼には賢い友人が多いのでしょう仲間の輪は広がり彼らも気に入りそこからさらに賢い友達へと広まりネットワークを通してたくさんの知性の高い人へと伝わっていきついにはカーリー・フライへの「いいね！」という行動が商品の中身とは無関係に「いいね！」と投票した人たちの共通の特性が反映され高い知性を表すことになったのです

とても複雑な関係ですね？これを普通の方の前で説明するのは難しいしそうしたからといって普通の人はどうすべきか分かりませんね? 何かを「いいね！」したときそれとは直接関係のない性格をつかまれてしまうなんてどうして分かるでしょう？ユーザーがデータの用途をコントロールできないそんな仕組みが多くあるのですそして私は実際に問題が起こっていることを知っています

私はユーザーにデータの使用方法のコントロールを与える 2つのやり方があると思いますというのもデータ利用は必ずしもユーザの為になっていないからです私がよく挙げる例はもし私が教授職に飽きて会社を立ち上げ皆さんの特性だとかチームワーク力とか薬物使用癖やアルコール依存などを予測します推定方法は分かっていますそして皆さんを雇用したがっている人材派遣会社や大企業にレポートを売りつけるのです我々はすぐにでもできます明日にだってビジネスを始められるでしょうそして私が皆さんのデータをそのように使うのを止めることはできませんそのことが問題だと言っているのです

取り得る対策の一つはポリシーや法律による方法ですある意味これが最も効果的かもしれませんしかし問題は我々は働きかけることしかできないことです政策決定のプロセスを見ていると多くの議員が集まって我々の話を聞いて事情を理解しユーザーが自分のデータの用途を管理できるよう米国の知的所有権法を大幅に変えるというのはとても起こりそうな気がしません

ポリシーという道もありますつまりソーシャルメディア会社が “データは皆さんのものです皆さんがすべて管理できます” と言うのです問題は収入モデルにありますソーシャルメディア会社はユーザのデータを何らかの方法で共有もしくは利用することで成り立っています時々言われる事ですがフェイスブックにとって “ユーザは顧客ではなくて製品だと” だからこのような会社が大事な資産をユーザーに返すなどという譲歩をするでしょうか？可能だとは思いますが私は直ぐには起こりそうにないと思います

もう一つの道でより効果的であろうものは科学を使うことですデータから個人の特性を導き出すメカニズムを開発できるようにしてくれた科学を研究することそれとごく似た研究によって “これにはリスクがありますよ” といった警告をユーザーに発するような仕組みを開発できるでしょうフェイスブックで「いいね！」したり個人情報を共有すると皆さんがドラッグをやっているかとか職場で上手くいっているかどうかとかそういった事について予測される精度が上がったのでした警告の仕組みを導入すると情報を公開する友達に限定するまったく共有しないといった人々の選択に影響するでしょうまたはアップロードする情報を暗号化するという手段も考えられるでしょうこれでフェイスブックの様なサイトやそこからデータを受ける第三者のサービス会社には無意味なデータとなり一方で本人が見て欲しいと思う人は見ることができますこれは知的な観点から非常に面白い研究であり科学者は喜んで取り組むでしょうその点で政策に訴える手段よりも優れています

この話をすると皆さんによく指摘されるのは皆が情報を非公開にするようになったら私たちの開発してきた人の行動パターンの予測手法が使えなくなるのではということですその通りですが私にとってそれは成功なのですなぜなら一科学者として私の目標はユーザーの情報から何かをあぶりだすことではなくて人々のオンラインにおける交流を改善することだからですそのために人々のデータから推測をすることもありますが皆さんがデータの利用を望まないのであれば皆さんにそう言う権利があるべきだと思います我々が開発するツールについてユーザーは知らされ同意の元で使われるべきだと思います

データを管理する力の一部をソーシャルメディアからユーザーに返すような科学的研究を推し進め研究者を支援することでこのようなツールは進化し進歩を遂げることになりユーザーが知識と力を持つようになるでしょうこれが理想的な方法だと同意して頂けるものと思ってます

どうも有り難うございました (拍手)

引用元：TED