2014年4月18日 科学・技術 タグ: TED, ビッグデータ
Facebookで何を「いいね!」したか?という情報だけを元にあなたの特性を予測できるという事が、いかに危険か/ジェニファー・ゴルベック
コンピュータ科学者のジェニファー・ゴルベックさんが、FaceBookで何かを「いいね!」したとき、それとは直接関係のない「あなたの性格」をつかまれてしまう事を、どうやってそんなことが可能なのか?という技術的な観点から解説し、この技術の応用が必ずしも好ましいとは限らないことを警告。自分の情報をコントロールする力をユーザーの手に戻すべきであると主張しています。
(所要時間:約10分)
動画の内容 (全文書き起こし)
ウェブが最初の10年間 どんなだったか 覚えていますか? 固定的なものでした ネットにつなげ サイトを見ることはできましたが 当時それは そのための部署を持つ組織や コンピュータに精通した個人が 立ち上げたものでした 2000年代初期にソーシャルメディアや ソーシャルネットワークが登場すると ウェブは大きく変容を遂げ 今や私たちの見る コンテンツの大部分が 一般的なユーザーによる YouTubeのビデオ、ブログ 製品のレビューやソーシャルメディアでの 投稿で占められています また人々が互いに やり取りをする場へと変化しています コメントしたり 情報を共有したりし ただ情報を見るだけではないのです
フェイスブックはこのような場として 唯一ではないものの最大です 数字を見れば分ります フェイスブックには 月間ユーザーが12億います つまり地球上のインターネット人口の半分がフェイスブックを利用しています 他のサイトと同様に ITのスキルが殆どなくても ネット上の人格を作ることができる そんなサイトであり 人々は個人的な情報を大量に 投稿してきたのです
その結果 何億という人々の 行動パターン 好みや人口統計データなどが 得られるのです こんなことは 過去には有りませんでした 私のようなコンピュータ科学者にとって これは意味深く 私は人々が共有した情報から 本人が公開しているとは思いもしない 多くの隠された特性を予測できるモデルを構築することができました 科学者はそれによって 人々のネット上での交流を 手助け出来るのですが そんなに利他的でない 応用もあります
問題はユーザーが この様な技術の存在やしくみを理解せず たとえ知っていたとしても コントロールする手段が無いことです 私が今日お話ししたいことは こういうことに対して我々が 何をできるか そして我々の手に いくらかコントロールを 取り返すアイデアについてです
これはTargetという会社のロゴ この哀れな妊婦のお腹に ロゴを意味もなく 貼りつけたのではありません 雑誌フォーブスに載った逸話を ご覧になったかもしれません Targetはこの15歳の少女が 親に妊娠を打ち明ける2週も前に 哺乳瓶、おむつ、 ベビーベッドの 広告とクーポン券を 送りつけたのです 父親は激怒しました Targetは 親さえ知らない 高校生の少女の妊娠を どうして知っていたのか?
判明したことは 彼らには 何十万という顧客の 購入履歴データがあり 彼らが言う所の 妊娠スコアというものを計算したのです 単に妊娠の判断だけでなく 予定日の推定さえするのです すぐそれと分かる購入品 例えばベビーベッドや 赤ちゃん服だけでなく いつもよりビタミン剤を 多めに買ったとか おむつを入れるのに必要であろう 大きな手さげカバンを 買ったということから 推測するのです それぞれの物は 購入したからと言って 何かがばれる訳ではなさそうですが そういった購入行動のパターンを 他の数千人の人々のデータと 照らし合わせることによって その意味が見えてきます
このようにして我々は ソーシャルメディアを通して 皆さんの事を分析しています 我々は数百万の人々の この様な ささいな行動パターンから 様々なことを見出そうとしているのです
私の研究所では仲間たちと 様々なことを正確に予測する 手法を開発しました 人々の政治的傾向 個性 性別 性的傾向 宗教 年令 知能 それに加え 知人をどの程度信頼し どれくらい深い関係か といったことです かなり上手くいきました 繰り返しますが 直接的でない 情報から結果が得られるのです
私が特に気に入っている事例は 米国科学アカデミー紀要に載った 今年の論文で グーグルで 検索すれば見つかるでしょう 4ページの論文で すぐに読めます ここでは フェイスブックで 何を「いいね!」したかという 情報だけを元に 先ほど挙げたような 個人の特性を 予測しています
この論文では 高い知能と 関連性の高い 5つの「いいね!」の対象をリストしました その一つが カーリー・フライのページです (笑) カーリー・フライは 確かに美味しいですが カーリー・フライが 好きなこと自体が 平均以上の知性を 意味するのではありません では どうして対象物が 予測しようとする性質と無関係なのに これが知性と関連性の高い 指標となるのでしょう これを説き明かすために 背後にある ありとあらゆる 理論に着目すべきことが 分りました その一つが社会学で 「同類性」といわれるもので 人間は基本的に似た者同士が 集まるというものです 賢い人は賢い人達と 仲間になる傾向があり 若者は若者同士で集まるといったことで これは何百年もの前に 確立された理論です 情報がネットワークにより どう広がるかも よく分かっています 話題になるビデオや フェイスブックの「いいね!」 のような情報は まるで病気が伝染するように ソーシャルネットワークを通して 広がるのです
こういうことは長年研究され 良い予測モデルがあります こういったことを合わせて考えてみれば なぜあんな予測がなされるのか 分ってきます そこで仮説を示すとすれば― そのページを作った人か あるいは初期に「いいね!」をした一人が 知性の高い人だったのでしょう 彼らが気に入って そして その友達がこれを見て 類が友を呼び ― きっと彼には賢い友人が 多いのでしょう 仲間の輪は広がり 彼らも気に入り そこからさらに 賢い友達へと広まり ネットワークを通して たくさんの知性の高い人へと伝わっていき ついにはカーリー・フライへの 「いいね!」という行動が 商品の中身とは無関係に 「いいね!」と投票した人たちの 共通の特性が反映され 高い知性を表すことになったのです
とても複雑な関係ですね? これを普通の方の前で 説明するのは難しいし そうしたからといって 普通の人はどうすべきか 分かりませんね? 何かを「いいね!」したとき それとは直接関係のない 性格をつかまれてしまうなんて どうして分かるでしょう? ユーザーがデータの用途を コントロールできない そんな仕組みが多くあるのです そして私は実際に問題が起こっていることを知っています
私はユーザーにデータの使用方法の コントロールを与える 2つのやり方があると 思います というのもデータ利用は必ずしも ユーザの為になっていないからです 私がよく挙げる例は もし私が教授職に飽きて 会社を立ち上げ 皆さんの特性だとか チームワーク力とか 薬物使用癖やアルコール依存 などを予測します 推定方法は分かっています そして皆さんを雇用したがっている 人材派遣会社や大企業に レポートを売りつけるのです 我々はすぐにでもできます 明日にだってビジネスを始められるでしょう そして私が皆さんのデータを そのように使うのを 止めることはできません そのことが問題だと言っているのです
取り得る対策の一つは ポリシーや法律による方法です ある意味 これが最も効果的かもしれません しかし問題は我々は 働きかけることしかできないことです 政策決定のプロセスを見ていると 多くの議員が集まって 我々の話を聞いて 事情を理解し ユーザーが自分のデータの 用途を管理できるよう 米国の知的所有権法を 大幅に変えるというのは とても起こりそうな気がしません
ポリシーという道もあります つまりソーシャルメディア会社が “データは皆さんのものです 皆さんがすべて管理できます” と言うのです 問題は収入モデルにあります ソーシャルメディア会社は ユーザのデータを何らかの方法で 共有もしくは利用することで成り立っています 時々言われる事ですが フェイスブックにとって “ユーザは顧客ではなくて製品だと” だから このような会社が 大事な資産をユーザーに返すなどという 譲歩をするでしょうか? 可能だとは思いますが 私は直ぐには起こりそうにないと思います
もう一つの道で より効果的であろうものは 科学を使うことです データから個人の特性を 導き出すメカニズムを 開発できるようにしてくれた 科学を研究すること それとごく似た 研究によって “これにはリスクがありますよ” といった警告を ユーザーに発するような 仕組みを開発できるでしょう フェイスブックで「いいね!」したり 個人情報を共有すると 皆さんが ドラッグをやっているかとか 職場で上手くいっているかどうかとか そういった事について予測される精度が 上がったのでした 警告の仕組みを導入すると 情報を公開する 友達に限定する まったく共有しないといった 人々の選択に影響するでしょう またはアップロードする情報を 暗号化するという手段も 考えられるでしょう これでフェイスブックの様なサイトや そこからデータを受ける 第三者のサービス会社には 無意味なデータとなり 一方で 本人が見て欲しいと思う人は 見ることができます これは知的な観点から 非常に面白い研究であり 科学者は喜んで取り組むでしょう その点で政策に訴える手段よりも 優れています
この話をすると皆さんに よく指摘されるのは 皆が情報を非公開に するようになったら 私たちの開発してきた 人の行動パターンの予測手法が使えなくなるのでは ということです その通りですが 私にとってそれは成功なのです なぜなら一科学者として 私の目標はユーザーの情報から 何かをあぶりだすことではなくて 人々のオンラインにおける交流を 改善することだからです そのために人々のデータから 推測をすることもありますが 皆さんがデータの利用を 望まないのであれば 皆さんにそう言う権利が あるべきだと思います 我々が開発するツールについて ユーザーは知らされ 同意の元で使われるべきだと思います
データを管理する力の一部を ソーシャルメディアから ユーザーに返すような 科学的研究を推し進め 研究者を支援することで このようなツールは進化し 進歩を遂げることになり ユーザーが知識と力を 持つようになるでしょう これが理想的な方法だと 同意して頂けるものと思ってます
どうも有り難うございました (拍手)
引用元:TED






「ビッグデータ」を直感的に理解しやすいデザインに「可視化する」ことがもたらすメリット/デビッド・マキャンドレス
ビッグデータの分析で、これまでブラックボックスだった「医療のムダ」があぶり出されつつある/NHK・クローズアップ現代「ムダの“見える化”で医療の質を上げろ」
プライバシーはなぜ重要か/アレサンドロ・アクイスティ
“いのちの記録”を未来へ 震災ビッグデータ/NHKスペシャル
社会を変える「ビッグデータ」革命/NHK・クローズアップ現代
Twitterのセキュリティ哲学/デル・ハーヴェイ「100万分の1の確率でも、Twitterの規模ならそれは1日500回起きる」
平和というクモの巣を一体化できれば、戦争というライオンさえも止められる/ウィリアム・ユーリー
ウェブの翻訳を素早く正確にタダでやってもらおうという野心的な新しいプロジェクト/ルイス・フォン・アーン
解剖せずに人体の挙動を観察する「バーチャル解剖」や、現在開発中のSFに近いような医療技術「機能MRI」について/アンダース・インナーマン
NSA(アメリカ国家安全保障局)はいかにして世界の信頼を裏切ったのか/ミッコ・ヒッポネン
YouTubeの著作権への取り組み/マーガレット・グールド・スチュワート
「生のデータを今すぐに」/World Wide Web(WWW)のハイパーテキストシステムを考案・開発した人物:ティム・バーナーズ=リーが示す“次のWeb”
私が統計とデータを駆使して婚活サイトで理想の男性をゲットした方法/エイミー・ウェブ
幸せはお金で買うことができる/マイケル・ノートン
犯罪抑止の鍵は刑事司法制度に「データ分析」と「統計分析」を取り入れること/アン・ミルグラム
投資においては財務データが素晴らしいだけでは不十分で、なぜ投資家が企業の環境、社会、ガバナンスの体制を見なければならないか?/「サステナビリティ投資の論理」
「上司に言われたから」とか「お金をもらったから」するのではなく、「やりたいからやる」ということの重要性に気付いた人たちの「思考の余剰」がやがて世界を変える/クレイ・シャーキー
【作業効率UP】 WindowsではWinキーと矢印キーで画面を左右に分けることができるけど Macでは出来ないっぽいので有料アプリ「DoublePane」を導入してみた
アマゾンの「Kindle Paperwhite(キンドル)」で「ジョジョの奇妙な冒険」を読もうと思ったら16冊で容量不足・・・。三部作の完結まで行くことができない事が判明。
愛とは何か?/ブラッド・トロガー
「人間は脳のたった10%しか使っていない」という神話について/リチャード・E・シトーウィック
国境のないヨーロッパ的民主主義を想像しよう/ゲオルギオス・パパンドレウ(元ギリシャ首相)
IKEA(イケア)の雑貨を使った説明が分かりやす過ぎる!世界の人口増加を90億人でストップさせるたった一つの方法
グローバル倫理と国益のバランス/ゴードン・ブラウン
若い人たちに一言お詫びを申し上げたいと思います。/小出裕章(こいでひろあき)氏 「未来を担う子どもたちへ」
誕生日のサプライズ・プレゼントで「今からディズニーランドに行くわよ!」と言われた6歳の女の子が見せてくれた最高のリアクション
4号機が爆発した本当の原因と東電がそれを隠す理由/フランス・ドイツ共同の国営放送局 ARTE 「フクシマ-最悪事故の陰に潜む真実」(日本語字幕)
報道ステーション「イスラム国 日本人殺害予告 事件の背景には何が…」/古賀茂明さん「安倍さんの目的は人質の救出ではなく、イスラム国と戦っている有志連合の仲間に入ること」
中島みゆきさんの名曲「糸」を Mr.Children の桜井和寿さんが本気でカバーしたらこうなった
ドイツ国営テレビ放送ZDF「福島の嘘」(日本語字幕)/海外メディアが日本の癌=「原子力ムラ」を告発
橋下さんの無責任さ、不勉強さがよくわかる・・・。ガレキ広域処理の説明会で大阪市民「モン=モジモジ氏」の全身全霊をかけた質問に一切答弁できずに逃亡する橋下市長
NHKスペシャル <新・映像の世紀> 第3集 「時代は独裁者を求めた」
消せない放射能 ~65年後の警鐘~/NNNドキュメント
NHK・プロフェッショナル 仕事の流儀「人生も仕事もやり直せる/弁護士・宇都宮健児」
NHKスペシャル <神の数式> 第1回 「この世は何からできているのか ~天才たちの100年の苦闘~」
BS世界のドキュメンタリー「インサイド フクシマ」(日本語吹き替え)/BBC版に映っていた「3号機の爆発シーン」がNHK版では編集で消されている! (比較映像あり)
老人漂流社会 “老後破産”の現実/NHKスペシャル
「だだだだだ・・・。」だけで会話を成立させる双子の赤ちゃん
報道ステーション「国が“武器輸出”企業を支援… 低金利融資などで軍需産業化か」/古賀茂明さん「日本はアメリカのように戦争がないと生きていけない国になる」
NHKスペシャル <新・映像の世紀> 第1集 「百年の悲劇はここから始まった」
化粧は詐欺だ! Bfore と After が違いすぎると話題になっていたメイク実況映像
NHKスペシャル <神の数式> 第2回 「宇宙はどこから来たのか ~最後の難問に挑む天才たち~」
ガレキ処理に新たな動き/報道ステーションSUNDAY「震災ガレキで“森の防波堤” ~84歳学者の挑戦に密着~」
NHKスペシャル <新・映像の世紀> 第2集 「グレートファミリー 新たな支配者」
NHKスペシャル <新・映像の世紀> 第4集 「世界は秘密と嘘(うそ)に覆われた」
被ばくした人が、どのように亡くなっていくのか?放射線が人間の臓器をどう蝕んでいくのか?/NHKスペシャル「封印された原爆報告書」
宮川大輔のお祭り男/世界の果てまでイッテQ【スプラッシュ祭り/ポテト】
NHKスペシャル <神の数式・完全版> 第3回 「宇宙はなぜ始まったのか ~残された“最後の難問”~」
宮川大輔のお祭り男/世界の果てまでイッテQ【イギリス・チーズ転がし祭り】
南京事件 兵士たちの遺言/NNNドキュメント
魂の反原発ソング/FRYING DUTCHMAN(フライングダッチマン)の「human ERROR(ヒューマンエラー)」
NHKスペシャル <神の数式・完全版> 第4回 「異次元宇宙は存在するか ~超弦理論“革命”~」
NHKスペシャル <新・映像の世紀> 第5集 「若者の反乱が世界に連鎖した」