アップルはユーザーとSiriの会話の一部を委託業者に送って音声認識データ分析していることが報じられました。プライバシー問題の指摘を受け現在会話データ分析を中止しています。アップルはSiriの音声録音を世界的に中止し今後はユーザーの希望を確認すると発表しました。
先週、アップルはユーザーとSiri(シリ)の会話の一部を委託業者に送って品質管理のために音声認識の精度を評価していることが「Guardian」によって報じられました。
アップルは現在は評価を中止していて、今後はユーザーが希望する場合のみ音声を評価に使用すると発表しています。このニュースはユーザーのプライバシー尊重を強調しているアップルが、Amazonと同じようなことをしていたと衝撃的に受け止められました。
アップルはGuardianに対して、音声分析に使われる音声は全体の1%未満とごく一部であり、音声がApple IDと紐づけられることはなく、ユーザーのプライバシーを守るために厳重な体制を敷いていると説明していました。
Alex Hern(アレックス・ハーン)氏によるGuardianの記事は、アップルと契約して「グレーディング」と呼ばれる会話の録音がSiriの品質を向上させるための作業を請け負っている業者の話を引用したものでした。
グレーディングとは個人の名前やIDとの関連を除外した音声データの断片が契約業者に渡され、業者はそれを耳で聴いてSiriが正しく音声を認識したか、あるいは誤って起動してしまったのかを判断する作業です。
匿名の内部告発者によると、医師と患者の個人的な話し合いや商談、刑事上の取引、性的な出会いなどの記録が数え切れないほどあり、記録には場所や連絡先の詳細、アプリを示すユーザーデータが付随していたと述べています。
The Guardianの取材に対してアップルは、Siriの音声認識を向上するためとして人間がSiriの録音データを聴いていた事実を認めています。
さらにグレーディングに用いられる音声録音は1日のSiriアクティベートのうち1%未満で、数秒に過ぎないとも付け加えています。
今後はユーザー自身がSiriのグレーディングのプロセスに参加するかどうかを選択できるよう、iOSのアップデートを実施するつもりだと発表しています。
AmazonやGoogleなど他社の音声アシスタントにおいても完全に機械的に処理されているわけではなく、実際に人間が聴いてタグ付けなどを行っているのが現状です。
数秒間の音声録音データを取得・送信して評価することは、それを社内でやるか外部の業者に委託するかは別として、この業界では標準的に行われていることだと言われています。それはAmazonも事実として認めGoogleも例外ではありません。
この録音データがグレーディングのために利用されることをはっきりとユーザーに了解して貰うことは、このようなビジネスにとってもはや不可欠と言えるでしょう。
今回指摘されている問題点は、Siriの品質管理やデータの共有についての記述はありますが、Siriが音声を録音しているとは明示しなかったばかりか、無効にするオプションも用意していない点です。
しかし実際の録音データがいくら短いものだとしても評価プロセスの中で利用され、しかも第三者に送信されて聴取される可能性があるということを、はっきりとわかりやすく説明できてはいない点が指摘される問題点です。
GoogleはGoogleアカウント内の「アクティビティ管理」で「音声アクティビティ」をオフに、AmazonはAlexaアプリから「音声録音を新機能開発に役立てるために使用する」設定をオフにする選択肢がありますが、Siriには存在しません。
アップルは今後ユーザーが同意した場合のみ、音声を評価に使用することを発表しました。またこのプロセスを徹底的に見直しユーザーのプライバシーを守りながらSiriによる素晴らしい体験を届けるために努力するとしています。