Google は、プライバシー技術へのアクセスを拡大し、あらゆる人が利用できるものにしたいと考えています。私たちは、研究者、政府機関、非営利団体、企業などのデベロッパー コミュニティが、差分プライバシーに対応した新しいアプリケーションを作って公開するうえで役立つ無料ツールを作成しています。差分プライバシーは、個人に関する情報を一切明かすことなく、有用な知見やサービスを提供できるようにする技術です。データ プライバシー デーである今日(元記事公開当時)は、その作業に関する最新情報をお知らせします。プライバシーを考慮した設計のプロダクトによって、すべてのインターネット ユーザーにとって安全なエコシステムを作るために、業界を前進させることができれば幸いです。
差分プライバシーを利用できるデベロッパーを増やす
C++、Java、Go によるオープンソース版の基本差分プライバシー ライブラリを公開したのは、2019 年のことでした。そのときの目標は、透明性を実現し、研究者がコードを調査できるようにすることでした。自分たちのアプリケーションでこのライブラリを使いたいというデベロッパーから、大きな関心が寄せられ、その中には、さまざまな医療機関がプライバシーを保護しつつ、医療データから学習できるようにした Arkhn のようなスタートアップ企業もあれば、プライベートであることを証明できるデータを通して科学的発見を加速したオーストラリアのデベロッパーもありました。
その後も、私たちは差分プライバシーを広く利用できるようにするために、さまざまなプロジェクトや新手法に取り組み続けています。今回は、オープンソース デベロッパー団体 OpenMined と連携して 1 年間の開発を行ってきた結果として、差分プライバシー フレームワークの新たなマイルストーンを発表いたします。それは、あらゆる Python デベロッパーが差分プライバシーを用いてデータを処理できるプロダクトです。
これまでの差分プライバシー ライブラリは、3 つのプログラミング言語で利用できました。しかし、Python で利用できるようになった今、世界中のデベロッパーのほぼ半数にお届けできることになります。つまり、膨大な数のデベロッパー、研究者、企業が、業界をリードするプライバシー技術を使ったアプリケーションを作り、個人のプライバシーを保護、尊重しつつ、データセットから知見を得たりトレンドを観測したりできるようになります。
すでにこの新しい Python ライブラリを使い、新たなユースケースの実験を始めている組織もあります。たとえば、匿名で集計し、サイトで最もアクセスされているページを国ごとに表示するユースケースです。このライブラリの特徴は、大規模データ処理エンジンを代表する 2 つのフレームワークである Spark と Beam を使っており、柔軟な利用や実装ができることです。また、新たな差分プライバシー ツールとして、差分プライバシー情報を生成するために使うパラメータの視覚化やチューニングを行えるツールもリリースします。さらに、差分プライバシーをペタバイトとそれ以上のデータセットに効率的にスケールアップする技法をまとめた論文も公開します。
すべてのオープンソース プロジェクトと同じように、技術と成果がどれほどのものになるかはコミュニティ次第です。社内では、モビリティ レポートや Google マップの混雑状況機能を支えるインフラストラクチャなど、差分プライバシー ソリューションを開発するチームのトレーニングを行っています。私たちは目標を実現する一環として、差分プライバシー技術の導入方法を学びたい方を助けるために、OpenMined が Google 外部のエキスパート チームを編成することもサポートしました。
今後に向けて
世界中のデベロッパーの皆さんには、この機会を活用して、統計分析や機械学習などの差分プライバシーのユースケースを試してみることをおすすめします。しかし何よりも、フィードバックをお送りいただけることを願っています。皆さんが開発できるアプリケーションや、その過程で私たちが提供できる機能について、ぜひお知らせください。
私たちは、今後も重要なプライバシー強化技術へのアクセスを拡大する努力を続けるとともに、デベロッパーの皆さんがユーザビリティを向上し対象範囲を拡大する作業に加わっていただけることを願っています。先ほども述べましたが、世界中のすべてのインターネット ユーザーがワールドクラスのプライバシーに値するというのが私たちの考えです。その目標に向かうために、これからも多くの組織と連携を続けてゆきたいと思います。