ページの先頭です
IIJ.news Vol.176 June 2023
データが血液のように循環する「データ駆動社会」が到来し、データ戦略が問われている。
本稿では、データ連携の現状を整理しつつ、今後の課題や方向性について考えてみたい。
IIJ 取締役副社長
谷脇 康彦
データが「経済を循環する血液」としての役割を果たすデータ駆動社会。インターネットに接続されるモノ(IoT)の幾何級数的な増加、センサやクラウドサービスなどデータの収集・蓄積関連コストの大幅な低下、データ解析に必要なAIなど関連技術の進化……等々、データ流通を取り巻く環境は大きく変化しており、データをどのように活用するかというデータ戦略が、企業にとっても、国全体にとっても重要性を増しています。しかしデータといってもさまざまなデータが存在します。そこでまず、データ駆動社会におけるデータを、「データ連携」の文脈に沿って4つの類型に整理してみましょう。
第1にパーソナルデータ。データ連携に際しては主として匿名加工されたかたちでの活用となりますが、新型コロナウイルスの流行初期において、スマホで取得できる個人の位置情報の集積から主要駅周辺における人出情報が提供され、外出を控えようという行動変容につながったことは記憶に新しいところです。
第2にセンサなどのいわゆるM2M(machine to machine)のストリーミング系データ。例えば、東日本大震災の発災時に主要自動車メーカがカーナビの位置情報を集積することで通行実績のある道路とそれ以外とがマップ上に表示され、どの道路が通行可能かという貴重なデータが日々更新され、人々に提供されました。
第3にオープンデータ。国や地方公共団体が保有している統計データなどが公表されています。重要なのは、ソフトウェアで処理できる、機械判読可能(machine readable)なかたちで公開する点にあります。オープンデータは地域の抱える課題の解決策を官民で見出す取り組みなどに使われており、例えば東京都のオープンデータ・ハッカソン(2021年度)では、工事現場の看板情報(標識設置届)のデータから工事関係者が多数働いている場所を特定し、昼食難民をなくすためのキッチンカーの配置を最適化するといった取り組みが発表されています。その他、オープンデータについては、施設管理や健康・介護などの取り組みも全国で行なわれています。
第4に知のデジタル化。これまで伝統的に受け継がれてきた知恵(ノウハウ)のデータ化がこれに該当します。農業分野において、圃場の風向き、日照量、水温などの外的環境データを蓄積して、経験と勘をもとにベテラン農家の方が行なう作業のタイミングや内容を記録するといった例が挙げられます。これにより、どのような外的環境であれば、どのような作業をするのかといった暗黙知の形式知化(構造化)が図られ、次世代に知を継承できるようになります。同様のことは、老朽化が進むインフラ管理など、さまざまな分野で適用されています。
次にデータ駆動社会における課題について、データの量・質(粒度)・流通速度という3つの観点から考えてみましょう。
前述の通り、データ量は幾何級数的に増加すると見込まれますが、重要なのは、これまで連携されていなかったデータを有機的につなぐことで「隠れていた関係性」に気づき、新たな価値を生み出すことです。そのためにはデータ連携の仕掛け作りが必要になります。一例としては、企業内の部署間のデータ連携はもとより、デザイン思考を取り入れつつ、異なる領域(業態)の知恵を交錯させることで新しい価値創造を生みだすような仕掛けです。
今、求められているのは、こうしたデータの連携・活用の重要性を戦略として認識し、特に異なる領域のデータ連携を積極的に実現していくことです。こうした取り組みを行なうことで、各領域のシステムが有機的に結びついて、仮想的にあたかも1つのシステムのように機能する統合型システム(system of systems)となっていきます。データ連携という文脈で考えれば、各領域のデータ群を連邦制としてとらえ、各連邦(データ群)の相互運用性を確保していくことが求められます。
データ連携の取り組みで先行しているのが、欧州の「GAIA-X」と呼ばれるプロジェクトです。同プロジェクトは2019年10月にドイツとフランスの合意にもとづいて開始され、現在は世界約370社が参加するデータ連携プロジェクトになっています。
GAIA-Xにおいては、寡占的なプラットフォーマによるデータ独占を排し、医療・教育・行政などの各領域のデータ整備を行なったうえで、領域ごとのデータ群相互間のデータ連携を目指すプラットフォームづくりに取り組んでいます。日本では(1社)データ社会推進協議会がGAIA-Xと同様の連邦型データ連携を実現するプラットフォームとしてDATA-EXの構築に取り組んでいます。
また欧州においては、特にIoT機器が生成するデータの共同利用を促す動きがあります。2023年2月に欧州委員会が公表したデータ法案によれば、IoT機器が生成するデータを機器の製造事業者(データ所有者)以外の第三者に適正な対価で利用可能とするとしており、医療・自動車など個別分野でのデータ共同利用に関する法案も別途検討する予定となっています。日本における(パーソナルデータを除く)データ活用の意向を米国やドイツと比較すると(図表参照)、一定程度活用しているという回答*が23・0パーセント(2019年度)から46・4パーセント(2020年度)に倍増しているものの、米国(67・9パーセント)やドイツ(70・5パーセント)に比べると、20ポイントほど下回っており、日本においても欧州データ法のような法制度の整備を通じてデータ連携・共有の促進を図るべきという声が今後高まる可能性があります。
第2に、データの質を確保するという観点からは、いわゆるデータセキュリティが重要になります。具体的には、市場で流通しているデータが改ざんされていないか、データ流通の上流から下流までのデータサプライチェーンとしてデータの真正性(integrity)が確保されているかといったことです。データが流通しているあいだに改ざんされると、各種システムの誤作動などを引き起こします。また、開発が進むAIの学習データが改ざんされると、社会的・経済的な混乱が広範囲におよぶことも懸念されます。
このため、データ保有者の真正性の証明(電子署名やeシール)、データの送信時刻の記録と非改ざんの証明(タイムスタンプ)、データが確かに送られたという送達確認(eデリバリー)など、データの送受信が確実に行なわれたことを記録する「トラストサービス」と呼ばれる仕組みの整備を急ぐ必要があります(日本では電子署名やタイムスタンプなど部分的な整備にとどまっています)。
この分野でも欧州は他国に先行しており、2016年に施行されたeIDAS規則にもとづいてトラストサービスが整備されています。また、データの安全性を確保するための仕組みとして、データ流通を仲介する機関の第三者認証制度の整備などにも取り組む必要があります。再び欧州においては2023年9月にデータガバナンス法が施行される予定で、そのなかでデータ共有サービスプロバイダ制度(登録制)などが稼働することとなっており、こうした組織の要件として十分なデータ保護措置を講じることが求められています。併せて、ブロックチェーン技術を活用した分散型デジタルID(DID)の開発、データ秘匿化や秘密(秘匿)計算など、プライバシー関連技術(PET:Privacy Enhancing Technology)の領域の技術開発にも取り組む必要があります。
第3に、データの流通速度を上げるためには、データ取引市場の整備や国際協定の締結などが重要になります。特にデータが国境を超えて自在に流通できるようにするには、データを国内に止めることを求めるデータローカリゼーションの禁止、データ収集において利用されるアルゴリズムなどの国による検閲の禁止、さらにはデータ連携基盤やトラストサービスの相互運用性の確保など、国ごとの制度的な違いを吸収することでデータ流通速度の向上を図ることが必要になると考えられます。
ページの終わりです