APIエコノミーとはなぜそう呼ばれたか ―用法と事例―

機械やひとが、気軽にデータを売買できる時代の始まりです。

 

APIサービスが普及し、企業によるデータ流通が簡単になって、新しい経済圏を生み出しそうだと注目されています。数十年前からある技術が、簡単に使える支援サービスの普及に伴って、新ビジネスの企画・開発に便利だと思われ始めているのです。

 

 

(清水響子・本誌編集部)

はじめに

まずは「APIエコノミー(経済圏)」を取り上げます。耳慣れない方がほとんどでしょうが、一説には260兆円市場に成長するともいわれる分野です。米国ではAPIマネジメント企業の買収が相次ぎました。求人情報サイトindeed.comによれば、APIエンジニアの平均年収は約10.2万ドルにまで達しています。

データ産業の成長につれて対象領域は広がり、企業による大規模データ(Big Data)の第三者提供、産学官民の垣根を越えた共同研究(Open Innovation)、金融サービスの革新(FinTech)や公共機関の情報受発信(Open Government)、学術論文・図書館情報のオープン化(Data Sharing)、製造系企業のデータ流通の効率化(IoT)、エンジニア達のライフハック(Mash Up)など多岐に渡ります。機械学習(AI, 人工知能)のアルゴリズムをAPIで提供する企業も増えて来ました。

もっともシステム開発の当事者たちにとっては、さほど目新しい話題ではないようです。90年代にはすでに用例が見られます。00年代には「Web API」と言って、Webサービス企業が自社のAPIをネット上に公開することが流行しました。そして再び、北米では2010年頃、日本でも2013年頃から、新たに「APIエコノミー」と呼ばれて注目を集めているのです。何が起きているのでしょうか。どんな企業がどんなサービスを手掛け、どんな技術を持ち、どんなデータを公開しているのでしょうか?

 

そもそも、APIって?

API(Application Programming Interface)とは、コンピュータ・プログラムの開発者が、自作したプログラムを他の開発者に使ってもらうときの「手続き・使い方・決まり」の総称です。プログラム自体を指すことも、その開発文書のことを指すことも、プログラムの設計理念を指すこともあります。どうにも抽象的な用語ですが、スマートフォンのアプリ操作にも当たり前に使われる技術です。

「ぐるなび」や「食べログ」で行きたいお店を探すとき、所在地を確認するために、わざわざ別のブラウザで地図を検索したりはしないでしょう。グルメサイトの画面内で「地図」メニューを開けば、そこにはGoogle Mapの地図が表示されますし、現在地からの道順も簡単に検索できます。

でもこの地図、もちろんグルメサイトが作成したものではありません。地図情報はGoogleが提供しています。グルメサイトは提供されたデータを表示するだけです。このようにAPIサービスは、あるアプリが他のアプリの機能を呼び出す「代理」をしてくれます。簡単に図示しましょう。

 

図 1:APIを通じたサービス連携とデータ流通

 

あなたが端末を操作すると、それがアプリへのリクエスト(指示)になります。リクエストを受けたアプリは、前もって連携していた外部サービスのWeb APIを探し、コール(呼び出し)します。呼び出されたWeb APIはそのリクエストに応答して、保有する機能・コンテンツでレスポンス(応答)します。応答の仕方は様々で、新着情報を届けたり、データベースを検索したり、計算処理したり、受け取ったデータを蓄積したりします。HEAD、 GET、 POST、 PUT、 PATCH、 DELETEといった命令文が使われます。

一連の手続きを自動化することで、グルメサイトは自社で地図データを買い揃えずに済みます。Googleは利用者に、地図情報の表示方法をいちいち説明しなくて済みます。Googleに地図情報を販売する会社にとっても、多くの企業に自社データを売り歩く手間が省けます。そしてあなたは旅先で外出するたびに、大きくてかさばる紙の地図を買わずに済むというわけです。

 

分野別の事例

APIは、開発者にとっても助かる仕組みです。たとえ有料でも出来合いのプログラムを使わせてもらったほうが、自分でいちから関連文書を読み、コードを書き、きちんと動くか確かめなくても済むのですから。

この「書かずに/読まずに済ませる」ことが、API設計の基本的な考え方です。その簡単さから、今では無数の企業・組織がAPIの設計と公開を手がけるようになりました。

オープンAPIの検索サービスProgrammable WebのCEOニコラス・シエッロは、2015年1月にズーリッチで行われたAPIカンファレンスの発表で、「2005年から2015年にかけて、同社サイトで検索できるWeb APIが1件から10,302件に増えた」とする統計資料を発表しています。

きっとあなたも(知らないうちに)APIを利用したことがあるはずです。少し調べるだけでも、セクターごとに数々の先行事例が見つけられるでしょう。国内外の主だった事例を表にまとめてみました。APIを用いたデータ流通が、それぞれの産業界で「当たり前のこと」になりつつあるのです。

 

表 1:分野別のAPI活用事例(サービス連携、データ流通、標準化・他)

「API」という用語の系譜

もっとも、APIという用語は新しいものではありません。日本でも1989年には、すでにこの表現が使われています。マイクロソフトやパソコンメーカー、SIerが、32ビットパソコンの動作仕様の共通化に合意したときのことです。当時の主流OS「OS/2」とアプリケーション間のやり取りに関して、文字コード体系やかな変換方法、画面表示インターフェイス、マウスやキーボードなどの仕様が定められました。

この頃はまだ、「API」は同業者向けの「規約」として理解されていました。この伝統的な用例に従うなら、APIは例えば、「複数のアプリケーション等を接続(連携)するために必要なプログラムを定めた規約」 [高度情報通信ネットワーク社会推進戦略本部(IT総合戦略本部) , 2016]と説明されます。

 

システムとしての「API」

やがて90年代に入ると、外部の情報サービスと社内システムのデータ連携が盛んに行われるようになりました。例えば新聞社がデータ・プロバイダとして、ニュース記事や経済指標、企業情報などのデータベースを企業に提供し始めます。1984年にサービス開始した「日経テレコム(現:日経テレコン)」も、初めはインフォプロ、ライブラリアンら専門家を中心としたユーザ向けの検索サービスでしたが、90年代初頭から調査部門以外の利用が進みます(エンドユーザコンピューティング)。パソコンの値下がりとイントラネット普及がこれを後押しし、97年「日経テレコン21」発売時には、個々の企業は共通化された手続きに沿って、「日経テレコン」から最新のニュースクリップを自動取得し、企業内LANシステム上で自動更新できるようになりました(AutoCLIP機能)。これも、システムとしてのAPIの先駆けといえそうです。
ここでは「API」が、データ通信のための「規約」にとどまらず、第三者から提供されるコンテンツやサービス、機能そのものまで含む「システム」として理解されています。用例でいえば、「Web APIs are a system of machine-to-machine interaction over a network. Web APIs involve the transfer of data , but not a user interface」 [White House, 2012]とか、「国会会議録検索システムに登録されているデータを検索し、取得するための外部提供インターフェイス」 [国立国会図書館, 2014]といった記述が好例でしょう。

 

ビジネスプロセスとしての「Web API」

00年代に入ると、さらにインターネットが普及するにつれて、APIをWebで公開する企業が脚光を浴びました。2000年にはeBayやSalesforce.comのAPIが、2003年にはAmazonのProduct Advertising APIが公開されます。そして2005年にGoogleとYahoo!が、2006年にはTwitterがAPIを公開。多くのIT企業がこの流れに続いたことで、誰もがアクセスできる「Web API」は、エンジニアたちの市民権を一挙に得ました。

企業が基本無料で自社APIを一般公開することは、インターネットの初期理念のひとつ「オープン・フリー・シェア」の考え方とも合致していたからです。口コミの自然増殖とロックイン効果、マーケティング費用の抑制を狙って、とにかく多くのユーザに自社サービスを体験させたい企業にとって、その宣伝役となりうる開発者たちに自由な遊び場を提供するのは自然なことでした。このトレンドは世界中で多くの交流を生み出しました。当時、Apigee戦略担当副社長だったサム・ラムジが、2010年に「Open API Economy Meet up」を立ち上げたことが象徴的です。

例えば、エンジニア個人が腕試しに、複数のWeb APIを組み合わせたWebサービスを作り(Mash Up)、ホームページや個人ブログで公開する。それが話題を呼び、ベンチャー企業の設立にまで至る。優秀な学生を雇用したい企業がハッカソンを主催する。API利用の手ほどきを書いた投稿記事が、開発者たちの間で人気を集める。それがきっかけになって、担当者間の付き合いが始まり、新しい企画の芽になる――。

ここに至って「API」は、情報産業における「プロセスそのもの」を指す語にまで育っています。より詳しい歴史を知るには、地図APIの料理本(と称する)「Map Scripting 101」の著者アダム・デュバンダーが、2011年に作成した「Open API Growth: a Visualization」が便利です。

用例を見ても、「企業にとってより重要な関心事項となっている、オムニチャネル・ソリューションの構築、競合企業よりも迅速なイノベーションを推進すること、モバイル型企業への転換、ハイブリッド・クラウド環境で事業を運営すること、これらの全ての施策、そしてその先を実現するための根本的な要素」 [Jensen, 2016]だとか、「important tools for providing access to data and capabilities beyond the firewall」 [IBM institute for Business Value, 2016]といった記述には、APIに寄せられた期待が溢れます。

 

共通語としての「API」

すでに各業界や国際団体で、API文書の記述仕様を標準化する動きがあります。使いやすいAPIは、読みやすい書式で書かれます。関係者が各々独自のやり方を押し通していたら、せっかくAPIを提供しても、お互いに扱いづらいばかりか、得てしてまともに使われないからです。

よく知られた例では、Swagger、API BlueprintなどのAPI文書の作成ツール・コミュニティが標準仕様の開発を進めており、2016年11月には、Linux Foundationが中心となり、Microsoft、 Google、 IBMらが参加して、RESTful APIの書き方を標準化する団体Open API Initiativeが立ち上がりました。Swaggerを改称したもので、公的性質の色濃い団体となることへの期待と不安が語られています。

業界別にみても、Webサービスやデータベース、ECサイトなどが先行していましたが、スマートハウス関連データ(HEMSデータ利活用事業者間API標準仕様書)、VR端末(クロノス・グループ)、電子カルテ(日医標準レセプトソフトAPI)、生体認証(FIDO2.0)など各分野でもAPI仕様標準化の動きがあり、多くの仕様書がウェブ技術の標準化団体W3Cに提案されています。

成長著しいFinTech(情報技術による金融業の刷新)の分野でも、金融機関の口座情報に関するAPI仕様や認証システムの標準化がいよいよ始まりました。日本IBMが金融機関向けに「Fintech共通API」の提供を始めたほか、野村総合研究所「IT Solution Frontier」所収「金融分野のAPIエコノミー -オープンAPIが生み出す革新的なサービス-」 [遠藤圭介・高橋寛, 2016] によると、米国「FS-ISAC」が「Durable Data API」の開発に取り組み始めました。日本でも同所等が運営する「OpenIDファウンデーション・ジャパン」が「Financial API Working Group」を設け、検討を始めているとのこと。また金融庁では、2016年7月28日からフィンテックの法整備へ向けた金融審議会「金融制度ワーキング・グループ」を開催。同審議会では「決済高度化のためのアクションプラン」を提示し、「決済における中間的業者」の取扱いをめぐってオープンAPIをめぐる状況と課題を検討。これを受けて全国銀行協会が10月28日に「オープンAPIのあり方に関する検討会」を設置。正会員向けのアンケート調査など国内事業者の対応状況を踏まえて、仕様の標準化、セキュリティ原則、利用者保護原則、法制度面での課題などを検討したうえで、2016年度中に取りまとめを行うとしています。

 

国家戦略としての「API」

こうした動きは、国内外で産学官民を問わず加速しています。先進各国の政府が、データの国際流通を活発にしようと、様々な障壁を取り除こうと働きかけているためです。米国政府が、2012年3月23日に発表した電子政府戦略「Digital Government: Building A 21st Century Platform to Better Serve the American People」(注1)を読んでみましょう。そこでは次の4原則が掲げられています。

 

  • 情報本位(Information-Centric)
  • 共有の場(Shared Platform)
  • 顧客本位(Customer-Centric)
  • 安全と安心(Security and Privacy)

 

このうち「情報本位(Information-Centric)」の章では次の通り明言され、実際にGSA(General Services Administration米連邦政府一般調達局)が、政府機関のAPI対応を支援しています。 [White House, 2012]

 

  1. Make Open Data, Content, and Web APIs the New Default
  2. Make Existing High-Value Data and Content Available through Web APIs

 

日本では内閣府IT情報戦略室が、「世界最先端IT国家創造宣言」を作成し、データ流通基盤の普及や利活用に向けた方針と工程表を年次で改定しています(2013年6月14日決定、2016年5月20日改定)。2016年には「情報銀行」などへの言及が話題になりましたが、当初は「手段」として言及されたAPIの「活用」に着目した記述が増えていることにも注目です。

行政分野ではさらに、データの「構造」も共通化しようとの流れがあります。「共通語彙基盤整備事業」といって、行政機関が用いる「語彙」(データに使われる用語の意味内容や項目、構造など)を統一する事業が展開され、無料の変換ツールの開発も進んでいます(2017年度に公開予定)。その成果は経済産業省「法人ポータル(β版)」(注2)や総務省「統計LOD」、京都市、北海道森町などの自治体に採用されており、新たに作成するデータを県や近隣自治体のグループなどの単位などで統一する試みもスタートしています。

米国でも越境交流が盛んです。飲食店の口コミサービス「Yelp」は2012年に、行政機関が持つ飲食店の衛生検査データを自社サイトに集約しようと、オープンデータ標準「LIVES」を開発しました。「Code for America」の支援を受けて開発が進められ、米国各地から17の地方自治体が参加しています(2016年9月現在)。またYelp自身も、クラウド事業者Socrataが主宰する「Open Data Network」に参加して、LIVESのデータを他の参加者に開放しています。

 

(注1)2017年政権交代に伴い、オバマ大統領時代コンテンツはアーカイブサイトに移行した。

(注2)経済産業版法人ポータル(β版)は、政府全体法人ポータルサイトである「法人インフォメーションが20017年1月19日に開始したことに伴い、当該サイトにデータを移行した。

 

経済圏としての「API」

世界では何が起きているのでしょうか? APIの経済圏(エコノミー)が立ち上がっているのです。すでに、API設計のための業務工程を支援するツール/サービスが、数多く市場に投入されています。

というのも、APIを利用するには、あまたあるWeb APIから目の前の業務に即したものを見つけ出し(検索)、迅速かつ詳細に関連ドキュメントを点検して(読解)、自分が望む結果を得られる仕組みを考え(考察)、それをプログラムとして書き出し(記述)、問題なく動作しているか確かめる(検証)といった作業が求められます。必要なら自社サービスの機能にまで落とし込んで(企画)、接続の安全性や端末間の互換性を確保し(開発)、関連文書を作成する作業(文書化)も求められます。

地道で、大変で、面倒な作業です。エンジニアたちの個人Blogでも、API仕様書の書き方指南や、読みやすい文書の作成に苦しんだことの報告、便利ツールの紹介などが熱心に投稿されています。

 

1.       APIマネジメント企業

それもあって、APIマネジメントといって、APIを効率的に記述し、管理し、公開するためのツール、手段、サポートが充実しています。関連事業には、Mashape、Apigee、Infochimps、Mashery、Swaggar、Blueprintなどの新興企業が参入しています。彼らがAmazonやGoogle、Facebook、Intelなど大手プラットフォーム企業から出資・買収されるニュースも報じられています。老舗ICT企業でも、CA Technologies、IBM、インテル、Microsoft、Oracleなどが関連ソリューションを提供。各社は日本でも精力的に啓発活動を行っています。

例えば、富士通やTISはApigeeのツールを取り入れたクラウドサービスを販売しています。BriscolaはMashapeと販売パートナシップを締結しました。ANNAIは、Drupalをベースにしたデータ公開用ソフトウェアDKANの導入サポートを手がけます。「ITR Market View:システム連携/ミドルウェア2016」によれば、日本のAPI管理市場は2015年時点でまだ5億円規模と小さいながら、Mash Up AwardやMeet up Tokyoなどの開発者コミュニティが、いよいよ賑わっていると聞きます。

 

2.       大規模データ処理のためのAPI

自分からデータを提供するだけがAPIの使い方ではありません。大規模データを預けて、分析してもらい、結果を返してもらうためのサービスもあります。良くも悪くも「人工知能」が世界中で一世を風靡したので、もしかすると、こちらのほうが一般に知られているでしょうか。

大手IT企業が、自前のクラウドサービスと連携させた機械学習ライブラリやその操作ツールを、研究者向けないし一部無料で一般公開する例は、もはや枚挙に暇がありません。サービスでいえばIBM Watson、Google Graph API、Amazon Machine Learning、Microsoft Machine Learning、企業でいえばYahoo!、Facebook、Apple、日本では富士通、日立製作所、東芝、NEC、NTTなどなど。暗号化や匿名化、セキュリティの技術研究の成果も組み合わせながら、驚くべき速さで商用化・実用化が進められています。NTTコミュニケーションズの開発者Blogが、API公開の手引きや事例紹介を早くから行っています。近年の歴史を知るには、データリソース社「米国大手ITベンダーに見る人工知能技術の事業化の方向」の付属年表が端的です。Algorithmiaのように、科学者や分析者が個人開発した機械学習のライブラリを、APIとして売買できるWebサイトまで登場しています。

 

3.       DMP(データ・マネジメント・プラットフォーム)を用いたAPI連携

デジタルマーケティングの業務部門では、データ・マネジメント・プラットフォーム(DMP)といって、データ分析の担当者が社内外のデータを効率よく収集し、分析するための管理ツールが普及しています。Excelなどの表計算ソフトでは手作業が煩雑すぎるが、かといってRやSPSSのような統計ソフトでは使いこなせる従業員が限られるし、HadoopとかSparkとかRedshiftなんて言われても何のことだかよく分からない。そうしたとき、チーム内のデータを手際よく管理する手段として注目されているのです。

事業部門のニーズに呼応して、元データをcsvファイルでアップロードしたり、RDBMSやCRMツール、ERPシステムなどの社内データベースからデータ抽出するだけでなく、Google Analyticsのような汎用分析ツールと連携したり、スマホアプリの操作ログやSNS投稿データ、気象情報やWebメディアが持つオーディエンスデータなど、第三者データをリアルタイムにAPI連携する機能も開発・導入されるようになりました。

周辺領域では、様々な特徴を持ったソフトウェアが登場しています。クラウドサービスとして月額課金で利用できるデータ保有基盤「Treasure Data」、顧客オーディエンスデータの収集・連携に特化した「Intimate Merger」、データの前処理や変換、集計作業を一画面でまとめて操作できる「Alteryx」、グラフの描画や地図へのプロット、検索条件の変更などインタラクティブなデータの視覚化に特化したBIツール「Tableau」、従来のデータ統合技術(ELT)との機能連携を強調し、社内外に散財するデータを「まとめずに、つなぐ(データ仮想化)」ことを標榜する「Denodo Platform」などがあり、どの領域にも数多くの競合製品がひしめく激戦区です。これらの連携にはデータAPIが使われていて、Web広告業界などでは、プラットフォーム間のデータ流通がすでに十分に自動化されていると聞きます。

 

4.      パーソナルAPIアプリ

よりパーソナルで、カジュアルなサービスも登場しています。2010年にスタートしたIFTTT(イフト)は、複数のWebアプリを連携して自動実行する「レシピ」を作成できます。FacebookにTwitter、Evernote、Dropbox、Gmailなど世界的に人気のWebサービスを取り揃えていて、「レシピ」は351に上ります(2016年9月現在で)。サービス名は「If This, Then That(ああすれば、こうする)」の略称です。例えば「Todoistでcompleteしたタスクを完了タスク一覧としてevernoteにメモ」したら、報告書の作成が楽になりそうです。Webサービス連携でLED照明の色を変更できるPhilip hueと連携して、「Instagramにアップロードした写真のカラーを部屋の照明と同期させる」ことも出来ます。

2015年にはYahoo!ジャパンが、日本版IFTTTともいわれるMy Thingsをローンチしました。ヤフオク!やニコニコ動画、LOHACO、Tポイント、ともだち家電など日本企業のAPIが揃っています。日本語メニューで使えるところも便利ですね。「チャネル」(IFTTTでいう「レシピ」)は50ほどながら(2016年9月現在)、IoT時代の到来を実感できそうです。

 

API経済圏の成立条件

これまで見てきた通り、APIの経済圏(エコノミー)には無数の法人・個人が参加し、ひとつのネットワークを形成しています。しかしその一方で、Web APIを用いたサービス開発と比べて、データAPIの提供はまだ発展途上。業務のデジタル化が進んだ業界の、それも先進的な企業の間で、DMPやAPIマネジメントツールを用いたデータ連携が徐々に普及している段階です。

それでは、企業間のデータ流通市場を立ち上げるには、何が求められるのでしょうか。何はさておき、業界ごとの商習慣に沿ったビジネスモデルの検討は求められるでしょう。ここではWeb APIのビジネスモデルを検討しましょう。先行研究による分類例をもとに、次のように整理しました(DMPを用いたデータ連携の生態系はやや複雑なので、「分析技術・学術情報」で詳しく論じます)。

 

図 2 ビジネスモデルの分類(野村総合研究所、ITRの分類を参考に作成) [遠藤圭介・高橋寛, 2016] [内山悟志, 2015]

野村総合研究所「IT Solution Frontier」所収「金融分野のAPIエコノミー -オープンAPIが生み出す革新的なサービス-」とダイヤモンド社「内山悟志 経営のためのIT」所収「企業に“自前主義”からの脱却を図る『APIエコノミー』とは何か?」を参照しています。

今後、ますます多くの企業・自治体が、自前のAPI提供に取り組むと思われます。誰にどんな価値を提供し、何で収益をあげるのか。最適解の模索がなされるなかで、各業界でどのデータ流通プラットフォームが、自律と安定を手にするのか。各プラットフォームは、互いにどのように棲み分け、助け合うのか。データ流通産業の分水嶺が、いよいよ訪れることになるでしょう。

 

APIエコノミーとは何故そう呼ばれたか?

それにしても、APIを「活用する」とはどういうことでしょうか。文書であり、システムであり、ビジネスプロセスでもあって、共通語でも国家戦略でも経済圏でもあるようなものを、どうすれば「活用」したことになるのでしょうか?

ふり返ってみましょう。Web APIが従来のAPI提供と一線を画していたのは、1. API利用者が機能だけでなく、ビジネスやサービスを組み込めるようになったこと(日用化)、2.プログラム開発者だけではなく、無数の働き手や消費者が恩恵を受けられたこと(一般化)、3.API提供者と利用者が直接につながり合えたことです(社会化)。それぞれを詳しく見ていきましょう。

 

1.       利用メリットの日用化

API利用者にとっては、低コスト・短期間でのサービス開発、顧客とのコンタクトポイント増加、既存製品のサービスレベル向上などが期待されます。対するAPI提供者は、自社サービスのチャネル拡大や、提供データの付加価値の向上、自前で創造できない新たなビジネスの立ち上げが期待できるでしょう。

そんな風に、提供者と利用者が気持ちよく相手とつながるには、APIのコードや仕様書が、読みやすくて書きやすい記述でなければなりません。だからWeb APIの提供者は基本的に、自分で書いたAPI仕様が、不特定多数のAPI利用者に活用されることを意識しています。

用例にも日用的な感覚が表れます。例えば、「ソフトウェアが『こういう情報を教えて(渡して)くれれば、こういうことしてあげる or こういうものを返してあげる』と公開する仕様」 [K.K., 2016]だとか、「他社のプラットフォームの機能を自社のアプリケーションに組み込もうとした場合、一からプログラミングするとかかる手間を省くために、プラットフォーム側の企業が提供するインターフェイス」 [Yahoo! Japan, 2016]といった記述からは、APIが便利で・気軽に使えるものであることが示唆されています。

 

2.       関連サービスの一般化

一般の方がAPIサービスを体験することも「当たり前」に近いものになりました。気の利いたホテルなら、館内の端末からUberの配車サービスや、Open Tableのレストラン手配サービスが使えるでしょう。家計簿アプリで証券口座や銀行口座を一元管理する方も増えていますね。あなたが起業を志したなら、大手銀行のWebサイトで、法人口座の開設と必要書類の作成を行えるワンストップサービスを試してみる価値はあります。あなたがまだ学生で、ソーシャルメディアに外部アプリを連携して楽しんでいるなら、API連携でよく使われる仕組み「OAuth」を用いた確認画面を見たことがあるはずです。

公共機関が提供するサービスも増えています。オープンデータ政策の一環です。政府省庁は多くの調査データを「e-Stat」にまとめています。地方自治体はデータカタログサイトで、避難所やトイレの場所、観光地情報などを公開しています。私たちはこれらのデータをWeb API経由で取得できます。市民参加型のハッカソンを開催して、これらのデータを使ったスマホアプリが共同開発された例も増えました。

学術論文を検索・共有する分野でも、オープン・アクセスを掲げ、早くからAPI開発に取り組んできました。国会図書館サーチやCiNiiのWeb APIなど公共機関によるものだけでなく、トムソン・ロイター社の学術情報ソリューション、図書館検索サービス「カーリル」、論文管理ソフト「Mendeley」など、民間事業者も積極的にAPI提供を行っています。

 

3.       コミュニティの社会化

多くのオンライン・コミュニティがそうであったように、Web APIに関わる人たちは、API提供者と利用者が直接につながり合えたことで、分野ごとに独自の社会ネットワークを形成して来ました。この営みを理解する補助線として、シェアリング・エコノミーの思想は真っ先に参考になるでしょう。

その典型として名高いUberは、ドライバーにクラウド型の雇用を、消費者により小さな単位での自動車利用を提供しています(APIエコノミーの解説記事では定番の事例です)。

もちろん一方では、過重労働や制度違反、旧来の商習慣との軋轢、利用者間トラブルなどの懸念も指摘されます。また他方では、余計なコストをかけずに良質なサービスを手に入れたいという、私たち生活者の知恵と工夫の進歩があります。そしてその背後には、高度に管理された部品調達の商流や、極限まで効率化された工場生産、盤石な製品供給網を築き上げた、自動車産業界の工夫と奮闘の歴史があります。

提供者と利用者の役割に流動性があることも特徴的です。今日のドライバーは明日の乗客かもしれませんし、カーマニアの整備工員にクラシックカーを貸した人が、運転免許を持たない家族と旅するためにキャンピングカーを借りる日もあるでしょう。

そもそも「Share」という語は、「分け合う、共有する」といった用法だけでなく、「役割を担う、負担する」「一緒になる、一致する」といったニュアンスでも使われます。データ産業でも同じように、購買の単位が小口化され、いつでも好きな単位(時間、量)で手に入るなら、データを「所有」する意味は薄れるでしょう。小単位の「流通」が簡単になれば、自社のデータに新たな価値が与えられるかもしれません。代わりに、セキュリティ、プライバシー、役割分担、組織運営、企画づくり、価格設定、ユーザ目線の意識など、留意すべきことも際限なく増えて行きますが。

いずれにせよ、これからデータ流通について学びたい方は、オープンAPIに関わる人々が、かつてある種の開かれた社会を作り出して来たことに注目すべきかもしれません。非常識と無作法がもたらす悪事や粗相、誤解も起きていますし、実際の業務現場は猥雑で泥臭いものですが、理想的にいって、エコノミー(経済圏)とは善意と気配りで支えられる公共の空間であるべきだからです。

 

参考文献リスト

データカタログサイト(https://docs.google.com/spreadsheets/d/1mP16fi2wdMAfE0NCG7TDlzVtBN0gTjxwiIkjjo9xlZg/edit#gid=0)へ、本記事の参考文献リストを掲載しています。紹介した企業・サービスの概要も登録しています。

 

 

農林水産・食糧生産

【予告】

農業、林業、牧畜業、漁業、水産業など、自然界に直に働きかけて資源を得たり、得た資源を加工する分野のデータを取扱います。また、食糧需給や生産指数、国際統計などの統計データもピックアップする予定です。データの生成源や用途によって、「気象・自然環境・宇宙」や「家庭と暮らし」とも重複します。

(Coming Soon…)

経済指標・エネルギー

【予告】

人口(デモグラフィ)や金融・経済指標、資源・エネルギーのデータに加えて、市場・産業動向を示すマクロ指標も取り扱います。

「企業経営とビジネス情報」「製造・工業」などのカテゴリのように、隣接するミクロデータがあるようなデータは、他カテゴリとも重複がありえます。

(Coming Soon…)

企業経営とビジネス情報

【予告】

信用情報や取引データ、特許情報、市場調査や産業統計など、各業界で古くから使われてきたデータを取り上げます。労働・職場のデータ、法人・団体のデータなど、近年に取得端末の普及やデータ基盤の整備が進む分野のデータについても扱う予定です。

(Coming Soon…)

行政オープンデータの歴史に学ぶ、データ公開の制度と実践

「うちのデータを公開して、何の意味があるの?」と聞かれたら、政府の事例を紹介してみましょう。

 

オープンデータ運動は、国際組織や各国政府などが現地の市民と協力する文化・社会運動として、すでに10年以上の歴史を有します。ともすれば「足取りが遅い」「発想が固い」と言われがちですが、その地道な足跡をふり返ると、企業や個人がデータを世間へ広めたいと考えたとき、どんな不安や課題があって、制度や組織をどう工夫すれば上手く行くかを学べる、先行事例の宝庫だと気づかされます。

 

(清水響子・本誌編集部)

 

 

オープンデータとは何か?

 

「オープンである」とは、どうあるべきか?

 

オープンデータの定義には諸説ありますが、もっとも寛容な考え方を採用するなら、「どんな目的のためでも制約なしに、誰もが自由に利用、再利用、再配布できるのであれば、そのデータは「オープン」であると考えてよい(Data are considered to be “open” if anyone can freely use, re-use and redistribute them, for any purpose, without restrictions.)」と言えるでしょう。 [The World Bank]

もちろん、データの公開状態や形式による格付けもあります。なかでも「5 Starデータモデル」は有名で、下図の通り、利用、再利用、再配布が行いやすい順に5段階の区分を示しています。

 

図1:5Starデータモデル

 

「オープンにする」とは、何をすることか?

そのせいか、「(csvやExcelなど)機械判読可能なデータでないと使いづらい!」との声も少なくありません。一方で、オープンデータを支援する国際団体が、「最も大切なこと」の1つとして次のように助言しています。

 

利用できる、そしてアクセスできる
データ全体を丸ごと使えないといけないし、再作成に必要以上のコストがかかってはいけない。望ましいのは、インターネット経由でダウンロードできるようにすることだ。また、データは使いやすく変更可能な形式で存在しなければならない。

――「OPEN DATA HANDBOOK」(Open Knowledge International)から

 

「インターネット経由でダウンロードできるようにすること」は「望ましい」とするところが意外ですね。この理解に立てば、「営利目的も含めた二次利用が可能な利用ルールで公開された、機械判読に適したデータ形式のデータ」 [一般社団法人 オープン&ビッグデータ活用・地方創生推進機構, 2016]ではなくても、個別の開示請求に基づいて提供されるデータだって、「非公開ではない」という意味で「オープンな」データでしょう。

さらには、こうした動きをひとつの文化・社会運動であると捉えて、「特定のデータが、一切の著作権、特許などの制御メカニズムの制限なしで、全ての人が望むように利用・再掲載できるような形で入手できるべきであるというアイデア」 [オープンデータ, 日付不明]であるとか、「日々生成・蓄積されるデータを共有資産として有効活用しようという営み」といった説明 [柏崎吉一, 2017]もなされます。

複数の見解が――当初の理念や原理的な理解、一般的な定義、簡易な解釈などと――並存しているのです。これは、「オープンデータ」という語が浅からぬ歴史を持ち、一般に広く知られ、公に語られ始めたことの裏返しです。その歴史を大まかにふり返ってみましょう。

 

オープンデータ運動の国際史

北西欧から米国へ、そして世界へ

 

図 2オープンデータ化に関する動き(Wikipedia等を参考に筆者が整理)

オープンデータという言葉を各国政府が用い、本格的に取組みを推進し始めたのは2009年のことです。その源流は米国と英国の公的プログラムにあります。2004年にケンブリッジ大学が、各国のオープンデータサイトを集約・公開するOpen Knowledge Internationalを始めました(2016年12月現在で520サイト)。続いて国連が2008年にun.data.orgを、世界銀行は2010年にWorld Bank Open Dataを開設し、各国政府のデータ公開を牽引して来ました。 [Data Portals, 日付不明]

さらにニュージーランドやノルウェーなど北欧各国が政府公式のオープンデータサイトを開設するなど、この動きは2009-2010年にひとつのピークを迎えます。そして2011-2012年には東アジア、南北アメリカ、アフリカ、西欧各国が相次いで参画。この盛り上がりを受け、2013年のG8サミット(主要8カ国首脳会議)では、キャメロン英国首相の主導により「オープンデータ憲章」が採択されました。その頃から日本の取組みも加速します。

まずは国連とその関連組織の施策を詳しく見て行きましょう。企業や自治体が外部にデータを提供するとき、どういった制度や組織を作ればよいのか参考になるからです。

 

国際連合は何のために、どう計画して来たか

 

図 3 国連・関係機関のオープンデータサイト

ご存知の通り、国際連合は、経済・社会に関する国際協力や安全保障を目標に活動しています。その実現には、企業活動と同じく、適切なデータに基づく現状把握と計画管理が欠かせないのでしょう。すでに国連開発計画「UNDP Projects」では、地域や開発テーマ(Responsive Institutions、Climate Change & Disastar Resilienceなど)の予算出所ごとに、(国連開発計画、EC、国別の政府予算など)各プロジェクトの予算消化状況等を地図で表示できます。 [林雅之, 2013]

2000年9月に国連は、21世紀の国際社会の目標として「国連ミレニアム宣言」を採択しました。また、この宣言を実行する目標として「ミレニアム開発目標(Millennium Development Goals: MDGs)」を策定。国際社会が2015年までに達成すべき8つの目標と21のターゲット、60の指標が設定されました。

 

そして、15年後。MDGsはさらに、「我々の世界を変革する:持続可能な開発のための2030アジェンダ」(2015年)の採択に伴って、「持続可能な開発目標(Sustainable Development Goals: SDGs)」として対象を拡大。新たに17の目標、169のターゲット、230の指標が設定されました。MDGs・SDGsの開発目標を見ると、国連がどんなテーマを重視し、どういった指標で計画管理を進めているのかよく分かります。

 

図 4  MDGsとSDGsの開発目標

もっとも、国連が目指すモニタリング体制の確立には、まだまだ時間がかかりそうです。2015年の調査では、「MDGs及びSDGsの指標が算出可能」と答えた国は、最も回答が多かった「G.4 公平な教育機会」関連でも8割程度にとどまります。「G14. 海洋、海洋資源の確保」などは、特にデータが不充分な領域のようです。 [Statical Commission, 2015]

 

図 5 UNSD第46回検討会資料「加盟国の進捗状況に関する国際アンケート調査結果」から抜粋

日本政府の推進戦略

 

お手本になる? 行動計画と規約の整備

日本ではどうでしょうか。日本政府が本格的にオープンデータに取り組み始めたのは、2012年のことです。同年IT総合戦略本部が策定した「電子行政オープンデータ戦略」には、積極的な公共データの公開、機械判読可能な形式での公開、営利目的も含めた活用の促進などが盛り込まれました。これを皮切りに、国内の制度・規約の整備が進みます。

2012年7月には総務省の主導で「オープンデータ流通推進コンソーシアム」が設立されます。オープンデータ流通の環境・基盤整備を推進する団体で、交流会・検討会を定期開催するほか、「情報流通連携基盤システム外部仕様書」「オープンデータ利活用ビジネス事例集」「データの公開・利活用に関するツール集」など実務者向けの参考資料を作成・公開しています(2014年に一般社団法人オープン&ビッグデータ活用・地方創生推進機構(VLED)が継承)。また12月10日には、「電子行政オープンデータ実務者会議」の第1回会合[1]が開催され、同会議主導のもと「政府標準利用規約」(第1.0版)が制定されました(2015年に第2.0版を公表)。行政が公開する情報の権利規定を整理した規約で、「原則として著作権フリーであること」が明示された画期的なものです。

こうした地ならしを踏まえて、2013年6月24日に閣議決定された「世界最先端IT国家創造宣言」(以下、「宣言」)では、政府が持つデータのオープン化が力強く謳われました。続く10月29日には「日本のオープンデータ憲章アクションプラン」 [各府省情報化統括責任者(CIO)連絡会議決定, 2013]が決定。政府による大方針が示されたことで、自治体でもデータカタログサイトの開設などが進みます。

さらに、2016年5月20日には、「宣言」の改定と合わせ、「【オープンデータ2.0】官民一体となったデータ流通の促進」を発表。また、12月15日に開催された「未来投資会議構造改革徹底推進会合」の配布資料「第4次産業革命(Society5.0)・イノベーション」には、2020年までを「オープンデータ集中取組期間」と定め、「IT戦略本部及び官民データ活用戦略会議の開催を行う」と明記されます。 [内閣官房情報通信技術総合戦略室, 2016] 他にも、2017年度には「地域未来投資促進法(現:企業立地投資法)」の改正が見込まれています。この法律に則って、将来には、今よりも多くのデータが請求・開示されることになるでしょう。

 

どんなデータが、どこで手に入るのか?

日本政府のオープンデータを概観すると?

それでは、実際にどのようなデータが公開されているでしょうか。趨勢を知るために、日本政府が「DATA.GO.JP」で公開するデータについて、種類と形式の統計を取ってみました。

 

データの種類

分類別に見てみると、「行財政」が最多の29%(図6)。続く「司法・安全・環境」「運輸・観光」「国土・気象」「教育・文化・スポーツ」がそれぞれ9-11%で、これらで全体の過半数を占めます。さらに、登録されたデータセット全体の名称をテキスト分析してみると、国民生活に関する統計、学校教育や科学調査のデータ、政治活動の予算・公示などのデータが収録されていることが窺えます(図7)。

 

図 6 DATA.GO.JPで公開されているデータセットの種類の分布(左)
図 7 DATA.GO.JPのデータセット名に含まれるキーワード(右)

 

ファイル形式

ファイル形式の推移も見てみましょう。[2]2013年には15,000件弱だったデータセット数が、2015年には20,000件以上公開されて、累計51,552件に至っています。年々、オープン化が進んでいるとわかります。

 

図 8 OPEN DATAに登録されたデータセットの件数(左)
図 9 DATA.GO.JPに登録されたデータセットの割合(右)

よく指摘されるように、その内訳のうち、約40%がPDFです。調査報告書が多数掲載され、「文献」として貴重ですが、加工や集計には使いづらいですね。

次いで多いのはHTMLです(約30%)。「HTMLでいいの?」とお思いかもしれませんが、スクレイピングツールを使えば、PDFに比べてデータを取得・加工しやすいのです。Chrome拡張機能のScraperimport.ioなど、無料ツールも使えます [わいひら(yhira), 2016](分類は「HTML」なのに、リンク先がPDF文書の一覧ページだったりすることもありますが……)。

 

機械判読を阻む壁は?

機械判読性で劣るPDFやHTMLの比率が高いのはなぜでしょう。オープンデータに限りませんが、「改ざん防止」「印章が必要」「形式の統一」といった行政文書に特有の制約に加え、二次利用を前提に集計データを加工する作業負荷もあって、公共サイトでは従来、どうしてもPDFの比重が高くなりがちなのです。[3]

日本語独特の「記法」も課題です。日本語は膠着語に分類され、英語のように単語と単語の間に空白を置きません。「東京都」と「京都」の違いを機械に判読させるには工夫が必要でした。公文書の「作成法」も、テキストデータの扱いを難しくする一因です。印刷時の見た目を優先して、「総 務 大 臣」などと一字空けした書き方をすると、その単語は「総務大臣」だと認識されません。悲しいかな、データ活用の推進を目指す法案でさえ、ベタ打ちの文書を公開するのがやっと。

 

図 10 構造化されていない文書の例:官民データ活用推進基本法案

 

集計しやすいデータは増えていないの?

それでも、編集や集計のしやすいデータも今では相当数が公開されるようになりました。5 Starモデルの★★~★★★★★に相当します。図8・9の通り、「Data.go.jp」でもExcelやcsvの割合が約25%まで増えています(2015年の前年比。件数では約1,000件増)。

また、「e-Stat」(開発:総務省統計局, 運営:独立行政法人統計センター)では、約600種類ある政府統計のうち、550の集計表(約120万表、Excelまたはcsv)と67の統計(約8万データセット、XML、基幹統計52統計を含む)を提供。XLS、XLSXでのデータ提供(2008年から)、XML及びjson形式の対応(2014年。APIも開放)、LODに対応した「統計LOD」(2016年。国勢調査や経済センサスなど7種類を対象)など着々と施策が進み、全体のダウンロード数は今や年間約5,000万件に達しました。 [独立行政法人統計センター, 2016]

 

もっと詳しいデータは提供されないの?

「もっと詳しいデータはないの?」といった要望にも応えて、各省庁が分析用データの提供も始めています。

厚生労働省は「医薬品副作用データベース」(2010年から)、「レセプト情報・特定健診等情報データベース」(2011年から)、「国民生活基礎調査」の匿名データを提供します。総務省は、国勢調査、住宅・土地統計調査、全国消費実態調査、労働力調査、就業構造基本調査、社会生活基本調査の6つを提供。傘下の統計センターが要望に沿ったデータを作ってくれる「オーダーメード集計」(2006年)に加えて、より個票に近い「匿名データ」(2012年)の提供も行います。どちらもデータの利用目的は「学術研究の発展や、高等教育の発展に資すること」に限られ、事前審査もありますが、数万円・1ヶ月ほどで高品質のデータが購入できます。

 

地域のデータはどこで入手できる?

図11 地域資源データ共有サイト CityData

 

自治体もオープンデータを提供しています。やり方は様々ですが(公式ホームページ、独自のカタログサイト、地域共有サイト、一般社団法人リンクデータのような半官半民団体など)、概況を知りたい方は、地域資源データ共有サイト「CityData.jp」(Linkdata.org)が便利です。データセット数とアイデア数を評価指標とした自治体ランキングを公開しています。

長野県須坂市、神奈川県横浜市、福井県鯖江市などが上位に名を連ねます(2016年12月現在)。最上位の須坂市の公式サイト「いきいきすざか」を見てみると、「Linkdata.org」でデータ公開するだけでなく、市民からオープンデータの提案を受け付けていて、名古屋大学大学院の遠藤守教授、兼松篤子研究員らが精力的にデータを作成・公開しています。

 

オープンデータの作り方 ――現場の悩みと解決策

 まずは、手順を知ることから

それでは、自組織でオープンデータを作るにはどうすればいいのでしょうか。作業手順は「5つ星オープンデータソン作業手順」などにまとまっていますので、ここでは日本と米国の「考え方の違い」を比べてみましょう。参照するのは「オープンデータをはじめよう」 [内閣官房 情報通信技術(IT)総合戦略室]と「Data Lifecycle Recommendations」(The 2016 U.S. Open Data Roundtable)です。

 

図 12 オープンデータ作成手順の日米比較

日本の資料は真っ先に「担当チームを決めよう」を挙げるなど、組織のルール・意識づくりに焦点を当てます。「地方自治体における情報システム基盤の現状と方向性の調査」 [独立行政法人情報処理推進機構, 2016]で、自治体が「推進体制が決まっていない」(66.1%)「職員のスキル、ノウハウが不足している」(66.3%)を最上位の課題だと回答していることと符号していますね。

対して米国の資料では、データ品質向上を推奨するほか(Standarization, Managing Privacy)、組織外から協力を得ながら進める姿勢が垣間見えます(Communities and Collaboration)。そして、どちらも改善(Improvement)を重視しています。たしかに、一度データを公開したら終わりではなく、利用者の声を集めたり、データの利用状況をモニタリングすることは重要です。

 

「投資対効果は?」と聞かれたら

とはいえ、自治体ごとにも温度差があります。内閣官房や総務省が熱心に成功事例を紹介したり [内閣官房, 2016] [総務省, 2015]、2017年2月にはIT総合戦略室が自治体向け標準フォーマット例を公開したり [電子行政オープンデータ実務者会議, 2017]しているのですが、「地方自治体における情報システム基盤の現状と方向性の調査 [独立行政法人情報処理推進機構, 2016]」では、「未検討」が45.2%。「効果が実感できない」との声が毎年寄せられます。市場規模1.0~1.2兆円、直接効果1.5兆円、経済波及効果5.4兆円といった推計 [林雅之, オープンデータ・ビジネス(3)オープンデータの経済効果, 2014]はあるものの、はっきりした「効果」を実感できる身近な事例が、まだ多くないからかもしれません。

Gartnerの発表によると、2019年までには、数百万人規模の都市の50%以上の市民が、IoTやソーシャルネットワークを通じて自らのデータ共有に応じ、全ての自治体の20%が、付加価値のあるオープンデータにより収入を獲得すると予測しています。 [Gartner, 2016] 一方で、「Innovation Nippon 研究会報告書 オープンデータの経済効果推計」では、オープデータの経済効果を年間1,800億円~3500億円と試算しつつも、オープンデータの経済効果について「厳密な値ではない」「意味が多義的である」と効果推計の難しさを論じています。

 

事業メリットは大いにある?

もっと分かりやすいメリットも考えてみましょう。グルメ口コミサイトYelpでは、サンフランシスコ市、ニューヨーク市がオープンにした飲食店の衛生管理データをAPIで取り込み、自社サイトで表示しています。飲食店にとっては宣伝効果や信頼醸成が期待でき、利用者は衛生状態を考慮してお店が選べるようになり、Yelpにとっては掲載情報が充実できます。

この例では、衛生管理データを公開したあとにページ閲覧や予約、口コミ、売上などが増えたお店を見つけて、それ以前のデータと比較すれば、衛生管理データの公開が生み出した経済価値を推計できます(掲載に伴って店舗側のサービスが向上したなど派生要因も含むので、データ公開自体が持つ効果は限定的かもしれませんが)。

ほかには、後述する行政サービスのコスト削減情報資産の可視化といった経済効果が考えられます。

 

自由と制限の折り合いはどう付ける?

埼玉県の広域オープンデータプロジェクト

日本にも参考になる事例があります。2015年に埼玉県が「県の広報情報をオープンデータとして民間企業へ提供開始!」したとき、利用規約で利用方法や利用条件、申請方法を厳しく制限していたことから、「埼玉県の「オープンデータ」が色んな意味ですごい!」と疑問の声が上がり、公開からわずか2日でWebサイトが閉鎖。政府や市民からも指摘が相次ぎ、毎日新聞にも取り上げられる騒ぎになりました。「オープンの意味が分かっていない」とする立場と、「オープンデータであることよりも、オープンであることの方が重要」 [東富彦, 2015]とする立場で意見も割れました。その後、埼玉県庁では、利用規約から事前申請を必須とする一文を削除。いまではCC-BYでデータを利用でき、「埼玉県の対応の早さには驚いた」と評価されました。

 

こうした試行錯誤を経て、「Open Data Saitama」では、2017年から埼玉県内の58市町村が参加し、10種類のデータセットを共通フォーマットで提供し始めました。 [埼玉県, 2017] 対象データ選定や共通フォーマット検討のため、当初からデータ保有者である19の市町村に加え、データを利用したい民間企業・組織が参加したワーキンググループを開催(ヤフー、日立公共システム、ソフトバンク・テクノロジー、富士通、りそな銀行などが参加)。利用ニーズの強いデータを数ヶ月に渡って共同検討し、相互運用性の高いIMI共通語彙基盤を取り入れた提供形式で公開(経済産業省、独立行政法人情報処理推進機構(IPA)が協力)。すでに株式会社ミラボが予防接種アプリに施設情報・イベント情報を、一般社団法人オープン・コーポレイツ・ジャパンが「マイ広報紙」にイベント情報を、株式会社ぱどが情報誌「ぱど」にイベント情報を掲載予定です。

 

意外なハードルの柔らかい乗り越え方

トップダウンとボトムアップの組み合わせで、各方面の利害調整を巧みに実現した事例です。政府の指針に沿って埼玉県庁が音頭を取ることで、県内自治体は首長の同意を得やすくなりました。また、担当職員が原課にデータ公開を求めるとき、共同検討の成果が説得材料になりました。そして、共通語彙基盤を採用したことで、「どんな形式で公開すべきか」との議論も避けられています。

ワーキンググループを取りまとめた企画財政部情報システム課の森田康二朗主査は「自治体では、データをどう出せば良いのかを決めるハードルが意外に高い。ワーキンググループには、行政がデータを出しやすくなるきっかけを作る意味があった」と語っています。 [大豆生田崇志, 2017] このように、制限を覚悟しながら外圧も借りつつ、段階的に鍵を開けていった埼玉県の取り組みは、日本の自治体に案外フィットしているように思います。

 

コスト削減の効果は?

負担軽減にはつなげやすい

コスト削減の効果はどうでしょうか。例えば、道路改修や除雪といった地域の行政サービスは、予算や人手も限られるなかで、より効率のよい作業が求められます。「FixMyStreet」のように市民の口コミを投稿する場を設けたり、センシングデータを公開したりすることは有益です。

対処が必要な箇所の特定を全て職員が実施した場合のコストと、センサーデータや市民の協力によって場所を特定する場合のコストは比較的簡単に試算できそうです。また、オンラインでデータを公開すれば、遠方の地域にも簡単に情報を届けられます。従来手法の通信費やメディア掲載費が削減できるわけで、こちらも換算対象になりそうです。 [Matsuoka, 2015]

 

人口1万6400人の町で

北海道森町は、高齢化が進む小さな町ながら、オープンデータ先進自治体として著名。山形巧哉総務課情報管理係長は、オープンデータ推進派として全国から引っ張りだこです。

森町では、Linkdata.orgを活用してサーバー構築・運用のコストを抑えつつ、IMI共通語彙基盤を取り入れたオープンデータを公開。アーバンデータチャレンジ2016でアプリ部門銀賞に輝いた [一般社団法人社会基盤情報流通推進協議会, 2017]小学校の給食献立アプリ「オガルコ」などにデータが利用されています。

「小さな町の小さなリソースだからこそ、オープン化の効果が出やすい」(山形氏)との談は、取組みの意義が大都市だけのものではないことを示唆しています。たしかに、人口の少ない地域の広報は、大都市よりも制作・配達の単価は高くなります。スマートフォンやデータポータルなどの既存インフラを活用すれば、運用コストも抑えられます。

成果が他の自治体に真似されるようになれば、町の知名度が向上し、標準・ひな型として全国に普及する動機づけにもできます。結果として庁内でデータや用語の共通化が進み、文書管理も徹底できたといいます。 [山形巧哉, 2017] [山形巧哉, 人口1万6404人 北海道森町目線でのオープンデータ, 2016]

効果が見えづらい、大変な割に褒められない、予算がない、進め方がわからないなど、データ公開のハードルは枚挙に暇がありません。人材やリソースの不足を逆手にとって、できることから進めていく森町の取組みは、こうしたハードルを超えようとする自治体のヒントになるはずです。 [柏崎吉一, 2017]

 

どうやって収益化すればいい?

マイ広報紙

効果測定、コスト削減、業務効率化をすべて達成した例を紹介しましょう。一般社団法人オープン・コーポレイツ・ジャパンが運営する「マイ広報紙」は、全国約300の自治体広報紙をデジタル化し、「子育て」「くらし」「講座」などに分類して無料公開しています。従来の主要流通チャネルだった新聞宅配が減少し、市民に情報を届けづらくなった自治体の新たな広報チャネルとして評価されています。2016年からは自治体ごとのスマホアプリも提供し、2017年にはNTTドコモ「iコンシェル」を通じた記事提供も始まりました。 [大豆生田, 2017]  今後は、ニュースサイトや地域フリーペーパーなどへもコンテンツ提供して収益化を目指します。 [一般社団法人オープン・コーポレイツ・ジャパン]

もっとも初めは、外部メディアへのコンテンツ提供に対する自治体の理解は進みませんでした。しかしデータ作成をオープン・コーポレイツ・ジャパンがすべて無償で行うことで、地道に対象を拡大してきました。自治体は、素材提供と権利処理だけで、新しい広報チャネルを無償で利用できます。記事ごとにアクセス数も分かるので、「コンテンツの効果測定ができた」と好評です。

 

業務効率化は期待できる?

「マイ広報誌」の意外な副産物は、広報担当者の業務負担の改善でした。420紙の約22,000記事が毎月蓄積されるとあって、担当職員が他地域の広報誌を読んで、地元の記事作りに活用していたのです。居住地はもちろん、勤務先や地元、実家の情報をいつでも読めますので、ある自治体では訪日観光客が「マイ広報紙」を見て来訪した例もあったとか。

実は、オープンデータ推進でもっとも効果が大きいのは、公開作業に伴う、情報資産の棚卸しかもしれません。公共機関に限らず、組織内のデータの所在、内容、分量、利用目的、更新者などを一元管理できている団体は多くないのではないでしょうか。ある自治体でも、保育園や幼稚園の情報を公開したいのに、所管部署が分からなかったり、分散していたりして、「誰に頼めばいいのか探すところから始めた」(関係筋)。職員の方々にも「把握していない情報が独り歩きしたらどうしよう」といった「浮遊ファイルのトラウマ」が根強くあると言われます。 [アライド・ブレインズ株式会社, 2013]

自組織にはどのようなデータが、どのような形式で、どれだけ存在するのか。どんな人に使われているのか。これを把握するだけでも、どの部署でどんな業務が行われているか可視化できます。その業務がどこまで必要なのかも再評価できます(BPR:Business Process Re-engineering)。実際に「効果があった」と言及するケースもあります。 [山形巧哉, 人口1万6404人 北海道森町目線でのオープンデータ, 2016]

 

担当者が忙殺されないためには?

自治体ホームページの教訓

こうした潮流は、21世紀初頭に自治体によるネット広報の黎明期を想起させます。例えば2003年の調査では、広報媒体に「ホームページ」を挙げた自治体はまだ55.9%。 [~自治体「広報」に関するアンケート~, 2003] 原課がMicrosoft Wordで作成した原稿を、IT部門でHTMLやPDFにして公開することが珍しくなかった時代です。DreamweaverやHomepage Builderといったウェブ制作ソフトは高価で難解だったため、「詳しい誰か」に仕事が偏らざるを得ませんでした。

やがて「みんなの公共サイト運用ガイドライン」(総務省, 2005年)の制定も手伝い、自治体ホームページでの情報発信が認知され始めると、Webページ制作の知識がない人でも直接編集でき、サイト全体の体裁・構成を共通テンプレートで管理できるCMS製品が普及します。CMS製品が「HTMLページを作る作業負荷」を減らしたことで、情報の探しやすさやサイト全体の統一感・デザイン、アクセシビリティへの配慮といった「コンテンツ」に注力されるように。ホームページの運用担当部署は、徐々にIT部門から広報部門へ、広報部門から原課へとシフトして行きました。

オープンデータ推進も、よく似た軌跡を辿るのでしょうか。京都市が採用したオープンデータ公開支援ソリューション「DKAN」 [ANNAI株式会社, 2016] や、Google米国が支援する「Frictionless Data」など、職員が手をかけずにオープンデータを公開できる仕組みも提供されています。「データを作る作業負荷」や公開データの管理や効果測定など、ツールの導入で解決できることは、やがて自動化されて行くでしょう。

 

データの価値は、どう評価するの?

「価値のあるデータ」の候補は公表されている

評価基準の策定も進んでいます。前述した「オープンデータ憲章」は、価値の高いデータを分野ごとに具体的に指定して、G8加盟各国に公開を推奨します。
図 13:G8で合意した公開すべき『価値の高いデータ』

出典:東富彦「G8で合意した公開すべき『価値の高いデータ』 (http://okfn.jp/tag/high-value-data/
Open Data Census」は、Open Knowledge Foundationが2013年から発表している評価で、各国の推進レベルを15分野別に評価しています。日本は、31位(2014年)。Election ResultsやHealth Performanceの分野で赤色が目立ち、2013年の19位から順位を落としました。 [渡辺智暁, 2014]

 

図 14 Open Data Censusのランキング

出典:Global Open Data Index(http://index.okfn.org/place/

 

活動の進捗評価も指標がある

推進活動そのものの評価では、ワールド・ワイド・ウェブ財団(World Wide Web  Foundation)とOpen Data Instituteが、2013年10月から「Open Data Barometer」を発表しています(図 15 Open Data Barometerの枠組み(ODB-3rdEdition-Indicatorsより作成))。準備(Readiness)、実施(Implementation)、影響(Impact)の3つの枠組みから評価を行っており、3年連続首位の英国は、2015年には全評価項目で100点満点を記録。日本の順位は13位(2015年)で、「実施」は53/100点とやや低いものの、「影響」が前年の30点から65点に改善し、19位から6段階上がりました。「Open Data 500 Global Network」(2014年-, ニューヨーク大学(NYU)のGovlab)では、各国の民間企業500社を対象に、利用しているオープンデータの提供元となった府省を調査しています。

 

図 15 Open Data Barometerの枠組み(ODB-3rdEdition-Indicatorsより作成)

 

指標の取り入れ方には要注意

どの評価プログラムも、これから制度設計を行う方の参考になります。とはいえ採点基準や目標が異なることには注意しましょう。順位に一喜一憂せず、自国に適した指標を参考にするのが妥当でしょうか。電子政府実務者会議でも、「1.各指標の評価対象となっているが日本での公開数が少ない分野については、重点的に公開を進める」「2.日本での公開数は多いものの国際指標で評価対象となっていない分野について、評価対象に含めてもらうよう、実施団体へ働きかけ」の2本立てで対策を講じるよう提案しています。 [電子行政オープンデータ実務者会議 , 2015]

 

図 16 電子政府実務者会議での分析資料

出典:電子行政オープンデータ実務者会議(http://www.kantei.go.jp/jp/singi/it2/densi/kwg/dai2/siryou1.pptx

 

今後の見通しは、どうなるの?

公的組織のデータ公開が進む

ここまでは主に行政の取り組みを書いてきましたが、今後は企業が持つデータの公開も進むと期待されます。

英国放送協会(BBC)では、2006年から番組データの整備・活用に取り組み、番組内容を記述する用語やデータ構造を定義して、番組関連情報の全てを階層構造化。例えば「BBC Music」では、アーティストごとの出演番組やニュース記事、またバイオグラフィ(Wikipediaから取得)、公式SNSなどを一覧できます。 [宮崎勝、浦川真, 2016] NHKでも、番組情報のLinked Data化を推進します(同文献から)。会員制パーソナル健康情報「マイ健康サービス」や教育機関向けウェブサイト「NHK for School」など、番組データを活用したコンテンツ配信が始まっています。

 

企業と政府のデータ連携が当たり前に

データとデータを組み合わせる事例もあります。総務省とリクルート、全国100の自治体が集った「都市の魅力向上プロジェクト」では、自治体が持つオープンデータと、個人が実現したい暮らし方のマッチングを目指します。「とことん家族サービス型」「これぞ都会はセレブ型」といったライフスタイル別の指標でお勧めの街情報を知らせてくれ、住民にとってもわかりやすい活用事例といえそうです。 [リクルート, 2016]

 

産学連携によるデータ融合も活発に

産学連携による実証実験で、「新たにデータを集める」取り組みも増えています。BODIC.orgの実証実験では、九州大学内に設置されたセンサー端末でデータを収集し、食堂や図書館の混雑状況をスマホアプリにリアルタイム配信します。 [高野茂] また、千葉市、市原市、室蘭市、足立区は東京大学と共同で、公用車に取り付けたスマホで道路の損傷を自動撮影、機械学習で対策の優先順位を判断する実証実験を開始。これまで市民の協力で進めてきた「ちばレポ(ちば市民協働レポート)」の次世代版で、「自然と溜まる」データと「意識して貯める」データとの融合が期待できます。 [日本経済新聞, 2017] 写マップあつぎがいらい生物調査隊ちば減災プロジェクトでは、対策が必要な外来種の発生状況や気象・地震被害状況などを市民に投稿してもらい、自治体職員が対策レポートを公開しています。センシングは、降雪量や風速などの気象情報に基づく行政サービスの資源配分、コスト最適化に資するデータとして期待されます。

 

法整備も

こうした機運を背景に、国内の法整備も進みます。2016年には2つの注目トピックがありました。1つは、企業立地促進法の改正です。産業構造審議会が12月14日に、企業立地促進法を「地域未来投資促進法」に改正し、企業が都道府県などに公共データ開示を要求できるようにする方針を打ち出し、2017年2月28日閣議決定されました。 [経済産業省, 2017]第193回通常国会で法改正が実現すると、都道府県はデータ開示の努力義務を負うことになり、オープン化に弾みがつくと期待されています。 [日本経済新聞, 2016]  鶴保IT政策担当大臣の「IT戦略本部の『官民データ活用戦略推進会議』が司令塔となり、オープンデータを徹底する」との発言にも、強い意気込みが感じられます。 [首相官邸, 2016]

 

民間投資も活発化する?

もう1つは、官民データ利活用推進法 [官民データ活用推進基本法, 2016]です。起案から公布まで20日というスピード審議で成立しました。同法では、政府機関及び都道府県に、官民データ活用基本計画の策定を義務付け、民間と市区町村にも計画策定を促しています。各地の担当者が草の根で進めてきた取組みが、法的にも後押しされたのです。経済界からの要請も同法の成立を後押ししました(「データ利活用推進のための環境整備を求める~Society 5.0の実現に向けて~」(経団連))。人工知能(AI)、IoT、クラウド・コンピューティング・サービスも、法律として初めて同法のなかで定義されました。 [官民データ活用推進基本法, 2016]

 

政治の透明性確保へ向けて

もっとも、こうした取り組みはビジネス活用に傾斜していて、政治の「透明性の改善、参加の促進、協働の促進といった観点が抜け落ちている」との指摘もあります。 [西田亮介, 2016] 政府の透明性や資産公開、情報へのアクセスを監査する国際活動が参考になります。「Open Government Partnership」では、国ごとの行動計画(OGP National Action Plan)を策定し、計画に対する達成度を公開しています(2016年時点で75カ国が加盟)。 [Open Government Parntership, 2011]

2016年には「Anti-Corruption Summit」(腐敗対策サミット)が開かれ、参加42カ国が600以上にのぼるコミットメントを提示。同年11月にはさっそく「ANTI-CORRUPTION SUMMIT PLEDGES AND OGP NATIONAL ACTION PLANS: HOW DO THEY STACK UP?」で経過報告を公開。例えばケニアは達成度が7/18個、英国は6/21個、ノルウェーは5/21個を達成しました。他方で行動計画の策定に至らなかった国も、隠すことなく公開されています。 [Tranceparency International, 2016]

 

公開・活用が期待されるデータは?

それでは今後、どのようなデータが公開されると良いでしょうか。例えば、電子行政オープンデータ実務者会議では、「【オープンデータ2.0】強化分野及びオープンデータの候補例」と題して「①1億総活躍社会の実現関連」「②2020年東京オリンピック・パラリンピック関連」の別に、強化分野とオープンデータの候補合計50例を例示しています。

次はそれらのデータをどう収集し、どう活用するのか、現実的な計画へ落とし込む工夫が求められるでしょう。候補となるデータを誰が持つのか突き止め、提供を交渉し、それを求める人に便利なかたちで提供するには、相当数の利害調整を行わなくてはなりません。

どんなデータが利用できるのか。データの持ち主(オーナー)(縦軸)と集め方(横軸)を軸に整理してみます。

 

図 17 データの種類(縦軸に公共性の高さ、横軸に進捗とデータの集まり方)

すでに公開・活用されているデータ

  • すでにある基本情報

データオーナー自身の基本情報は、すでに集約・蓄積が進んでいます。政府機関であれば根拠法や施設情報、自治体の条例や組織情報、施設情報、企業の法人ナンバーや会社登記などが該当するでしょう。他のデータを統合するときの「主キー」や「名寄せ軸」に使えますので、公開及び保護ルール、語彙やデータ形式の統一など、基盤整備や使い勝手の改善が急がれる分野です。

 

  • 自身で作る計画・実績

事業活動を通じて、自身で作るデータも、一部統計化して公開されています。予算・決算や調達情報などが該当します。すでに、上場企業の決算情報は東京証券取引所「TDnet」で誰でも過去5年分を取得できます。他にも、2017年1月19日にリニューアルした経済産業省「法人インフォメーション」を使えば、企業ごとの納税、助成金などのデータをWeb APIを通じて取得できます。日本経済新聞社のように、自然言語処理技術を用いた記事の自動作成に用いる例も現れました。 [井上理, 2017]データ処理の高度化が期待される分野です。

 

  • 周りから集める統計調査・公開資料

国勢調査や各種統計、企業によるアンケート調査、またその集計データなど、外部調査で集まったデータは、そもそも、何らかの形で(調査結果に基づくサービスやコンテンツなどを含む)、第三者に提供する前提で作られたデータです。権利処理さえ整えば、企業間データ取引でも流通が期待される分野です。これまでにも、自主調査や受託調査を抜粋したり、提供時期を遅らせたり(embargo)して販売する例はありましたが、必ずしも調査会社を経由しない商流も出現するでしょう。

 

公開・活用が期待されるデータ

  • 自然と溜まる活動履歴

日常の企業活動、行政執務、個人生活のなかで、自然と溜まるデータも活用しやすいでしょう。言わずもがな、センサーやカメラを通じて収集するデータの活用が期待されています。やみくもに収集するのではなく、期待される成果、想定される分析、実現できる施策などをよく吟味して、収集対象と収集方法を見直すことが求められます。

 

  • 意識して貯める機器ログ・記録

運動量や食事内容、服薬履歴、スマホ位置情報などは、意識して貯めることで価値を持ちうるデータです。もちろんその大半は、メモ書きやSNS投稿、個別の苦情・相談など些細な記録の積み重ねに過ぎません。けれども、私的なメディアに閉じ込められたデータを、データオーナーが自由に移動できるようになれば、別のデータオーナーにとっては思わぬ気づきや見落としが発見できるようになるでしょう。早くも総務省では、有識者会議による提言を受け、「家計調査」に加わる新たな統計として、民間統計やクレジットカード利用、レジの売上、EC利用などを用いた「消費動向指数」を作成する予定だと報じられています。

 

まとめに代えて――CivicTechへの切実な期待

オープンデータ推進活動は、国境を越えた社会活動として、データ活用のアイデアを、データオーナーや組織管理者、研究者やアプリ開発者、コンテンツプロバイダー、一般市民それぞれの視点で、どのデータをどうオープン化し何と組み合わせ、どのように公開すべきなのか、幅広く意見を集め、反映させながら進んでいます。

こうした動きは「CivicTech」とも呼ばれます。日本では、東日本大震災をきっかけに、Code for Japanなどの市民活動が立ち上がり、各地でアイデアソンや事例紹介が行われています。

そのほとんどは法人化もしていないボランタリーな集まりです。活動が盛んな背景には、ソーシャルメディアなどが全国へ普及したことに加え、市民の危機感が潜んでいるのかもしれません。震災からの復興、人口減による行政コストの維持困難、地域コミュニティや都市インフラの衰弱など、市民が自ら行政に参加しないとその地域の暮らしが守れなくなるような、切実な課題があるからです。

毎年3月に開催されるインターナショナル・オープンデータ・デイに合わせて、世界では250以上、日本では60以上の地域で、様々なアイデアソンやハッカソンが行われます。 [Open Knowledge Japan, 2017]他にも年間を通じて様々なシビックテックイベントが開催されており、多くはFacebookイベントやPeatixを活用して広く告知されています。ほとんどのイベントは誰でも参加できますから、ぜひ足を運んで、一度その空気を感じてみてはいかがでしょうか。

 

[1] 2013年3月27日までは企画委員会の下に置かれていた。

[2]           内閣官房「IT DASHBOARD」http://www.itdashboard.go.jp/ 政府のオープンデータより、2016年12月に取得したデータに基づく。

[3] 中央省庁の公式サイトで公開されている情報の形式がHTML1ファイルに対してPDF2ファイルという調査結果もある。

参考文献

データカタログサイト(https://docs.google.com/spreadsheets/d/1xw-Cugfs0_aOWfChsBvPoMIw1-C7CTxVAT7TFzq2tqA/edit#gid=0)へ、本記事の参考文献リストを掲載しています。

病気と健康

【予告】

医療、ヘルスケア、製薬、社会福祉などのデータについて取り上げます。Health-Techや医療統計なども取扱います。 機微情報を扱う事例・サービスが多いことから、他カテゴリより以上に、信頼できる機関・研究所の情報を参照するよう努めますが、事実確認はご自身の判断で行ってください。

(Coming Soon…)