Smart Communication Design Company
ホーム > ナレッジ > Blog > CMS Blog > 2013年7月 > オープンデータとCMS

オープンデータとCMS

2013年7月5日
システムエンジニア 榛葉

先ごろ(2013年6月13日)、経済産業省から『オープンデータに関する調査研究』が公表されました。

国内では今年に入り、欧米を中心に先行しているオープンガバメントデータ(Open Government Data)の取組みに追いつけと、政府や地方公共団体によるオープンデータへの取組み事例が増えています。先月イギリスで開催された「2013 G8ロック・アーン・サミット」でも「オープンデータ憲章」が採択されました。

報告書では、こうした政府などが保有する公共データを二次利用できる形で公開して、民間における公共データ活用を促進するための課題やその解決方法について網羅的に整理されています。「かなり濃い内容だと思います(@openmeti)」とのツイートどおり、広範囲におよぶ様々な論点が取り上げられていますが、弊社が注目するのは、オープンデータ公開プロセスにおける技術面、とりわけCMS(コンテンツ管理システム)の役割です。

報告書でも、オープンデータポータルサイトの構築や運営を行うツールとして、「Drupal」や「WordPress」といったCMS製品の名前があげられています。また、オープンデータに関する調査研究事業の一貫として構築された試験サイト「Open DATA METI」は、WordPressと、Open Knowledge Foundationが開発するオープンデータカタログソフトウェア「CKAN」を利用して構築されているそうです。

ただ、報告書では、CMSを「Webサイトを簡単に作成し、管理できるソフウェア」と定義し、オープンデータそのものの管理や配信はCKANなどのデータカタログソフトウェアが担当するといった機能的な役割分担が想定されているようです。確かに、CMSは、データポータルサイトのフロントエンドを構成するWebページを更新したり管理するツールとしても効果的です。

しかし、CMSが提供する本質的な機能は、原始データやコンテンツを構造化データとして蓄積し、蓄積したデータを機械判読が可能な構造化文書として配信することだと考えられます。例えば、構造化文書のひとつの表現形式であるHTMLでコンテンツを配信し、配信されたHTMLをブラウザが解読して人間が読める状態で表示するのはひとつの具体例です。同様に、HTMLに限らずXMLやJSONなど形式でWebAPIを提供するといった利用法もあります。その意味で、CMSと、CKANのようなデータカタログソフトウェアとに本質的な差異はないように思います。

実際に、既存のCMS製品をベースに構築されデータポータルサイトが運営されています。例えは、米国政府とインド政府により共同開発され、data.govdata.gov.inなどで利用されている「Open Government Platform (OGPL)」は、Drupalをベースに開発されたデータカタログソフトウェアです(なお、最新バージョンにはCKANが組込まれたそうです)。ニュージーランド政府のデータポータルサイト「data.govt.nz」は、最近、弊社でも注目している「SilverStripe CMS」をベースに構築されています。

また、データカタログソフトウェアを構成する技術要素の点でも、CMSとほとんど変わりがありません。例えば、CKANは、PythonPylons web framework)、PostgreSQLSolrを利用して構築されています。いずれも、CMSなど他のWebアプリケーションでもよく利用される技術要素です。また、CKANでは検索エンジンシステム「Solr」を活用してデータセットの検索やWebAPIの提供を実現しているそうですが、CMS製品とSolrの組み合わせもよくあるパターンといえます。弊社でも、CMS製品とSolrを組合せた構築事例がいくつかあります。

このように考えると、データカタログソフトウェアとCMSを厳密に区分けする意味はあまりなさそうです。オープンデータのデータセットをコンテンツの1形態と考えれば、データカタログソフトウェアあるいはデータポータルプラットフォームなどと呼ばれるソフトウェアは、政府機関が公共データをオープンデータとして公開する用途に特化したCMSと言えなくもありません。

政府のロードマップでは、全省庁にわたるオープンデータの取組は今年度から本格化されるとのことですが、オープンデータ運動は、何も公共セクターによるオープンガバメントデータに限った話ではないと考えています。公開された公共データの民間活用による効果だけでなく、既存のコンテンツプロバイダや一般企業などのビジネスモデルに与える影響もあると感じています。今後、民間の個々のプレーヤーの用途にあったデータ公開や活用のためのプラットフォームとして、CKANのように新しいタイプのCMSが必要とされるかもしれません。引き続きオープンデータ運動に注目していこうと思います。

最後に、そもそもオープンデータとは何かやその意義については、ご存知の方も多いと思いますが、ティム・バーナーズ=リーによるTEDでの講演を掲載しておきます。