OSSがコミュニティであるのと同様に、それは考え方でもあります。そしてその考え方から、より広範な「オープン」運動が生まれました。オープンデータやオープンプロセスを含む運動です。今日は、この運動から生まれた最も影響力のある派生の一つ、オープンデータに考察してみます。
オープンデータとは何か?
私が初めてオープンデータの概念に触れたのは1980年代、NASAマーシャル宇宙飛行センターで働いていた頃のことだ。指導者たちはこう説明してくれた。科学的な発見を支える公的機関として、我々が収集したデータの多くは広く一般に公開されるべきだと。
当時は「広く一般」とは主に世界中の科学者や研究者を指すと考えられていました。しかしブロードバンドが普及した現在、データの配布は高価でも困難でもありません。時を経て、科学・学術界以外のデータ作成者たちもオープンデータの強力な支持者となっています。
では、オープンデータとは何でしょうか?オープンナレッジ財団によれば、データセットは以下の条件を満たす必要があります(詳細はhttps://opendefinition.org/およびhttps://opendatahandbook.org/guide/en/what-is-open-data/を参照)。
自由に利用可能:誰でも使用、再利用、再配布が可能であること。
アクセス可能:広く利用可能な形式(例:CSV、JSON、API)で提供されていること。
ライセンス付与:オープンな利用を許可するライセンス(例:クリエイティブ・コモンズ、オープンデータコモンズ、ウィキデータ)が適用されていること。
非独占的:著作権、特許、法的要件による制限がないこと。
オープンデータはどこで見つけられますか?
オープンデータについて初めて聞いた時、「なるほど、それは理にかなっている。米国政府がこの研究に資金を提供しているのだから、それは米国国民のものだ」と思いました。それ以来、連邦、州、地方レベルのほとんどの政府機関は、予算、国勢調査、犯罪統計、気象、公共交通機関、不動産売買など、幅広いデータセットを、一般公開が制限されていない形で広く提供しています。
学術機関も多くのオープンデータセットを共有しており、博物館のコレクション全体や拡張現実(AR)による博物館のウォークスルー、アーカイブ、選りすぐりの写本、研究者によるデータセットなどが含まれます。
しかしオープンデータは、あらゆる種類の企業や営利団体からも入手可能です。例えば、株式市場、財務報告書、サプライチェーン活動などを網羅する膨大なデータセットにアクセスできます。その他の商業企業も、オープンデータセットに対してコミュニティの支援を受けています。例えば、AmazonはIMDBウェブサイトからの膨大なデータセットを提供しており、50,000本以上の映画やテレビ番組、俳優、スタッフ、評価などを網羅しています。ジェレミー・シンガー・ヴァインによる週刊ニュースレターでは、興味深いデータセットへのリンクが多数紹介されています。
オープンデータが重要な理由
オープンデータは単なる透明性ツールではなく、イノベーションの触媒です。その仕組みは次の通りです:例えば、公共交通機関のオープンデータはリアルタイムナビゲーションアプリを支えます。医療データの公開はパンデミックのモデリングを支援します。金融データの開放はフィンテック革新を促進します。
透明性: 市民が機関の責任を追及できます。
イノベーション: 開発者がライセンス料なしでアプリやサービスを構築できます。
協働:研究者は互いの研究を検証し発展させられる。
効率性:組織はデータ収集の重複を回避できる。
参加方法
オープンソースソフトウェア(OSS)への貢献と同様に、オープンデータを支援する方法は数多くあります:スキルを磨いたり、ポートフォリオを構築したい場合、オープンデータプロジェクトは最適な出発点です。
公開API(例:気象、交通、医療)を利用したアプリ開発。
データセットの分析による知見の発見や可視化の作成。
データのクリーニングと充実化による利便性の向上。
データセットをパッケージ化し、他者が利用しやすい形式で提供しましょう。
シビックテックに貢献したり、オープンデータポータルの維持管理を支援しましょう。
オープンデータは善のための強力な力です。情報へのアクセスを民主化し、イノベーションを促進し、市民参加を強化します。開発者、アナリスト、あるいは単に興味がある方であっても、オープンデータの世界を探求するのにこれほど良い時期はありません。
もしかすると、あなたの次の大きなアイデアは、発見されるのを待っているデータセットから生まれるかもしれません。
関連したトピックス
- Parquetで連携し、より効率的なデータ分析を簡単に実現【Gluesync】
- ドキュメント・データベースは何か?
- GlueSyncでNoSQL活用を加速:データモデリング編
- GlueSyncでNoSQL活用を加速:導入編
- Webセミナー録画 『GCP Cloud SQLへのデータ移行・連携はSyniti DRにお任せ!』2020/03/26 開催
- DBMoto (Syniti DR):クラウドDBとの連携設定動画集
- Syniti Data Replication 新機能ブログ② Amazon S3へのレプリケーション対応
- GlueSyncがAWS S3(互換も含む)に対応:分析、データレイク、コールドストレージ向けに、AWS S3 へのリアルタイムデータレプリケーションがシンプルに
- PostgreSQLに対してバルクインサートが可能に【DBMoto Ver8.5新機能①】
- ODBC(オープン・データベース・コネクティビティ)

RSSフィードを取得する