OneonetのPyBE

Python,Blender,Excelのいろいろ

ニューヨーク市のオープンデータが素晴らしい話

福岡すごいという話の続きになります。探してみるとニューヨーク市はさらに充実ゴイゴイスー。
オープンデータの次の10年と題して、「ニューヨーク市は10年前と同じではないし、私たちを動かしているデータも同じではありません」と書かれています。10年前に始めた活動が、多くの協力者により、より大きなものとなったことが素晴らしいと思います。公開されているデータ量とそのきめ細やかさは圧倒的です。例えば、地下鉄の駅のデータが公開されています、関連して地下鉄の入り口に関するデータも別に公開されています。道路・交差点のどの方向、階段なのかドアなのか。活用アイデアは無限、それを役立てようと考える人、そのデータに助けられる人がきっといます。

 

さらにこのように書かれています(以下機械翻訳にて・・)。

 2009年にニューヨーク市初のオンライン公開データセットが公開されて以来、オープンデータは常にその背後にいる人々のおかげで繁栄してきました。何百万行もの情報から洞察を発見するデータ科学者、時間を割いてデータについて質問してくれる組織、データが正確であることを確認し、公開に向けて新しいデータセットを特定するために働く機関のオープンデータコーディネーター、そしてオープンデータパネル、カリキュラム、ワークショップ、デモを企画する多くのパートナーたちです。

 

私たちのチームは一貫して、このプログラムを形成するのに役立ってきた協力精神の拡大に取り組んできましたが、今年は、この多様なオープンデータコミュニティと協力しながら、一から新しい戦略計画を構築していきます。

 

以下では、今後10年間の私たちの活動の指針となる新しいオープンデータ戦略計画の詳細をご覧いただけます。この計画は、これまでの市のオープンデータの旅から導き出されたもので、市の出版プラットフォームと政策への投資と強化、市のデータとニューヨーカーとの間のより多くのつながりの構築に向けて、私たちを後押ししています。

 

堅固な共同設計プロセスを経てこの計画を策定し、皆様と共有することで、オープンデータの次の10年が、今日の私たちをもたらしたコラボレーションへのコミットメントによって定義され続けることを願っています。

 

追伸
ゴイゴイスーって英語だとどうなるんですかね?

 

opendata.cityofnewyork.us

www.youtube.com

トラップストリートの話

実際には存在せず、地図上にだけ存在する架空の道路。無断で複製された物であることを証明するためのトラップか誤記。ここでは、意図的な誤りに違いないという発想で話を進めます。存在しない道を記載する以外に、カーブや幅の形状を変えることにとどめ、地図としての役割に支障がないように工夫されているものもある。道以外に架空の町や地名という例もあるそう。

カーナビで多用される日本の地図には意図的な変更は無いそうで、今のところ安心してよさそうです。

bingマップで「dummy」と入力しても何も羅列されませんが、googleマップの場合、入力途中にはいくつかの候補が羅列されます。ただ、検索ボタンを押してしまうと何も出てきません。「dummy」という単語で何も検索されないということは、「dummy」という単語を含む地図上の情報は無いと考えると、検索途中に出てくる何かしらの場所は大変興味深いものとなります。

1つ目はほんの少し家の土地側にも道路があることになっている箇所です。実害は無い範囲かと思います。bingマップで同じ場所を確認すると、この短く曲がった道は存在せず、google map固有の情報ということがわかります。一方でこの地域がどれほど利用される可能性があるのか考えると、ただのミスということも考えられますが、googleマップによるとこの道には「Dummy Rd」という名前が付いてました。

2つ目は、小学校としてプロットされている何かでが衛星写真からは空き地に見えます。右下に見える白い屋根は花屋となってます。道路の反対側の小さな建物が小学校なのでしょうか。

ja.wikipedia.org

 

f:id:oneonet:20200906084500p:plain

f:id:oneonet:20200906084507p:plain

 

福岡のオープンデータがスゴい話

監修が凄いのか、利用者のフィードバック歓迎しすぎなのか、とにかくゴイゴイスー。

福岡県内交通事故に関するオープンデータを見せて頂きました。発生場所住所が完全、かつ、緯度・経度まで含まれています。ジオ系で好き勝ってしてくれという思いが伝わってきます。発生年月日が含まれているにも関わらず、年、月が付加してあるところも何かが通じます。

過去3年分、9万件の交通事故データを元にして、何かしらしてみようと思います。まず緯度・経度を利用してヒートマップをプロットしてみると、夜景のごとく完全に道路と重なり、位置情報が正確であることがわかります。

次に、事故発生場所と発生件数を確認すると、最多事故発生場所は、「福岡県糟屋郡粕屋町大字酒殿192番地1」となり、2017年から2019年の3年間で38回の事故が発生、そこが「イオンモール福岡」であることがわかりました。

最後に、「イオンモール福岡」にフォーカスしてみます。すると、出入り口と事故発生場所が一致します。事故の起きやすさで言えばその結果は必然ではありますが、実際に事故が起きている場所として認識し、行動に反映することで事故を未然に防ぐことができると考えます。イオンの関係者の皆様からすれば不名誉なことだとお感じになると思いますが、施策により事故を減らすことは可能でしょうし、その結果をまたオープンデータから確認することもできるのです。

 

素で見てみる

f:id:oneonet:20200905150739p:plain

福岡ルクルにフォーカス

f:id:oneonet:20200905150742p:plain

 

www.open-governmentdata.org

 

www.youtube.com

公開されるオープンデータが残念な話

神奈川県警オープンデータサイトでは、ひったくり、車上ねらい、自動車盗難、自転車盗難等の犯罪情報が公開されています。

その中から2019年の「ひったくり」について確認してみると、ファイルサイズ20KByte、200件程登録されています。

元々20Kbyte程のサイズなのに年別にファイルを分けている、罪名:窃盗、手口:ひったくり、しかない。そりゃそうでしょう、その手口のファイルです。モヤっとします。発生場所の属性というプロパティは、事件種類によって記載される内容が違い、「ひったくり」の場合は、「道路上」か「その他」になると説明があるにも関わらず、「その他」か「空白」しか記載されていません。道路以外の場所でしかひったくり事件は起きていないのでしょうか。空白はなんでしょう、事件が起きた場所がわからないということかねえ。これもモヤです。

そして一番モヤなのが、事件発生場所が「丁目」までしか記載されていないことです。これにより、どこそこ2丁目はひったくりが多いねぇ、ぐらいしかわからない残念なデータになってしまっています。これが完全な住所になっていれば、ひったくりの多い道路、時間を避けることができるかもしれません。モヤです。被害に会いやすい時間帯や年代、性別は都道府県の特徴が出るわけもなく、都道府県の名前でデータを公開する意味を良く考えてほしいと思います。

 

www.police.pref.kanagawa.jp

The year open data went worldwide

ティム・バーナーズ=リーはTEDで、

データを公開してください
みんながWEBで公開すれば、
他の人がそれを使って
以前には想像できなかったこと
素晴らしいことをするだろう

と呼びかけた結果を1年後に話しました。

イギリス政府が自転車事故のデータを公開してすぐ、地図にプロットされました。これにより、自分が利用するルートが安全か確認できるようになりあmした。

ある人が水道につながっている家かどうかという情報と、その家に住む人の人種をプロットしたところ、偶然とは思えない相関関係を見つけました。

ある地域の大統領選挙で、投票所とその地域の危険度レベルを見えるようにしました。

ある地域での地震の直後、企業が衛星写真を公開したことで、世界中の人が集まり地図を作り上げました。難民キャンプの場所をプロットすることで救援活動を支援することができました。

データを公開する人、そのデータで新しいデータを生み出す人、生み出されたデータを活用する人、すべての人に感謝を。

www.ted.com