機械学習を使って難民の移動を予測してみた by PeaceTech部【006】

アフリカ

こんにちは!ICT4D Labメンバー兼PeaceTech部 部長の大石です。

本ブログでは、「機械学習を使って難民の移動を予測する」プロジェクトの第6・7週目の様子をお伝えします。

前回は、リサーチチームが中心となりコンゴの難民問題等の質的情報を整理すると同時に、データサイエンスチームはデータセットの確認作業を進めました。第6・7週は各チームの調査事項をプレゼンテーションという形で部内共有し、並行して分析計画をまとめました。

【ステップ13】質的調査結果の共有

リサーチチーム主導で進めている質的調査。前回ブログでお伝えした通り、質的調査の内容は①コンゴの難民問題概要調査と、②機械学習を用いて難民課題に取り組んでいる先行事例の洗い出し、です。開発コンサルタントや国連職員等の実務家が協業して、各トピック毎、40分程度のナレッジシェアをしました。

①コンゴの難民問題概要
本プレゼンテーションには、UNHCRのコンゴ・ブニア事務所でIDP課題に取り組む専門家も参加!1時間半に及ぶ活発なディスカッションを通して部全体で知見を深めました。特にデータサイエンスチームからは「ホストコミュニティとは?」「コンゴの気候って?」「国際機関のデータ取得方法は?」等、ドメインに関する質問が多く出され、本プレゼンテーションの意義を実感しました。

②機械学習を用いて難民課題に取り組んでいる先行事例
PeaceTech部のプロジェクト完全に一致する取組はなかったものの、機械学習を活用して難民/IDP課題の解決に取り組む事例はある程度存在している事がわかりました。詳細情報はこちらから!

これら質的調査の結果は、国際開発学会全国大会での発表を目指して、論文の形にまとめる予定です。

【ステップ14】データ分析計画の作成

前回ブログでお伝えした通り、目的変数として利用を想定していたDisplacement Tracking Matarix (DTM)は、今回のプロジェクト目的を満たす情報を提供していない事が分かりました。更なるリサーチの結果、Internal Displacement Monitoring Center (IDMC)が公開しているIDPのデータと衛星データを掛け合わせて、移動予測モデルを立てることにしました。方針はこちら↓

【目的変数の選択】

  • 予測対象として、紛争に起因するA地点からB地点への人の移動があったとき、B地点への流入人数のみを予測する(当初はA地点→B地点へのフローを想定していましたが、出発地点がどこであるかを問わない事となりました)
  • (この情報のみであれば、IDMCのデータのうち一部から概算が得られる)

【主に用いるデータ】

  • 時系列の粒度・流入に関する情報の存在から、IDMCのデータを主な目的変数に用いる

【難民・IDPのどちらを主な対象とするか】

  • フローの情報が得られるのは現時点でIDMCのIDPデータ
  • IDMCデータで衛星情報の妥当性を検証し、有用そうな指標が選定できた場合は難民に外延的に適用することも考える.
  • どちらの場合においても、最初に行うことは同一で、IDPのデータに基づく衛星情報の可用性の検証

次回

使うデータ、分析方針が決まったところで、データサイエンスチームはデータ前処理とモデリングを始めます!リサーチチームは質的調査結果を受けての論文執筆。果たして10月末までに終わるのか。。。乞うご期待!

===========

文責:大石彩夏
PeaceTechに興味ある方はこちら(Facebookの有志グループ)にJoin!

ニュースレターはじめました。テクノロジーと国際開発(ICT4D)に関する新規ブログ記事・海外ニュース・イベント情報などを月1〜2回発信しています。以下フォームからご参加ください。詳細はこちら

ICT4D Lab
フォローする
アフリカオンライン・コミュニティ平和構築
ICT for Development .JP

コメント

  1. […] 前回は、リサーチチームは質的調査結果のプレゼンを、データサイエンスチームはデータ分析計画を作成し認識を合わせました。プロジェクト終盤の第8・9週目は、論文執筆とデータク […]

タイトルとURLをコピーしました