2016年8月20日 星期六

機器學習預測貧窮

Fighting Poverty With Satellite Images and Machine Learning Wizardry

By Prachi Patel
Posted 

政府和非政府團體需要一些數據來決定如何有效的幫助貧困。但是要從貧窮國皆直接取得可靠和即時的數據似乎是不可能的。科學家已經研究出一種省錢的方法,利用衛星影像和機器學習來精準的預測以村莊為單位的貧窮程度。這種高精度的判別方法可以幫助決定誰最需要援助,這樣,這種工具也可以幫助研究員和決策者收集多方面的資料和擬定發展政策。

政府通常是藉由收入及消費相關的問卷來決定貧窮的程度。這種問卷會花數以百萬計的預算,而且在戰亂地區實行是不可能的。世界銀行的數據呈現,在 2000 年到 2010 年間,59 個非洲國家中有 39 個國家中沒有足夠的問卷數來得到可信賴的結果數據。

研究員嘗試以手機使用程度及衛星照的燈光來分析貧窮程度。但是手機使用率並不是那麼容易取得。同時,晚上的燈光只有辦法指出比較富足的地區,但是不能從比較貧窮的地方區分出差異。史丹佛大學電資博士生 Neal Jean 說到:「在非洲我們最關切的貧窮地區,基本上在晚上那邊都一片漆黑。」

Neal Jean,地球系統科學教授 Marshall Burke 和他們的同事想出聰明的方法,利用夜晚光線的資料結合上早上時的衛星影像來分析。他們已經把這方法發表至 Science 期刊,他們表示,這個可以應用於任何一個發展中國家

機器學習就是給電腦足夠的樣本數,讓他們有辦法歸納出一些準則。我們在分辨不同的物品也是經過經驗學習的;我們可以給電腦許多照片並標記誰是貓誰是狗,當電腦慢慢地學習,他就可以發展出一個足夠精準的演算法來決定未知的圖片誰是貓或狗。

研究員用數以百萬計的資料來訓練(train)他們的演算法,在夜間,他們標示了明亮的程度;在日間,他們標示柏油路(paved road)、金屬屋頂及有牲畜的農場,這些可以幫助他們區分貧窮及極度貧窮的地區。Neal Jean 說到:「我們的模型尋找一些實際的景物,和其他特徵並合併於晚上的燈光數據。」

接下來,他們訓練第二個電腦模型來處理由第一個模型選出的一些線索加上既有的統計資料。第二個模型是在學習如何藉由消費力指數(以 2011 年的美元計算)及個人財力指數(asset-based wealth index)精準預測村莊貧窮的程度。

由 Google Map 取得的早晨衛星圖及從國家地球物理數據中心的晚間高解析度圖片。如此就有辦法得到 1*1 公里解析度的全球圖片,但是由於研究需要,他們鎖定五個國家:奈及利亞、坦尚尼亞、烏干達、馬拉威及盧安達

新的模型比只用夜晚衛星圖更精準的預測低於貧窮線 1/2 甚至 1/3 地區的貧窮程度。他們也用已經被計算出來的經濟指數的圖片訓練演算法,目前他們想要城市在不同解析度下對於預測貧窮準確度的影響。