網頁

2016年5月26日 星期四

打火就打火,談大數據?

作者:蔡宗翰


台灣消防工作的推行日益艱困。城市化、人口聚集、經濟產業的發展大幅增加救災風險,民眾對於安全的需求與渴望也節節攀升。

雖然隨著科技發展,消防單位在救災裝備、戰技與戰術上已有長足進步,但在政府的人力編制與預算有限的情況下,面對日益增長龐大的勤業務壓力,若實際走訪第一線消防分隊聊聊,你會看到出勤後剛返隊的消防弟兄們,擦擦額頭岑岑汗水,苦笑著說:「還勉強應付得過來...」

而這已經是最樂觀的反應了。


能怎麼辦?

檢討勤務、調整政策、補足人力...,是現行消防工作,從中央到地方、從幹部到基層,都盼望實現並持續努力的目標。即使如此,我們依然要關注幾個問題:

一、政府預算越來越少,雖然充足的預算可購買更精良的裝備機具車輛器材,但當數量超過既有人力的管理及使用能耐,在災害應變時,解決問題的幅度依然有限,甚至反而成為負擔。

二、政府編制只會減不會增,即使消防人力增加到法定員額,或許減緩消防人員過勞並增加消防人員休息及訓練時間,但增加的人力遠追不上日益成長的勤務量。

三、消防人員期盼的「回歸專業」,從消防專業立場來看無庸置疑,但從整體民眾需求、民意期待、政府執政的角度,必定無法接受增加預算、補足人力後,消防單位還是做跟之前一樣的事。

其實,除了政策面,還可以從資料面著手,簡而言之就是「大數據」。


別跟我談資訊,我只是消防隊?


如果我們能夠將各個小型資料集合併後,進行分析,便可得出許多額外的資訊和資料關聯性。

等等!大數據?我只是消防員呀!

消防人員常講:「消防要回歸專業」,沒錯,消防「勤務」跟「執行」要回歸專業,但消防的「思維」不能只侷限在消防領域。

如果所謂回歸專業就是「吃的、想的、做的、拉的」都在消防的圈圈裡,那才叫做「不專業」,因為就變成只困在消防的框框裡,卻沒有意識到消防跟其他領域的相互關係、循環影響、運作方式甚至趨勢變化,也因此所有的想法都在這個小框框近親繁殖,你會發現大家的意見看法都很一致,但也很一致的對許多問題莫可奈何或根本看不到問題癥結。丹尼爾康納曼便在其著作「快思慢想」談到:「我們不僅盲目於明顯的事物,也盲目於自己的盲目。」

另外,吉蓮邰蒂於2016年2月出版的「穀倉效應」,也談到一個很有意思的觀點,她提出疑問:「為什麼分工反而造成個人失去競爭力?企業崩壞、政府無能、經濟失控?」因為大家陷於自己小小的部門、社群、團隊或知識中,或者說,陷於自己的「穀倉」中。這個時代的兩難困境在於,世界一方面密切整合、一方面分散零碎,全球日益牽一髮動全身,而我們的行為與思維卻困於小小穀倉裡。



有時能解決、改善一個組織的問題,來自於外部的思維或模式。

沒有要消防人員「親自」去操作大數據運算,事實上也根本不可能,但我們要知道大數據可以「怎麼樣」?「哪些人」可以幫忙?我們自己能夠「怎麼提供」協助與支援?很重要的是,你要知道哪裡有資源。

而如果我們能夠克服穀倉效應,整合其他單位的大數據,絕對會有革命性的發現。


大數據+克服穀倉效應:紐約彭博市府的機密任務

「穀倉效應」書中談到一個非常貼切的實際故事。

2011年4月25日凌晨,紐約布朗克斯一處貧民社區發生嚴重火警,造成多人喪生,媒體怒氣沖沖地點名罪魁禍首,其中有些直指紐約市政府。

火警消息剛傳出來,紐約市長麥可彭博問了屬下一個問題:「能否採取什麼方法來預防這類火警?」沒有人答得出來。紐約市的一個黑暗秘密就是:住宅火警稀鬆平常,在2011年之前的那十年,每年約有2700間民宅失火,平均奪走85條性命。

紐約本身配有消防檢查隊,但只有200人,卻要負起全市100萬棟大樓與四百萬戶的消防檢查,簡直力不從心,市府也沒有多餘的經費擴編部門,另外,民眾檢舉通報後的消防安檢也經常白忙一場,因為只有13%的建築違規通報是真的有問題。

福爾勞斯是紐約市政府團隊中的一員,他奉命解決這個問題,而他並不是消防人員。

有時,比對乍看無關的資訊會別有收穫。


我們來看看他做了什麼?

福爾勞斯在免費分類廣告的網站張貼廣告,徵求年輕的「資料分析高手」,他想找剛從大學畢業,擅長經濟數學,能提供嶄新眼光的人,組成團隊。並要團隊整理紐約市的火警資料(消防局既有的各項報案資料、火警資料、311支專線違建通報...等),設法預測火警,結果一無所獲。但發現一件事,多數違建通報的地點並非最常發生火災的地區、也不是最多違建的地區。

消防局的資料顯然不夠,因此需要檢視消防局以外的數據,福爾勞斯要求團隊離開辦公室,跟不同警察局、消防局、房屋署、建築部的檢查人員出去,以開放的態度親臨現場、看一看、聽一聽、修正假設。後來一個線索逐漸浮現:容易失火的建築通常建於1938年以前,因為紐約當時的建築法規較寬鬆。這些建築通常位於比較貧窮的社區,持有人往往欠繳房貸,先前鄰居通報過說有不良份子出入。依這樣的線索動手開始檢視相關資料,但面臨一個困難:資料是儲存於不同的資料庫,整個市府團隊不只不同部門各自為政,連同一部門內部都細分為不同團隊,資料各自分散。

團隊利用「一級地類稅務資料庫」挑出64萬棟房屋,基於紐約特殊的法規,這些建築有一半是由消防局負責檢查,另一半是由建築部。但團隊一併檢視這兩個部門的不同資料,查看火警與違建申訴狀況。另外,財政局與調查局是兩個不同的部門,分別負責稅務與詐騙問題,團隊們則一併檢視稅款繳納紀錄與房貸拖欠紀錄,然後再跟建築局取得1938年以前的建築資料,最後用「單一統計模型」比對所有資料,漸漸看出規律,也就是發現當一棟建築物同時具備這四個危險因子,則失火與違建的比率高出很多,即使沒人申訴亦同。換句話說,如果想找出容易失火的危險房屋,與其依賴311支專線的特定申訴,不如比對以下資料:房貸欠繳狀況、建造年度、反映社區貧富的諸多指標...

在副市長的支持下,福爾勞斯找上建築局的檢查員,請他們根據研究計算的結果進行同類建築的檢查,建築部只回他:「爛主意,別發神經了!」當然最終態度軟化,並採取他們的點子,結果相當驚人,原本若透過報案只有13%的受檢房屋有問題,如今這個數字竄升為70%,儘管幾乎沒多花一毛錢,檢查成效卻暴增四倍!

是僥倖嗎?團隊開始把這一套運用到大型建築,並繼續開始跟著建築局的檢查員到處跑,有天,無意間,團隊們跟檢查員閒聊時,一位檢查員說:「根據多年檢查經驗,肯花錢翻新磁磚的屋主不會容忍失火風險。」於是團隊著手開始查看紐約市磁磚載運紀錄,並把這份資料加入其他數據,結果預測準度大幅提升。

INSIDE網站其中一篇文章「紐約消防隊如何用數據挖掘來打火」探討得更加詳細:在資料數據及統計更加完整後,紐約消防員將影響房屋起火的因素分為 60 個。除去危害性較小的小型獨立屋,相關人員通過特定算法,為城市中 33 萬棟需要檢驗的建築物單獨進行打分,這樣當消防員每週出勤檢驗時,系統都會列出建築物的詳細資料和危險指數,決定哪些是優先「照顧」的對象。這個龐大的數據挖掘計劃從2013年七月開始實施,預計會將全紐約建築為歸類成 2400 種,例如學校、圖書館這種比較重要的設施就會列入超常規檢驗對象。

稍做整理後,從執行步驟來看,福爾勞斯的做法分成五個階段。
第一步:徵求資料分析人員,組成團隊。
第二步:整合其他單位資料,以開放態度親臨現場掌握線索。
第三步:進行資料整理與比對,看出規律。
第四步:爭取市府奧援,實際驗證成效。
第五步:擴大延伸應用。

紐約消防局發言人曾為此表示:透過數據,確實看到火災數量的下降。


具體應用及遭遇問題

透過大數據若能聚焦、掌握出易發生火災之區域後,在火災預防工作上,最直接便可以做到以下幾件事,節約人力、經費、資源:

一、聚焦重點消防檢查、違規取締對象,將有限的消防人力及資源用在刀口上,根據這些大數據顯示的情報去確定檢查對象和時間,而不是隨機檢查或者全部檢查。

二、針對城市的易致災區域,優化人力及車輛配置,甚至勤休制度的調整,降低人員於隊部可能待命的空窗時間。

三、掌握城市各個角落對於消防安全知識的需求程度,從而有針對性的開展消防宣傳工作,摒棄傳統工作中的填鴨演講式、拜託與討好民眾的教育方法。

那麼在應用大數據上,可能會遭遇什麼樣的問題呢?

去年10月,紐約知名資料科學家威靈頓訪台,他認為台灣政府的網站及資料公開的做法很友善,利於應用大數據處理資料。但台大經濟系梁國源教授曾撰「戀上大數據之前必須知道的事」一文中提及:大數據應用雖是各領域未來發展趨勢,卻非解決所有問題的萬靈丹,對於操作大數據,需要具備幾個重要的認知:

一、大數據技術只能做到相關性的瞭解,亦即僅知變數間的關係為何,無法得知因果條件。

二、若盲目地利用大數據所得的相關性結果去推論預定目標群中的人事物,是極有可能產生虛假相關。

三、大數據應用普及化後,極可能對隱私權造成侵害。


結論

紐約市政府福爾勞斯的做法雖可供我們參考,但台灣的消防深陷公務體系架構囹圄,加上公部門長期氛圍為防弊而非興利,使得消防機關動輒面對法律與調查,若資料的取得應用「可能」有所爭議,便容易讓好的、前瞻的、具魄力的計畫胎死腹中或功虧一簣。

從小地方先著手,實驗性的嘗試、試辦可能是目前最佳的策略,方向對了,就不嫌路遠。

1 則留言:

  1. 高雄市研考會應該重視了,各單位不要故步自封喔

    回覆刪除