《情報雜誌》, 2017,36(4):93-97
[目的/意義] 我國有關大數據分析的研究中流行一些說法:數據能講述故事;要全體不要抽樣;要相關不要因果。這些說法可能具有誤導性。
[方法/過程] 通過分析紐約市“市長數據分析辦公室”利用大數據分析幫助改善城市部門績效方面的成功案例,檢驗上述說法的正確性。
[結果/結論] 大數據分析不等於讓數據自己說話,數據自己是不會說話的。成功的大數據分析首先需要分析人員確定方向、目標,然後根據它們確定分析的對象,有針對性的收集和分析數據。數據夠了就好,“要全體不要抽樣”不是必要的。大數據分析首先需要瞭解數據的背景,離開了其所處的背景的數據是沒有價值的。大數據分析除了關注數據,還需要關注數據之外的很多因素,包括政治因素。