摘 要
靠譜?不靠譜!
3月30日,朋友轉了一篇文章《用Excel來預測一下明天的上海的陽性病例數量》??春髽O為震驚。
文中用過去上海3月28日之前18天的陽性病例數據,利用Excel的“設定趨勢線”,預測了3月29日以后,上海的每日新增數據。
其中,29日的數據與公布數據非常接近,因此被小郝許多朋友點贊、轉發(fā)、甚至贊賞,迅速達成閱讀10萬+。
更扎眼的是,他的預測下,甚至算到4月13日,單日新增到了10萬+的地步,又一個預測大神就此誕生?
但小郝作為一個金融工程畢業(yè)的學生真的看不下去這種誤導,在上海異常艱難的時候,繼續(xù)這種不明原理、亂帶節(jié)奏的博眼球做法,給上海添亂,必須吹毛求疵地說明他究竟錯到哪里:
1、萬能的預測方法?錯!
小郝常做科技公司財報分析,就拿京東近13年的營收來用,套用王先生的方法,立馬就能做出更好的趨勢線,四項式下,R2擬合度(決定系數)高達99.9%。
與之類似的,還有亞馬遜近10多年的營收,蘋果公司近2012年前的營收,都能做出類似的預測公式,R2超過99.4%比比皆是,王先生說的“在統(tǒng)計學里面非常少見的精確”,完全不存在,明明是很常見。
同時,這些模型也都能精準預測那些公司近兩年的營收,誤差極小,難道這就是完美又萬能的預測方法?絕非如此,反例立刻來打臉。
拿蘋果2001-2015年的營收數據做這類模型,做圖如下:
其趨勢線預測下2016年營收是2447億美元。
可現實呢(圖3)?2016年蘋果公司的營收只有2170億美元,是15年來第一次下降。銷售負責人換將、外部環(huán)境影響等多重因素,造成了整個預測模型的失敗。
可見,Excel做的簡單預測模型,根本無法精準預測“拐點”何時到來,畢竟單一維度的數據,實在單薄,根本無法覆蓋造成數據變化的復雜因素和假設變更,這正是統(tǒng)計學里“蝴蝶效應”的本意。
2、尊重專業(yè),別做“野仙”
沒錯,Excel提供了方便的統(tǒng)計工具,但其背后的統(tǒng)計原理,邏輯假設,王先生真的明白嗎?
統(tǒng)計預測是極為嚴謹的,要考慮的因素,對假設條件的考量都極為嚴苛,稍有不慎,預測就變得南轅北轍,因為現實狀況本身就是復雜多變,一個小要素的變更,都可能毀掉整個模型的基礎。
所以,單一數據的統(tǒng)計模型,向來在嚴謹預測里從未被大量采用,就像基因和某種疾病的關系,常常說只“存在統(tǒng)計學上的關聯”,而確認基因是導致疾病的關鍵要素,還需要海量的各種方面的驗證。
因為專業(yè),才能分清什么是“王道”,什么是“旁門左道”。
如果用Excel選一組數據,做個趨勢線就能預測世界的種種現象,那還要復雜的統(tǒng)計學干什么?還要計量經濟學、計量金融學復雜的理論干什么?
套用《潛伏》里余則成、李涯“錄音大決戰(zhàn)”里的臺詞,王先生現在的所作所為就是不懂其中的“基本原理”。
的確,王先生是知名企業(yè)家,創(chuàng)立的百姓網也已經上市,也拿過“青年精銳”的稱號,還是技術專家出身,但統(tǒng)計預測,并非您的專業(yè),就拿興趣來當真理,是不是太不把病例預測當回事了?
我2012年采訪過王先生,映像里他是謹慎、邏輯嚴密的理工男,應該不會走網紅“野仙”的路子,要做“高手在民間,失手在陰間”的事。
只是,當下上海正值關鍵時刻,擔憂、難過、不平等負面情緒已經不少,此時,王先生還火上澆油,搞出數據如此扎眼的不靠譜預測,不是更激化矛盾,制造焦慮?這和當年的“咪蒙”有啥區(qū)別?這對病例清零有什么好處?
所以,請王先生把專業(yè)預測的事交給專業(yè)的機構,只有孫悟空的愛好,沒有孫悟空的本事,還捉哪門子妖???
小郝知道,寫了這些,也沒有王先生的能力造出10萬+的閱讀,畢竟,數理分析都太過理智。比不過那些“專業(yè)不夠,手段來湊”高人。
但我真的只想讓周圍的上海朋友,不要被誤導,尤其在現在信心不足的時候,變得更加恐懼、難過、焦慮。
愿大家都好!
感謝您看到這里
轉發(fā)收藏加點贊
祝您喜樂合家歡
≧ ≦
關鍵詞: 必須爭鋒相對 王建碩做上海陽性病例預測 這是怎樣的誤導