清研智庫:如何考量美國大選民調的準確性
特朗普落后了,而且不是一點點。盡管特朗普在民調中落后拜登2年多,但他一直潛伏在誤差范圍附近或剛好在誤差范圍之外。由于經濟方面的基本數據強勁,而民眾對拜登的熱情又明顯不足,特朗普最終勝出是再合理不過的事情了(更何況有過半數的選民始終認為特朗普會贏)。
然而,過去兩周對特朗普來說是糟糕的,數字下沉遠超誤差范圍。
但民調的準確度如何,該如何考量?
首先,民調不能預測。每一次的民調都是選民在進行民調時的想法的快照。只有當一系列民調在一段時間內達成一致時,我們才能進行短期預測,而且只有在當前條件保持不變或變化不大的情況下才能進行預測。選舉中不斷變化的條件是使預測變得困難的原因,任何人在幾個月后選擇總統選舉的勝利者,都是在進行有根據的猜測,并希望他們的運氣能保持。
Real Clear Politics和Five Thirty Eight的平均值很好地近似地反映了競選的情況。不足之處是,它們包括一些糟糕的民調和長達兩周的民調,這使得它們滯后于當前的情況。但如果民調做得不好,看最新的民調就會成為一個問題,而媒體對沖擊力而非實質內容的偏愛更加劇了這個問題。媒體往往會把版面給那些數字驚人的民調,而事實上這些 “驚人”的數字往往是民調不好的表現。
想想CNN的民調。其10月4日的民調,讓拜登以57%比41%的優勢領先,不僅比其他任何民調數月來的差距更大,而且遠遠超過了平均誤差范圍。糟糕的民調對CNN來說并非新鮮事。在過去四次民調中,拜登的民調都高于Real Clear Politics的平均水平,有兩次民調遠遠超出了誤差范圍。當一個結果與其他結果相差甚遠時,就被稱為 “離群值”,應該以懷疑的態度看待。CNN最近就專門做 “離群 “民調。更有甚者,CNN的 戰場州民調將幾個州混為一談,而不是分開來看,使得這些數字毫無價值。我認為,在這次選舉中,CNN的民調是所有主要新聞機構中最差的。
另一方面,《投資者商業日報》(IBD)對特朗普過于青睞,其10月1日的民調將特朗普的總統的支持率置于拜登的3個百分點以內。IBD的問題在于,它的抽樣調查包括了幾乎與民主黨人相同數量的共和黨人。這是一個異常慷慨的投票率假設,因為民主黨人目前的人數遠遠超過共和黨人,而且幾十年來在政黨認同上普遍領先于共和黨。要想讓IBD的數字成為事實,必須出現巨大的投票率失衡。
而這正是民調最難解決的問題:猜測投票率組成。誰來投票顯然很重要,而且雖然投票人數的組成很少發生顯著變化,但僅僅幾個百分點的變化可以意味著很多。不幸的是,很少有民調機構會發布完整的交叉表,以確定每個人口統計類別的人數。YouGov做到了,他們提供了透明度,所以讀者可以分析他們的方法和結果。所有的民調都應該是不引起懷疑的民意調查。
Rassmussen長期以來被認為是一家支持特朗普和共和黨的民調公司,在過去的四年里,特朗普的數據一直較好。但Rassmussen只報告 “可能的選民”,而不僅僅是登記選民,這往往有利于特朗普。Rassmussen很可能有一個模型,認為更多的共和黨選民會參加。然而,如果沒有交叉表,我們無法確定。
最近Rassmussen的民調急轉直下,對特朗普不利,從9月22日拜登48%:47%的優勢,到10月6日52%:40%的優勢。雖然特朗普一直在失勢,但這是一個大動作,Rassmussen可能調整了投票模式。如果是這樣,要感謝Rassmussen改變其方法論,以反映它如何看待選舉的發展。但如果它能公布其抽樣構成,那將會有所幫助。
抽樣組成不是調查的唯一問題。對于低樣本的民調,應該總是非常謹慎地信任。任何受訪者少于800人的調查,不論是全國性或者州級的調查,都應該被立即取消。樣本太小了,因此有很大的誤差。即使是800名受訪者的民調也是個問題,因為很難分析組成部分的人口統計數據。
10月1日美國全國廣播公司(NBC)/《華爾街日報》(Wall Street Journal)的民調樣本量只有800人。其中,19%的人超過65歲(152名受訪者)。這是個極小的樣本,可能存在較大誤差。MSNBC報道稱,特朗普在老年人中的支持率急劇下降,35%比62%,支持拜登的比例驚人。但老年人是特朗普最好的人口統計之一,YouGov的最新民調顯示,在65歲以上的人口統計中,特朗普以49%對43%的比例領先。當你看到像NBC/WSJ這樣的異常結果時,通常意味著民調是一團糟。但NBC寧愿得到瞬間的震驚頭條。
最后說說誤差范圍的奧秘。誤差范圍很簡單。因為調查是大范圍人口的一個子集,所以不可能絕對百分之百的準確。當一項民調報告的誤差率為4%時,意味著95%的時間里,真實的百分比(如果你對整個人口進行調查)可能會偏離4個百分點。
但是,如果一項調查給出了候選人50%的支持率,誤差為4個百分點,并不意味著真實結果同樣可能是46%比54%。50%是最好的估計,1個百分點的差距比2個百分點的差距更有可能。完全偏離誤差范圍的可能性非常小。最近的YouGov的結果是拜登以50%:41%領先,誤差率為4.5%。極端情況下,選票可能是45.5比45.5的平局,但這是極不可能的。
最后一點,當候選人A在誤差范圍內領先候選人B時,他們并不是 “統計上的平局”。候選人A在統計學上是領先的,只是存在一些不確定性。僅僅知道這個事實,你就比電視上幾乎所有的專家都要聰明。
本文作者Keith Naughton,原載于《THE HILL》,清研智庫李梓涵編譯