※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2020-11-14 06:50:20
看板 Gossiping
作者 標題 Re: [新聞] 麻省理工博士數據分析 6.9萬川普選票被篡
時間 Fri Nov 13 05:53:34 2020
※ 引述《BinnigQuate (新手上路 能閃則閃)》之銘言:
: ※ 引述《goldenhill (我的人權時代)》之銘言:
: : 3.完整新聞標題:麻省理工博士數據分析 6.9萬川普選票被篡改
: : 肯特(Kent)的選票數據,呈現出非正常的散點分布,只要共和黨支持率超過20%,軟
: : 體的算法就開始自動減少川普的得票,有明顯的修改痕跡。
: 八卦是這位Shiva要在Twitter上討論這個研究,
: 可是他的Twitter帳號竟然就被封了,
: 一堆左派電視台爭相採訪他,
: 但被他拒絕了,
: 因為他知道記者訪問回去之後會怎麼誣陷他,
我想借題發揮一下之前有被提出來過,但是可能因為較為複雜所以討論的人不多。
進入正題之前,我們先來點數學:
假設我們對 0-19 之間 20 個整數作公平的隨機取樣,那麼第一個數字為 1 機會有多少?
機會大概是 55%。因為有 1 與 10, 11, ..., 19 共 11 個可能。
機會大概是 55%。因為有 1 與 10, 11, ..., 19 共 11 個可能。
同理,除了 1 以外的數字,例如 2,機會有 5%。
我們也可以把範圍從 0-19 放大到 0-100,並計算第一個數字為 1-10 之間某一數字的可
能性(排除 0)。因此可以用不包括 0 的百分比作為輸入。
這就是所謂的班福特數列。這常常在會計學上用來抓數字造假的機率。例如,可以把某公
公司在一段時間內的出帳或入帳的金額。當資料愈大時,每一筆金額的特定位數字應該要
愈接近班福特數列。
公司在一段時間內的出帳或入帳的金額。當資料愈大時,每一筆金額的特定位數字應該要
愈接近班福特數列。
來實作一下:
[A] [Benford]
1 9.75 12.3 11.9
2 12.3 11.5 11.3
3 9.9 11.3 10.9
4 10.15 10.1 10.4
5 9.3 11.4 10.0
6 12.0 9.8 9.7
7 9.5 7.8 9.3
8 8.4 8.9 9.0
9 8.8 9.0 8.7
10 9.7 8.1 8.45
兩個數列 A, B 這次美國某區兩陣營每次開票時報出的數字中,頭位數字分部的比例。
(四捨五入過所以加起來不是 100。不過這不影響計算)
第三個數列是班福特序列。理論上 A B 都要接近 Benford。所以我們可以計算兩組數字
與 Benford 的標準差。
stddev
A: 1.202
B: 0.699
A 與 Benford 的標準差快是 B 的兩倍。
當然,這只是一區的資料,並不能因此說 A 陣營必然有作帳。這個只能說在這區,B 陣營
的數據比 A 陣營更接近自然產生的隨機數。
不過,我們可以這個方法應用到多個區。比較看這兩個陣營在多個區中,拿到較高 stddev
的機會是不是一樣。
結果,嗯,其實跟媒體上傳出有計票誤差發生時,結果都非常剛好的有利於某特定陣營的
現像一致。
一場球賽中,發生多次裁判誤判,結果都非常剛好有利於某隊。不啓人疑竇?
我等下會給出完整証明。我先去收個 UPS..
--
→ :我推的平權政策 都不著重種族之間的平等,改強調種族之間的差別待遇
→ :年輕人都很歡迎 但就是太過激進 另外再特別給非裔專屬特權
→ :年輕人都很歡迎 但就是太過激進 另外再特別給非裔專屬特權
推 :XDDD
→ :沒有種族平等還能叫做平權???
→ :這兩個配起來非常棒 最好是加點街頭暴力
推 :那就不算是種族平等了吧..
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 148.168.216.5 (美國)
※ 文章代碼(AID): #1VhQxcy- (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1605218022.A.F3E.html
※ 同主題文章:
11-13 04:24 ■ Re: [新聞] 麻省理工博士數據分析 6.9萬川普選票被篡改
● 11-13 05:53 ■ Re: [新聞] 麻省理工博士數據分析 6.9萬川普選票被篡改
推 : 推 不然別人以為我看不懂1F 11/13 05:55
推 :2F 11/13 05:57
推 : 推,讓事實證據說話...3F 11/13 05:58
推 : 恩4F 11/13 05:58
推 : 快發推特啊~ 想看封號5F 11/13 06:02
推 : 你在說benfords law想看續集6F 11/13 06:14
→ : 有沒有質數版本?8F 11/13 06:26
我也想知道。不過沒辦法証明質數有總量上線
推 : 不少順豐來敲門嗎?9F 11/13 06:31
→ : 這個不少自媒體提過了
→ : 這個不少自媒體提過了
大部的自媒體都只有算一半。光是看 Benford 是沒用的。
跟 Benford 比只能說特定群隨機性比較低。但不能說他一定有作票。樓下某個五毛說的沒
用應該是指這個。
推 : 要有總數才能分析p值吧 這應該做goodness-of-fit 用卡方去11F 11/13 06:34
→ : 檢測
→ : 檢測
對耶。是同行?
推 : 好專業13F 11/13 06:34
推 : 下篇ae什麼的五毛會挖你底細以證你寫的是廢言^^14F 11/13 06:40
→ : 你有多少個開票結果15F 11/13 06:40
噓 : 一堆看不懂也在推16F 11/13 06:46
噓 : 班佛仔又出現了 查一下幾天前的文好嗎 事實查核根本17F 11/13 06:50
→ : 沒用 造謠仔都不看的然後一直重複PO
→ : 沒用 造謠仔都不看的然後一直重複PO
推 : 事實查核真的沒用阿,我已經認清了,樓上也放棄吧19F 11/13 06:51
數列本身是沒用沒錯啊。後面隨之而來的計算才有用。
不過我知道你看到「沒用」兩個字後。後面的描述就不會再看了。
然後基本上共產黨開的事實查核中心只有共產黨員會相信。跟毛語錄一樣大概。
→ : 不算同行 在唸沒人要的物理系,所以準備轉DS20F 11/13 07:05
不要轉 DS 啦。若沒有 PhD 的話只能當低階碼農。物理好玩多了。
推 : 有趣推21F 11/13 07:06
推 : 班佛定律似乎是現象 無法證明?22F 11/13 07:09
有証明啦。 好像 2006 年有論文。晚一點找找。
質數的 Benford 還沒辦法証明。我對這個很有興趣。不過前提是要知道質數是否有上限。
這個大概這一輩子是看不到了。
→ : 沒辦法啊 學術路難走 物理工作大部分又不收外國人23F 11/13 07:13
會嗎?物理所外國人不少啊。除非你唸的是敏感題目?
轉的話轉 CS 輔 DS。機會大一些。加個特定專長例如 bioinformatics,就業機會大。
推 : 這好像可以寫成一篇論文24F 11/13 07:13
應該是可以。我們團隊正在弄。
不過我再申明一次這方法沒辦法証明作票。只能說特定陣營票數的隨機性有可疑的空間。
作票與否那是法律問題,不是科學問題。
推 : 是 我們可以計算兩組數字與 Benford 的差異的標準差嗎?25F 11/13 07:14
我們是計算 標準差的大小。用 euclidean distance 意思一樣。
→ : 我已經快畢業了啦 是想找DS工作 學校會收外國人,我是說26F 11/13 07:21
→ : 業界 太多物理業界的工作都和國防相關了
→ : 理論物理PhD畢業離開學校只能跑去找別的工作
→ : 業界 太多物理業界的工作都和國防相關了
→ : 理論物理PhD畢業離開學校只能跑去找別的工作
理論物理確實路比較窄。轉 CS/DS 有空間。不過別放棄啊。有真愛才走得久。
我花很多空閒時間去計算 Black Hole Math。無耐不是本科料。算得很辛苦。
推 : push29F 11/13 07:26
※ 編輯: cybergenie (148.168.216.5 美國), 11/13/2020 07:31:25→ : 想到這個就不爽 假如唸化學或生物資訊 都搶手多了30F 11/13 07:28
→ : 額,Benford's Law的分佈是頭位數字d的機率是31F 11/13 07:28
→ : 啊 用到另一個帳號了…32F 11/13 07:29
幫改。
→ : Log[(d+1)/d] 你是不是把推導搞混了....33F 11/13 07:29
推 : 推34F 11/13 07:30
→ : Benford's Law是在那群數取對數的尾數是均勻分佈下成立35F 11/13 07:30
→ : 我是沒有看到學術文章說可以用在選舉上啦...
→ : 我是沒有看到學術文章說可以用在選舉上啦...
嚴格來說任何隨機數都可以拿來用啦。只是現實生活中產生的數字可能不那麼俱有隨機性
就是了。
[b]The Devil Is in the Digits: Evidence That Iran's Election Was Rigged
Since the declaration of Mahmoud Ahmadinejad's landslide victory in Iran's presidential election, accusations of fraud have swelled. Against expectati ...
Since the declaration of Mahmoud Ahmadinejad's landslide victory in Iran's presidential election, accusations of fraud have swelled. Against expectati ...
→ : 朗選舉上,但是我認為隨便用很危險的38F 11/13 07:32
是不行沒錯。所以沒打算搭這順風車。並且我也沒說是什麼陣營隨機性比較低。
其實看新聞可以看到開票出包結果都是很剛好的有利於某營。這不用數學來算,誰都看得
出來XD
→ : 除非拿很多次選舉結果都證明符合,否則不能據此說39F 11/13 07:33
→ : 有造假可能
→ : 有造假可能
Benford 只能証明某營開票隨機性比較低而己。那沒辦法証明造假。很多自媒體都過度解
讀這東西。選舉造假是政治司法問題。不是數學問題。
→ : 不是任何隨機數都可以,上面有說了是取對數以後尾數41F 11/13 07:41
→ : 平均分佈才可以。
→ : 而且Benford's Law首位數字是1的機率約是0.301
→ : 平均分佈才可以。
→ : 而且Benford's Law首位數字是1的機率約是0.301
→ : 感謝啦 我本來就也喜歡cs啦 寫code很有趣44F 11/13 07:43
→ : 你用的分佈我上面就說了,可能是和推導搞混了45F 11/13 07:44
有道理。來算算看。
推 : 用歸謬法可以簡單證明質數總量沒有上限46F 11/13 07:47
推 : 球是猿的49F 11/13 07:49
→ : 表格有列出來。50F 11/13 07:49
推 : 無可疑啦,哪次有可疑51F 11/13 08:04
推 : 就是解釋隨機性的嘛52F 11/13 08:33
→ : 恩,跟我想的差不多(?)53F 11/13 08:34
推 : 喔喔喔喔,漲姿勢了54F 11/13 08:40
推 : 文組的大大可以看Netflix的connected裡面有一集在討55F 11/13 08:49
→ : 論班佛!好看!
→ : 論班佛!好看!
推 : 推唷57F 11/13 09:00
推 : 推58F 11/13 09:18
推 : 就經典德國坦克問題 用繳獲的德國坦克編號推算出德國坦克59F 11/13 09:18
→ : 總數量
→ : 誤差只有1% 一個數學家推算出來比派出上千個間諜偷出來的
→ : 情報還準
→ : 總數量
→ : 誤差只有1% 一個數學家推算出來比派出上千個間諜偷出來的
→ : 情報還準
推 : 推63F 11/13 09:21
推 : 七樓po的影片其實就說的蠻清楚了 選舉中不一定成立64F 11/13 10:04
→ : 這篇論文也直接表明Benford’s law在選舉中問題很多
→ : 無法拿來判斷一場選舉是否做票
→ : https://doi.org/10.1093/pan/mpr014
→ : 這篇論文也直接表明Benford’s law在選舉中問題很多
→ : 無法拿來判斷一場選舉是否做票
→ : https://doi.org/10.1093/pan/mpr014
Benford's Law 能不能看出有沒有作票?答案肯定是不行。
但是我認為用來研究兩方之間哪一方的隨機性比較大是可以的。
當然隨機性比較低也不能說就一定是有問題。例如 49% - 51%。
若兩方都是用一樣方法,但在絕大部份地區都顯示其中一方隨機性比較低,這很難說不可
疑吧?
推 : 那如果是把原始b的數轉給a那這樣不就兩邊的班佛數都異常68F 11/13 10:21
→ : ?!
→ : ?!
推 : 數據會說話 數據問題提出懷疑不是就科學假設 還是大部70F 11/13 10:47
→ : 分人都只看結果
→ : 分人都只看結果
很多人一看班佛+美國選舉,直接就說不行不可信了。
又知道我算的是選舉中的什麼東西了?
→ : 在美國敏感領域真的大部分只能在學界...業界身分要求很72F 11/13 11:02
→ : 多...不過也不是不可能,需要一點運氣
→ : 多...不過也不是不可能,需要一點運氣
推 : 推,但是這麼細膩的立論與檢證,在台灣的話應該不會被當74F 11/13 11:36
→ : 成可採納的事實或證據
→ : 成可採納的事實或證據
推 : 幫推76F 11/14 00:16
※ 編輯: cybergenie (148.168.216.5 美國), 11/14/2020 03:29:01--
※ 看板: Gossiping 文章推薦值: 1 目前人氣: 0 累積人氣: 1061
( ̄︶ ̄)b darkrise1980 說讚!
回列表(←)
分享