对於统计学的看法与小故事范例

时间:2024.5.15





目錄

1、我對於統計學的初步認識??????????  3

2、小故事之一????????????????  4

3、小故事之二????????????????  6

4、小故事之三????????????????  7

5、小故事之四????????????????  8

6、小故事之五????????????????  9

7、學習心得?????????????????  11


我對於統計學的初步認識

       統計學是在資料分析的基礎上,自17世紀中葉產生並逐步發展起來的一門學科。它是研究如何測定、收集、整理、歸納和分析反映資料資料,以便給出正確訊息的科學。谷歌給出的解釋太書面太拗口太籠統不好記憶與理解。在我看來,統計學如字面所說,是一門有關“統計”的學科,是一種讓問題更快找到答案的輔助方法,運用的好可以輕鬆的事半功倍。當然這 只是我初步的淺薄認識。

        目前統計廣泛地應用在各門學科,從自然科學、社會科學到人文學科,甚至被用來工商業及政府的情報決策之上。並且與資訊、計算等領域密切結合,是資料科學(Data Science)中的重要主軸之一。而關於統計學的歷史,我從網絡資料上了解到統計手法最早可以追溯至公元前5世紀。最早的統計著作來自公元9世紀的《密碼破譯》,由阿拉伯人肯迪編著。在書中,肯迪詳細記錄了如何使用統計資料和頻率分析進行密碼破譯。根據沙烏地阿拉伯工程師易卜拉欣·阿凱笛(Ibrahim Al-Kadi)的說法,統計學和密碼學分析便如此一同誕生了。

        統計方法則包括實驗法、觀察法和實驗觀察法。統計研究中的共同目標是分析因果關係,具體來講就是從預估資料變化中得出結論,或是研究自變量與因變量之間的關係。方法概括起來很簡單,運用起來卻很靈活,書本知識的更好掌握需要更多的實踐。老師給我們上課理論知識會貫徹在實踐中來說,讓我們受益匪淺。

        統計學的範疇和延伸學科都很廣,在這裏就不一一舉例了。條形統計圖是最容易使用、最容易理解的圖表了,它可以用手或電腦繪製而成。[13]不巧的是,許多人忽視其中的偏差、誤差,因為他們不留意。因此,雖然圖表品質低劣,但人們常常願意去相信。        統計資料時常被濫用,對結果的解釋時常有利於演講者。[10]對統計的懷疑與誤導可被稱為:「世上有三種謊言:謊言,該死的謊言,統計數字」。許多對統計的濫用可能出於無意,也可能出於故意。老師在上課時特意強調了這個問題,統計學運用的好,得出的研究成果讓人受益匪淺;但倘若有心引誘,亂出題,採取不嚴謹的態度,樣本的可靠性可以被偏差破壞,得出的結果也將會南轅北轍。

        统计学是一个枯燥的专业,我们要和大量的数据打交道,堆积如山的各式表格看了都让人害怕,更别说还要去整理和分析这一堆堆冷冰冰的数字了,不过,统计学又是一个有趣的专业,毕竟它是和生活紧密联系在一起的。


統計學在與戰爭的故事(之一)

        二戰前期德國勢頭很猛,英國從敦刻爾克撤回到本島,德國每天不定期的對英國狂轟亂炸,後來英國空軍發展起來,雙方空戰不斷。

         為了能夠提高飛機的防護能力,英國的飛機設計師們決定給飛機增加護甲,但是設計師們並不清楚應該在什麼地方增加護甲,於是請來了統計學家。統計學家將每架中彈之後仍然安全返航的飛機的中彈部位描繪在一張圖上,然後將所411有中彈飛機的圖都疊放在一起,這樣就形成了濃密不同的彈孔分佈。工作完成了,然後統計學家說沒有彈孔的地方就是應該增加護甲的地方,因為這個部位中彈的飛機都沒能倖免於難。

        關於德國坦克,我們知道德國的坦克戰在二戰前期占了很多便宜,直到後來,蘇聯的坦克才能和德國坦克一拼高下,坦克作為德軍的主要戰力是盟軍非常希望獲得的重要情報,有很多盟軍特務的任務就是竊取德軍坦克總量情報,然而根據戰後所獲得的數據,真正對可靠的情報不是來源於盟軍特務,而是統計學家。

         統計學家做了什麼事情呢?這和德軍制造坦克的慣例有關,德軍坦克在出廠之後按生產的先後順序編號,1,2...N,正式因為這個傳統德軍送給了盟軍統計學家需要的數據。盟軍在戰爭中繳獲了德軍的一些坦克並且獲取了這些坦克的編號,現在統計學家需要在這些編號的基礎上估計N,也就是德軍的坦克總量。這其實均勻分佈邊界的估計,好吧公式是 (1+1/繳獲德軍坦克的總量)*所有繳獲坦克中的最大編號。

         統計學在戰爭裏面的運用也讓我意識到了統計學的強大之處,通過統計存活的飛機上的彈孔,從而來分析被擊毀的飛機是因為哪個部分護甲不好而被擊落!很明顯,那些空白的部位就是需要加強護甲的地方,這兩個主要的地方就是機頭和機尾。但其實第一個故事我曾經有了解過,那個統計設計是後來美國為了大規模轟炸德國所設計的,因為英國的轟炸規模是有限的,而且是集中在民用建築上的。第二個故事也是蠻神奇,我終於知道為什麼我們中國解放軍的編號會那麼的複雜,什麼92315部隊、62962部隊,並不是真的有那麼多的部隊,而是出於資訊安全的考慮,才考慮那麼編號,畢竟德國坦克的前車之鑒放在那呢。上面兩則都是是一個統計試驗的例子,設計一個好的統計試驗還是很實用的。 但現在我的工作中會得到大量數據,總是感覺能有設計一些統計試驗揭示背後的什麼規律,但是就是想不出來。

        我現在一個不僅不知道怎麼設計試驗,而且連能得到什麼都不知道。但我相信這些數據一定是有用的,等以後的統計的繼續學習或許能解開。



一次失敗的統計實驗(之二)

       霍桑效应 (Hawthorne Effect)或称霍索恩效应,起源于1924年至1933年间的一系列实验研究,在西方電器公司(Western Electric)位於伊利諾州的霍桑工廠(Hawthorne Works),霍桑一词是美国西部电气公司座落在芝加哥的一间工厂的名称,是一座进行实验研究的工厂,進行心理學實驗,研究工作環境改變對生產率的影響。研究人員嘗試增強照明,觀察它是否有助於提高流水線工人的生產率。研究人員首先檢測了工廠的生產率,爾後改變車間的照明強度,觀察結果。結果是生產率在實驗環境下的確提升了。实验最开始研究的是工作条件与生产效率之间的关系,包括外部环境影响条件(如照明强度、湿度)以及心理影响因素(如休息间隔、团队压力、工作时间、管理者的领导力)。


        然而,該實驗因其流程誤差在今天飽受批評,特別是實驗缺乏參照組和雙盲。霍桑效應僅從觀測來得出結論。 所谓“霍桑效应”,就是指那些意识到自己正在被别人观察的个人具有改变自己行为的倾向。 該實驗中生產率的提升不是因為照明強度的改變,而是因為工人們發覺他們被圍觀了。就霍桑试验本身来看,当这六个女工被抽出来成为一组的时候,她们就意识到了自己是特殊的群体,是试验的对象,是这些专家一直关心的对象,这种受注意的感觉使得她们加倍努力工作,以证明自己是优秀的,是值得关注的。所以生產效率的提高只是因為霍桑效應,而不是與實驗有關的其他影響因素。

        這是一次失敗的統計實驗過程,因為沒有採取正確的方法而做 誤判。從中我們可以學到,統計學是一門嚴謹的學科,我們在學習和實驗的過程中同樣也要採取嚴謹務實的態度來策劃執行一項實驗。否則結果會因為之前的一些誤差或錯誤導向而出現偏差乃至嚴重的錯誤。這是我們承受不起的。方法的運用和實驗的過程乃至各種變量都要經過細細的考量,要能保證最後出來的統計結果的最大精確度。

      統計與生活中的紅綠燈(之三)

       美國紐約是眾所周知的大都市,人車之多如過江之鯽,如何在每一街道上使汽車暢通無阻是一件非常不容易但是非常重要的事情.如果只過幾條街就需要開上一個多小時的話,那還得了,這個城市不就癱瘓了嗎 這一個難題也可以使用統計的方法來解決,也就是用它來控制紅綠燈,使這條街上在車子最少的時候出現紅燈,而另外一條街,卻在車子最多的時候出現綠燈,以利通行.經過一再的改進研究,如今以達到令人滿意的程度,車子一上路如第一個碰到的是紅燈,則再碰紅燈的機會就很小了!

        故事雖小,卻告訴我們統計與生活是息息相關的。我們應當能充分認識統計在生活中扮演的角色,並以統計的觀點來看待生活中的事務。可以說生活的每一個細節都是經過統計的原理來產生的結果。我們應該好好把握此次學習統計學的機會,將統計學應用到日常生活中去。


        拉普拉斯和《天體力學》(之四)

        有一個著名的故事:拉普拉斯把他寫的《天體力學》獻給拿破崙。《天體力學》是一本極具影響力的書,描述了如何根據地球上的觀測數據,來計算行星與彗星的位置。拿破崙看後說:“拉普拉斯先生,你寫了這本關於宇宙系統的書,卻根本沒有提到他的創造者——上帝”。據傳說,拉普拉斯回答道:“我不需要這個假設條件”。 

        拉普拉斯的《天體力學》雖不需要上帝,但它需要另一種東西,叫誤差函數。從地球上觀測行星與彗星的位置與預測值 並不完全吻合,拉普拉斯將其原因歸結為觀測誤差,包括隨機誤差和人為誤差,並都放入誤差函數中。當時的科學家都認為,隨著測量越來越精確,最後一定不再需要這項誤差函數。誰知,到19世紀末,隨著測量越來越精確,反而越來越測不准了。最終人們發現,這些誤差一方面是由於測量技術問題,另一方面是由於被測量的客體本身具有隨機性。機械式的宇宙觀開始動搖,一些企圖尋找生物學定律和社會學定律的努力也徒勞無功,甚至有些傳統學科領域,如物理學和化學當時所用的那些定律,也被認為僅僅是粗略的逼近。科學家從理論上和實踐上都充分證實了嚴格決定論對描述客觀現象的不適應性和不可歸結性。布朗運動、混沌動力學、量子力學、耗散結構都證明了經典決定論已逐漸向統計決定論轉移。人們的科學觀念發生了新的變化。自然和社會中不規則、不連續、不穩定、非平衡的領域不斷擴大,其中充滿了湧現、轉化、意外和機遇。科學探索也達到了這樣的境界:科學家對客觀事物的描述和預測的精度已不能通過改進操作技巧,提高測量的精密度加以改善,他們發現根本沒有可能發現嚴格的因果依賴性,可以找到的只是統計的因果規律。 

        這個故事告訴我們,統計的用處是很大的,儘管統計學的客觀基礎問題還在爭論不休,但統計已改變了世界,已成為科學與管理的工作母機,現在,誰也離不開統計了。統計也成為現代人基本素質的構成要素,成為我們世界觀的一個組成部分。所以我們應該重視統計學的學習,並在日後的生活中將其運用起來成為我們得心應手的工具。


數據會說謊(之五)

       2008 年,在權威雜誌《英國皇家學會學報》上發表了一篇文章:《You are what your mother eats: evidence for maternal preconception diet influencing foetal sex in humans》。研究人員就打算回答上面的問題。他們通過對 740 名女性進行分組研究,考察她們孕前、早孕期、中晚孕期的飲食情況對於胎兒性別的影響。研究人員對 133 種食物進行問卷調查研究,結果發現,懷孕前早飯吃更多燕麥的女性,更容易生男孩!而除了燕麥,調查的其他食物都和男女性別沒有明顯關聯。

        這篇文章一發表,馬上引起廣泛關注。如此高的關注度,自然逃不過學術界的質疑。2009 年,同樣在《英國皇家學會學報》上,一篇針鋒相對的質疑文章發表出來:《Cereal-induced gender selection? Most likely a multiple testing false positive》。提出質疑的,是三位統計學家:Stanley Young,Heejung Bang 和 Kutluk Oktay。他們撇開實驗設計中的數據獲取的問題,比如回憶偏倚、測量誤差、精確測量的困難性等等,直接針對前一篇文章的統計學方法提出質疑。他們在對前一篇文章中提供的原始數據進行重新統計之後發現,那些數據其實全部沒有相關性,而所得出的“吃燕麥生男孩”的結論,其實只是一個偶然事件。

       也就是說,之前研究的那 133 種食物,對於生男生女的影響都是隨機分佈的;但是在那一次研究的時候,恰好發現那一批研究對象吃了燕麥更容易生男孩,這純粹屬於偶然事件。那篇文章把一個偶然事件當做結論報導出來了。

        問題就在統計方法上。2008 年那篇文章的統計方法用的還是 p 值,但是,Stanley Young 他們指出,在做多重檢驗(multiple testing)的時候,使用 p 值是不正確的,而應該用校正後的 p 值(ajusted p-value),也就是要考察一個錯誤發現率(False Discovery Rate,FDR)。

        我們在做統計研究的時候是有一定的“容錯率”的,而這種小概率事件在一次試驗中實際發生的機會其實微乎其微,於是我們認為結果是可信的。但是,當我們研究的因素多起來,對這些因素同時進行統計分析的時候,本來一個因素 1% 的出錯機會就被放大了。本來的小概率,當遇上更大的基數時,小概率事件就發生了!所以,就出現了上面提到的,雖然那 133 種食物的影響其實都是隨機的,但是當對他們進行研究時,竟然出現了一個“有意義”的結論。

        這個故事中我明白,我們做的每一個判斷都是有可能出錯的,但是,我們希望經過我們的努力,使我們的判斷出錯的概率盡可能小。這還讓我想到大數據。現在是一個逢人必說大數據的時代,而且大數據確實給我們的觀念帶來巨大的衝擊。但是,大數據不牛逼,分析數據獲得資訊才更重要。因為有瑕疵的分析方法,就有可能會得出前面提到的“吃燕麥生男孩”的結論。

        1988 年,Russell Ackoff 提出了 DIKW 金字塔。這個金字塔的最底層是數據,而塔尖則是智慧。在從數據通往智慧的路上,是資訊和知識。所以,我們這個世界上不缺乏數據,缺乏的是通過合適的方法從數據中獲取資訊,進而從資訊中提煉知識,上升到智慧的能力。

        其實數據不會說謊,它們只是一些毫無意義的數字而已;但是當你對這些數字進行解讀,從獲取到分析,這個過程就可能出現問題,即使你的每個步驟都是合乎邏輯的。


我的學習心得

       才剛剛接觸統計學這門課程不久,有一些感想,也有一些收獲。無疑的是,我們掌握了統計學這門實用的工具,在我們未來的人生中,也必將會運用這個工具,陪伴我們前行。

        作為一個數學水平不太好的學生,我對這門學科有著一絲恐懼。每當有人談起統計,我腦袋中就浮現出計數,一大堆枯燥的數字,還有一長串的數學計算式。

        但是幾節課的學習,我對統計學有了全新的認識。在學習的過程中,我漸漸開始意識到統計學在學術研究中,在公司決策中,在國家制定方針政策時……在社會生活的各個方面都發揮著重要作用,它有它獨立而完備的理論體系,它是相當科學的,它是以數學作為它的基本工具,但它有比數學更有實際用途,它可以對生活中大量的無序的數據進行分析,找出它們的規律,從而為研究、決策提供基本的依據,它是其他學科的一切理論的基礎和來源……        

        在學習統計學之前,我一直把統計學看成另外一種數學——也就是文科生的夢靨。雖然在很多方面統計學和數學存在著緊密聯系,例如統計中會用大量的數學工具,所以為了掌握它,你必須要複習一下相關的數學知識,這樣才能在學習中靈活運用。但是它和數學在某些方面也會存在很大的不同。在我看來,統計學更加地貼近實際,因此我們在學習中必須緊密聯系到它的現實意義,在統計過後,我們還必須理解分析出來的數據所具有的實際的經濟意義,這樣才算是完成了整個統計的過程。希望在這個統計學的課程完成之後,在未來的學習或者是工作中,我能夠運用統計學的知識,提高我的學習和工作效率及水平,讓我能夠成為一個更加符合社會需求的人才!


第二篇:统计学故事


统计学基本原理——赌场的故事

赌场为什么赚钱?没有任何trick,统计学原理。

?

例子。我有100块钱,你有10块钱,我们扔硬币,头算你赢1块,字算我赢1块。规则:赌到输完才许结束。那么问,各自的胜负概率多少?我赢到你的10块钱的几率大于90%!这个就是统计学基本原理。

?

赌场。庄家资金大概是入场赌徒的资金的千倍或者万倍,如果扔硬币,赌徒的胜率会有多少?自己算一下吧,0.00..01%。因此,庄家允许玩一些花样,一方面提高赌徒的玩兴,一方面允许庄家在每笔小赌中胜率略小于50%:没关系,表面上你赢的多,最后都是我的,嘿嘿,这就是庄家。

?

具体庄家胜率能小到多少?跟怎样的赌徒可以玩怎样的胜率?这些是无数赌场百年来经验积累,为什么不用统计学算一下呢?

?

当然,你可以argue。

?

1,我干吗赌完才走?我赢到满意了就走。这种小赌徒有,但是不输到精光不停才是真正的赌徒,赌场主要生意面向真正的赌徒。小赢就跑的人毕竟不多,对赌场没有大的损失,反而做了活广告,——“瞧,这家赌场多好玩,还能赚钱,大家以后都去阿~~~”

?

2,虽然庄家胜率极高极高,但是庄家只有一个,赌徒多阿~~~ ‘人海战术’打败庄家。统计上说,多次贝努利实验的结果也是很容易算的。赌徒数线性增长,赌场的胜率减弱却是级数型。注意:级数增长是很可怕的,但是级数减弱缓慢得让人挠头发火。人多到把赌场挤爆都不一定能扭转局面,庄家此时已经赚得笑不动了。

?

因此,最严谨的科学——数学说:你赢不了赌场;你每次下注赢回的期望值都是正的,但是你每次去赌场回家时口袋里的期望值是零;赌钱就是happy一下,千万别沉迷。

激励我们一生的几个经典故事

??? 1、勤奋,机会,乐观是成功的三要素。(注意:传统观念认为勤奋和机会是成功的? 要素,但是经过统计学和成功人士的分析得出,乐观是成功的第三要素)

??? 2、(一般情况下)不想三年以后的事,只想现在的事(现在有成就,以后才能更辉煌)

??? 3、把问题看宽广些,没有解决不了的事。(真理路广,人欲路窄;当然不要超越时代去想现在任何人都解决不了的事)

??? 4、机遇对于有准备的头脑有特别的亲和力。

??? 5、只为成功找方法,不为失败找借口(蹩脚的工人总是说工具不好)

??? 6、生气是用别人的错误惩罚自己。——康德(这个哲学家让人眉开眼笑)

??? 7、失去金钱的人损失甚少,失去健康的人损失极多,失去勇气的人损失一切。

??? 8、只要下定决心克服恐惧,便几乎能克服任何恐惧。因为,请记住,除了在脑海中,恐惧无处藏身。——戴尔·卡耐基

??? 9、这世上的一切都借希望而完成。农夫不会播下一粒玉米,如果他不曾希望它长成种籽;单身汉不会娶妻,如果他不曾希望有小孩;商人或手艺人不会工作,如果他不曾希望因此而有收益。——马丁·路德

??? 10、目标的坚定是性格中最必要的力量泉源之一,也是成功的利器之一。没有它,天才也会在矛盾无定的迷径中,徒劳无功。在“21天--- ”中制定我们的目标,让成功无处可逃。

??? 11、要冒一次险!整个生命就是一场冒险。走得最远的人,常是愿意去做,并愿意去冒险的人。“稳妥”之船,从未能从岸边走远。——戴尔·卡耐基

??? 12、当一个青年人站起来面对这个大莽汉——这个世界——并勇敢地抓住他的胡须时,常会吃惊地发现,胡须脱落在他手上,原来它只是系上去吓唬胆怯的冒险者的。——罗夫·华多·爱默生?

统 计 学 家 的 故 事

有个从未管过自己孩子的统计学家,在一个星期六下午妻子要外出买东西时,勉强答应照看一下四个年幼好动的孩子。当妻子回家时,他交给妻子一张纸条,上 面写着: “擦眼泪11次;系鞋带15次;给每个孩子吹玩具气球各5次;每个气球的平均寿命10秒钟;警告孩子不要横穿马路26次;孩子坚持要穿马路26次;我还要再过这样的星期六0次。”

120岁寿命极限将会逐渐延长

迄今科学家认为人类最多只能活到120岁,但美国和瑞典人口统计学家最近对此生命极限说提出了挑战。

美国加州大学伯克利分校威尔莫斯及其同事在美国《科学》杂志上报告说,他们分析了自1861年以来瑞典每年的全国死亡记录,得出的结论表明人类的寿命不是固定的,而是随着时间的变化而变化的。

瑞典19世纪60年代活得最长的男人和女人是101岁。到20世纪60年代,最高死亡年龄上升到105岁。到20世纪70年代,治疗心脏病、中风和其他疾病的更好医疗手段的出现,使得瑞典人的最高死亡年龄进一步提高,从每隔20年增加不足1岁变为每隔10年增长1岁多。

研究人员说,根据瑞典最高死亡年龄在一个多世纪里整体呈上升状态,估计其他国家的情况也应如此。他们指出,随着高龄老人存活机率的增加,人类预期的120岁寿命极限将会逐渐延长。(2000.10.24)

统计学家的特点

纵观统计学史,许多作出开创性贡献的,都是知识广博多才多艺的通才。

政治算术学派奠基人威廉·配弟(1623一l687)是英国一个贫苦工匠的儿子。少年时代曾学过希腊语、拉丁语、数学和天文学。并利用在商船上做待工的机会,一边做事,一边学习法语和航海术,还曾在法国学习过解剖学。1649年获得牛律大学医学博士学位,曾任医学教授和音乐教授、医生、秘书、土地分配总监、土地测量总监、英国皇家协会副会长等职。由于他交游广、经历丰富、观察周密、掌握数据,所以能叙述荷兰、法国的情况,并和英国的国力相对比,论证英格兰的情况及各种问题,为英国争夺世界霸权出谋划策。也由于他的博学,才能以培根(1561—1626)所创始的经验科学的方法(即依据观察、比较、实验、归纳等方法)为根据,提出“对于人口、土地、资本、产业的真实情况的认识方法”,用计量作比较,用数字作语言,阐明社会经济现象的规律,写出《政治算术》这本名著,为后人所推崇。马克思评价他是“政治经济学之父,在某种程度上也可以说是统计学的创始人”。

被称为现代统计学之父的凯特勒(1796—1874)是比利时人,1819年(23岁)在甘得大学获得博士学位。1823年建议政府建立天文台,为了筹建工作,被派往法国学习。由此,与拉普拉斯、普阿松、傅立叶等人相识,并从拉普拉斯学习概率论。1827游学英国伦敦:1829一1830年先后到德国、法国、瑞士、意大利等国考察。据说,他曾偶然接触到人寿保险公司实际业务问题,促成他从事统计的研究。1823年天文台建成后,被任名为台长,并开始发表人口及犯罪方面的统计研究。l841年成立比利时中央统计委员会,由他任终身主席。凯特勒学识渊博,是统计学家、数学家、天文学家、物理学家。他把概率论引进统计学,在欧美统计学史上承先启后、继往开来,是数理统计学派创始人。

社会统计学派德国的厄思斯特·恩格尔(1821—1896),青年时代攻读采矿冶金学,毕业后,于1846—1847年赴欧洲各地游学,在布督塞尔与凯特勒相识,从此他奉凯特勒为师,矢志学习统计学,后任萨克逊王国、普土王国统计局长达31年之久。恩格尔根据他对英国:法国、德国、比利时等国工人阶级社会情况大量观察调查,发现了家庭收入越少,用于饮食费用的支出在家庭收入中所占比重就越大,随着家庭收入的增加,用于饮食费的支出所占比重就越小。即著名的恩格尔法则。

近代统计学家葛尔顿·皮尔逊,不仅是统计学家、数学家,而且是生物学家、农业家。罗纳德·费雪是数学家,学习过统计学,量子学,又是生物学家,主持过农事试验场统计研究工作。19xx年出版《供生物、农业与医学用的统计表》,19xx年出版《统计方法与科学推断》,驰誉世界,成为推断学派创始人。

统计学家献计炸德军

二战后期,盟军为开辟第二战场作准备,想利用轰炸,尽可能多地摧毁德军的工业设施及军事目标,同时减少自已空中力量的损失。但由于美国本土与德国远隔重洋,空军只能部署在英国、北非等少数地域,而需要打击的德军目标几乎遍布整个欧洲,同时,德军又组织了强大的防空体系。美空军长途奔袭,或者劳而无功,或者损兵折戟。为此,盟军组织了包括统计学家在内的参谋智囊团,寻求对策。最后,智囊团针对上述两个目标,运用统计方法对敌我双方的力量及实战资料作出综合分析,提出了两个作战方案。

一是釜底抽薪,集中力量轰炸德国防卫薄弱但有巨大潜在作用的基础工业。统计学家运用投入产出原理,研究德国军事工业及民用工业之间的相互关系,认为在高度相关的情况下,每个工业部门都在很大程度上依赖于其他部门,如果破坏其中关键的一链,就会产生多米诺骨牌效应,足以瘫痪其整个军事工业。因此盟军对滚珠、轴承等十几个防空力量较弱但很关键的工厂、仓库实施了猛烈的轰炸。这样一来幸存的兵工厂因缺少滚珠轴承而无法制造新的飞机坦克,东部战线开动的车辆又因缺少补给而变成一堆废铁。一度以机械化闪电战自诩的德军像被斩断了双脚,有时不得不靠征用骡马来完成部队的集结,常常贻误战机。

二是实施“钟摆轰炸”,减少己方飞机损失。智囊团中的统计学家根据被德军击伤击落飞机的统计资料发现,在实施轰炸前和轰炸时被击中的比例低于返航途中的损失。德军往往采取一种守株待兔的策略,在受到轰炸后,立刻调动战斗机在盟军的返航路线上控制有利位置,严阵以待。盟军轰炸机因此损失不少。统计学家因此提出了一个“钟摆轰炸计划”。盟军飞

机从英国机场起飞,完成轰炸后并不向西返回英国基地,而是继续向东飞至当时的盟友苏联境内,在苏军飞行基地休整一段时间,补充燃料弹药后再进行反向轰炸,尔后返回英国,就好像钟摆从一端摆向另一端,然后摆回来,周而复始,这样常造成德军防空系统判断失误,无法作出有利的回击。通过历时一年多的“钟摆轰炸”,盟军飞机穿梭于东西方各个机场,向德国投下了近10万吨炸药,给德军造成重大的损失。

恩格尔系数

恩格尔系数是根据19世纪德国统计学家恩格尔的定律得出的比例数,它指的是食品消费在家庭总消费支出中所占的比例。一个家庭,收入越少,家庭总支出中用于食物的支出比例就越大;随着家庭收入的增加,家庭总支出中用于食物的比例则会下降。推而广之,一个国家越贫穷,每个国民的支出中用于食物的支出所占比例就越大;随着国家的富强,这个比例就会呈下降趋势。联合国根据恩格尔系数制定了划分贫困与富裕的标准:恩格尔系数超过60%为绝对贫困型;50%~60%为勉强度日或基本温饱型;40%~50%为小康型;30%~40%为富裕型;低于30%为最富裕型。目前恩格尔系数低于30%的只有美国和欧盟国家。其他中等发达国家和城市恩格尔系数均在30%~40%之间。

干预的最终效果

数学家的幽默

一名统计学家遇到一位数学家,统计学家调侃数学家说道:

“你们不是说若X=Y且Y=Z,则X=Z吗!那么想必你若是喜欢一个女 孩,那么那个女孩喜欢的男生你也会喜欢罗!?”

数学家想了一下反问道:

“那么你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里想来 也没事吧!因为它们平均不过是五十度而已!”

统 计 学

如今统计学家对平均值感兴趣。张三收入10元,王老五收入5元。统计学家会说,人均7.5元.王老五四处张望,不知自己多收的2.5元在哪?

王老五左脚踩在火炉上,右脚踏在冰块上,统计学家就冷暖平均值而言,认为王老五挺舒服,按理说应该是很舒服的。

格里高.孟德尔(G. J. Mendel )1822年7月22日出生在奥地利一个贫苦的农民家庭。正是他,一个从小热爱劳动、热爱大自然的孟德尔,成了我们永远纪念的现代遗传学的鼻祖。他是一个伟大的生物学家。他经过长达8年之久的豌豆杂交试验,真正开始阐明生物遗传规律,从而揭开了现代遗传学的篇章。 豌豆杂交试验

在豌豆的品种中,种子有圆的,有皱粒的;有开白花的,也有开红花的等等。孟德尔把种子的圆与皱,花色的红与白等同类又有差异的性状叫做相对性状。他的试验就是用具有相对性状的两个品种进行杂交。

他把皱粒种子的豌豆的花粉传授在圆粒种子植株的花柱上,结果收获的种子全部是圆粒的。反过来,将圆粒植株的花粉授给皱粒植株,结果相同,结出的种子也全部是圆粒的。这项实验共收获253粒种子。第二年,他把这些种子种下,令其白花授粉(遗传学上叫做自交),获得了7324粒第二代种子。不过,其中5474粒是圆的,1850粒是皱的,得到“圆:皱=2.96:1”的结果。这与第一代情形大不相同。孟得尔又做了六个类似实验,结果相对性状的比总是围绕 3:1 波动。孟德尔继续完成了2对、3对,以至N对基因同时传递时,子代各类型比例关系的研究,结果显示各比例均大体符合(3:1)的N次方展开规律。

于是孟德尔认为,每种生物的遗传性状决定于细胞中的某种遗传因子(即孟德尔因子);性状的遗传是由于遗传因子在亲子之间的传递;在真核生物中,遗传因子成对存在(有多少性状就有多少对基因),其中一个来自父方,一个来自母方。这就是遗传学中著名的基因分离与自由组合法则,是现代遗传学的基础。孟德尔被誉为现代遗传学的奠基人。

1865年2月8日和3月8日,孟德尔在他所在的捷克布尔诺地区自然史协会的学术集会上,报告了自己利用豌豆所做的杂交试验,以及以此为基础得出的遗传规律。次年,他又把这一研究成果以《植物杂交试验》为题发表在该协会的会刊上,大约有120家图书馆接到了这本印有孟得尔论文的刊物。遗憾的是,如此重大的发现,竟未引起当时科学界的任何反响。作为现代遗传学开端的孟德尔的《植物杂交试验》论文,竟在书架上沉睡了34个年头无人问津,以至于19xx年才被科学界公认为现代遗传学历史的起始点。这时孟德尔已逝世16年。

科学家发现,人与人之间的99.99%的遗传密码序列都相同,但又存在万分之一的差别,使每个人都具备区别于他人的碱基序列,这就是DNA的多态性。每个人多态性位点的差别就成为个人识别的标志。根据遗传学的传递规律,子女的身份标记必定来自双亲,据此可用于亲子鉴定。本机构采用美国ABI-310及ABI-5700型遗传分析仪,五色荧光试剂盒,检测16个STR位点的基因型,按照国际常用标准鉴定亲生血缘关系或个人身份,结果准确,亲权关系排除率可达99.99%以上。

布丰的投针试验

公元1777年的一天,法国科学家D·布丰(D·buffon1707~1788)的家里宾客满堂,原来他们是应主人的邀请前来观看一次奇特试验的。

试验开始,但见年已古稀的布丰先生兴致勃勃地拿出一张纸来,纸上预先画好了一条条等距离的平行线。接着他又抓出一大把原先准备好的小针,这些小针的长度都是平行线间距离的一半。然后布丰先生宣布:“请诸位把这些小针一根一根往纸上扔吧!不过,请大家务必把扔下的针是否与纸上的平行线相交告诉我。”

客人们不知布丰先生要干什么,只好客随主意,一个个加入了试验的行列。一把小针扔完了,把它捡起来又扔。而布丰先生本人则不停地在一旁数着、记着,如此这般地忙碌了将近一个钟头。最后,布丰先生高声宣布:“先生们,我这里记录了诸位刚才的投针结果,共投针2212次,其中与平行线相交的有704次。总数2212与相交数704的比值为3.142。”说到这里,布丰先生故意停了停,并对大家报以神秘的一笑,接着有意提高声调说:“先生们,这就是圆周率π的近似值!”

众宾哗然,一时议论纷纷,个个感到莫名其妙;“圆周率π?这可是与圆半点也不沾边的呀!”

布丰先生似乎猜透了大家的心思,得意洋洋地解释道:“诸位,这里用的是概率的原理,如果大家有耐心的话,再增加投针的次数,还能

得到π的更精确的近似值。不过,要想弄清其间的道理,只好请大家去看敝人的新作了。”随着布丰先生扬了扬自己手上的一本《或然算术试验》的书。

π在这种纷纭杂乱的场合出现,实在是出乎人们的意料,然而它却是千真万确的事实。由于投针试验的问题,是布丰先生最先提出的,所以数学史上就称它为布丰问题。布丰得出的一般结果是:如果纸上两平行线间相距为d,小针长为l,投针的次数为n,所投的针当中与平行线相交的次数是m,那么当n相当大时有:

在上面故事中,针长l等于平行线距离d的一半,所以代入上面公式简化

我想,喜欢思考的读者,一定想知道布丰先生投针试验的原理,下面就是一个简单而巧妙的证明。

找一根铁丝弯成一个圆圈,使其直径恰恰等于平行线间的距离d。可以想象得到,对于这样的圆圈来说,不管怎么扔下,都将和平行线有两个交点。因此,如果圆圈扔下的次数为n次,那么相交的交点总数必为2n。

现在设想把圆圈拉直,变成一条长为πd的铁丝。显然,这样的铁丝扔下时与平行线相交的情形要比圆圈复杂些,可能有4个交点,3个交点,2个交点,1个交点,甚至于都不相交。

由于圆圈和直线的长度同为πd,根据机会均等的原理,当它们投掷次数较多,且相等时,两者与平行线组交点的总数可望是一样的。这就是说,当长为πd的铁丝扔下n次时,与平行线相交的交点总数应

大致为2n。

现在再来讨论铁丝长为l的情形。当投掷次数n增大的时候,这种铁丝跟平行线相交的交点总数m应当与长度l成正比,因而有: m=kl

式中K是比例系数。

为了求出K来,只需注意到,对于

这便是著名的布丰公式。

亲爱的读者,你不妨一试。 l=πd的特殊情形,有m=2n。

戳穿“摸彩”骗局

“天有不测风云,人有旦夕祸福”。这话有对的一面,也有不对的一面,对的是,说出了事物发生的偶然性。不对的是,夸大了偶然的成份,忽视了偶然中的必然规律和量的关系,给人笼罩上一种不可知论的阴影。

举例说,在世界上火车与汽车相撞的事件,时有发生。然而,却几乎没有人,由于担心火车与汽车相撞,不去乘火车、汽车而宁愿步行。这是为什么呢?原因是:在现实中,这种相撞的可能性实在是太小了。在世界上千千万万次的车祸中,能找到的也只是极少数几例。又如,人遭遇车祸,这种可能性通常要比火车与汽车相撞的可能性大不知多少倍。然而,在人们亿万次的外出中,遭遇车祸毕竟还是占少数。这潜意识包含了一条极重要的原理——小概率原理,即一个概率很小的事件,一般不会在一次试验中发生。

下面给你介绍一个有趣的游戏。如果你新到一个班级,那么你完全可以大言不惭地对你班上49名新伙伴,作一次惊人的宣布:“新班级里一定有人生日是相同的!”我想大家一定会惊讶不已!可能连你本人也会感到难以置信吧!因为首先,你对他们的生日一无所知,其次,一年有365天,而你班上只有50人,难道生日会重合吗?但是,我必须告诉你,这是极可能获得成功的。

这个游戏成功的道理是什么呢?原来,班上的第一位同学要与你生日不同。那么他的生日只能在一年365天中的另外364天,即 如此

等等,得到全班50名同学生日都不同的概率为:

用计算器或对数表细心计算,可得上式结果为:

P(全不相同)=0.0295

由于50人中有人生日相同和全不相同这两件事,二者必居其一,所以

P(有相同)+P(全不相同)=1

因而 P(有相同)=1-P(全不相同)=1-0.0295=0.9705

即你的成功把握有97%,而失败的可能性不足3%,根据小概率原理,你完全可以断定这是不会在一次游戏中发生的。

目前,在一些小市镇可以看到一种“摸彩”的招徕广告。这实际是一种赌博,赌主利用他人无知和侥幸心理,有恃无恐地把高额的奖金设置在极小概率的事件上。赌客纵然一试再试,仍不免一次次败兴而归,结果大把的钞票,哗哗流进了赌主的腰包。我们应当戳穿这种骗局。 有人见过一个“摆地摊”的赌主,他拿了八个白、八个黑的围棋子,放在一个签袋里。规定说:凡愿摸彩者,每人交一角钱作“手续费”,然后一次从袋中摸出五个棋子,赌主按地面上铺着的一张“摸子中彩表”给“彩”。

这个“摸彩”赌博,规则十分简单,赌金也不大,所以招徕了不少过往行人,一时围得水泄不通。许多青年不惜花一角钱去碰“运气”,结果自然扫兴者居多。

下面我们深入计算一下摸到“彩”的可能性。

(读者如果一时弄不清计算的方法,可以只看结果),现在按摸100

0次统计;赌主“手续费”收入共100元,他可能需要付出的连纪念品在内的“彩金”是:

[P(五个白)×2+P(四个白)×0.2+P(三个白)

×0.05]×1000

=[0.0128×2+0.1282×0.2+0.3589×0.05]

×1000

=69.19(元)

赌主可望净赚30元。我想看了以上的分析,读者们一定不会再怀着好奇和侥幸的心理,用自己的钱,去填塞“摸彩”赌主那永填不满的腰包吧!

从《歧路亡羊》谈起

《歧路亡羊》是《列子》中一篇寓意深刻的故事。文如下:

杨子之邻人亡羊,既率其党,又请杨子之竖追之。杨子曰:“嘻!亡一羊,何追者之众?”邻人曰:“多歧路。”既返,问:“获羊乎?”曰:“亡之矣”曰:“奚亡之?”曰;“歧路之中又有歧焉,吾不知所之,所以反也。”

下面我们就来研究一下杨子的邻人,找到丢失的羊的可能性有多大。假定所有的分叉口都各有两条新的歧路。这样,每次分歧的总歧路数分别为21,22,23,24,?,到第n次分歧时,共有2n条歧路。因为丢失的羊走到每条歧路去的可能性都是相等的,所以当羊走过n个三叉路口后,一个人在某条歧路上

例如,当n=5时,即使杨子的邻人动员了6个人去找羊,找到羊的可能性也只有

还不及五分之一。可见,邻人空手而返,是很自然的事了!

现在我们再设想道路是这样特殊:从第二次分歧起,邻近的歧路相连通成一个新的“丫”字叉口,像下图所示那样。显然,当丢失的羊在这种特殊的歧路网上,走到第一个三叉口时,它既可能从东边,也可能从西边走入不同的两条南北走向的街。这样情形我们记为:(1,1)。接着往下有三条南北走向的街:只有一直向左转时,羊才会进入东边的那条;羊进入中间的一条街有两种可能,第一次向左而第二次向右,或第一次向右而第二次向左;只有两次都向右时,羊才能进入西边的

那条街,概括三种情形,我们记为(1,2,1)。同样分析可以得知,再接下去的四条南北走向街的情形可记为:(1,3,3,1)记号中的每一个数字,都代表到达相应街的不同的路线数。如此下去,我们可以得到一个奇妙的数字表。

这个三角形表的每行两端都是1,而且除1以外的每个数都等于它肩上两个数字的和。这是因为。它实际上表明了丢失的羊到达该数字地点的路线数,所以应等于两肩路线数的累加。

类似的数字表早在公元1261年就出现在我国数学家杨辉的著作中,所以我们称它为:“杨辉三角”。在欧洲,这种表的出现要迟上四百年,发现者就是前些节故事中提到过的法国数学家巴斯卡。因此国外常把这种表叫做“巴斯卡三角形”。

杨辉三角第n排的数字和,实际上就是《歧路亡羊》中第n次分叉后的总的歧路数,所以应当等于2n。例如,表最后一排的数字和: 1+6+15+20+15+6+1=26

为方便起见,我们把杨辉三角中第n排的除开头“1”以外的第k个数字记为Ckn。这样做的优点是,今后如若需要了解到达上述位置会有多少可能的路线时,无需思考,立即知道是Ckn条。

下面要讲的是概率论中颇为重要的课题——独立重复试验。我们很快就会看到:将要得到的结果,与杨辉三角之间的联系是很密切的。 以掷币为例。如果我们把掷币中出的正面和反面的可能,比喻成杨辉三角中向左和向右的路线,那么,杨辉三角中的第一排(1,1),就相当于掷第一枚币时出现的(正,反)可能;而第二排的(1,2,1),

就相当于重复掷两枚币时出现的(两正,一正一反,两反)可能;而第三排中的(1,3,3,1),就相当于重复掷三枚币时出现(三正,二正一反,二反一正,三反)的可能,如此等等。这样,杨辉三角中第n排各数,与掷n枚币出现的各种可能性的数目有以下对等关系。 于是,我们得出,重复n次掷币,出现k次正面或反面的概率为: 例如,掷6次币,出现三次正面的概率

式中的C36=20,是从杨辉三角表中相应位置查到的。

上面我们讲的掷币,每次出现正、反机会都是均等的。假如某事件出现的的概率是P,那么在n次试验中,该事件恰好出现k次的概率又如何呢?这只要注意到一个事实,即在杨辉三角中,任何到达“Ckn”的路线,都必须是恰好向右走k次,向左走n-k次,这里,假如我们把向右走相当于事件发生,向左走相当于事件不发生,那么,任何一条到达“Ckn”位置线路的概率均为Pk(1-P)n-k,其中(1-P)是事件不发生的概率。由本节开头的分析知道,到达“Ckn”的线路数即为Ckn,所以我们即得n次试验中,事件出现k次的概率公式: Pn(k)=Ckn·Pk(1-P)n-k

更多相关推荐:
统计学学习心得

经过这一个学期对统计学的学习,深刻地了解到统计学和我们的生活息息相关,我们每一天都会遇到大量的统计问题,无论是走在大街上还是坐在电脑前我们都会接触到大量新闻和大众媒体在统计数字上的表现,如最近炒的很热的加多宝,…

统计学个人心得

12级会计7班32120xx244谢翠欣在学习统计学之前,谈起统计我脑袋中就浮现出计数,一大堆枯燥的数字,还有一长串的数学计算式。在我眼中,统计学是一门非常枯燥非常单调的学科,它不像数学那样强调严密的推理和逻辑…

统计学专题心得体会

统计学专题心得体会经过对统计学专题的学习,我对于统计学有了更加深入的了解。统计学运用的范围十分广泛,可以说几乎每个领域都会用到统计学来作为研究工具。20xx年1-12期的《经济研究》中对统计工具有这样的概括:“…

统计学学习心得

本学期我们专业开设了《统计学原理》课程,通过近一个学期的学习我们对统计学应用领域及其类型和基本概念有了一个基本的了解,掌握了数据的收集、展示、分析的技术。但这都是些书本上的理论知识,是纸上谈兵。理论须用来指导实…

统计学心得

试验总结与心得经过了为期两天的统计学实验,主要通过EXCEL这个软件来完成这次的实验。首先掌握用EXCEL进行数据的搜集整理和显示,要求熟练运用EXCEL搜集数据,统计分组,制作统计图。这是最基础的操作,让我们…

统计学学习心得

1什么是统计学怎样理解统计学与统计数据的关系答统计学是一门收集整理显示和分析统计数据的科学统计学与统计数据存在密切关系统计学阐述的统计方法来源于对统计数据的研究目的也在于对统计数据的研究离开了统计数据统计方法以...

统计学实验心得体会

为期半个学期的统计学实验就要结束了,这段以来我们主要通过excl软件对一些数据进行处理,比如抽样分析,方差分析等。经过这段时间的学习我学到了很多,掌握了很多应用软件方面的知识,真正地学与实践相结合,加深知识掌握…

概率论与数理统计学习的感想

概率论与数理统计学习的感想概率问题是研究随机现象统计规律性的学科是近代数学的一个重要组成部分生活中概率与统计知识应用非常普遍科学家对实验统计的数据的分析企业对产品质量检查产品的市场分析人口普查有奖债券国家彩票等...

统计学科导论心得体会

统计学科导论心得体会课程名称学科导论任课教师郑珍远学生姓名学号071104107年级专业11统计20xx年11月25日统计学科导论心得体会起先对于统计学的概念可以用陌生来形容虽然很多人对统计学的了解并不深入甚至...

学习贝叶斯统计和经典统计的想法和心得

学习贝叶斯统计和经典估计理论的想法和心得在应用数理统计课程中李教授的系统讲解和耐心授课使我对应用数理统计这门课程有了一定了解特别是对于数理统计的基本概念和相关统计思想认识更加深入通过自主学习和查阅资料我对贝叶斯...

概率论与数理统计学习总结

概率论与数理统计学习报告学院学号姓名概率论与数理统计学习报告通过短短一学期的学习虽然学习研究地并不深入但该课程的每一处内容都有不同的奇妙吸引着我让我对它在生活中饰演的角色充满遐想它将我带入了一个由随机变量为桥梁...

学习概率论与数理统计感想

学习概率论与数理统计感想作者丁彦军学号1130610816班级1306108摘要概率论与数理统计是一门与生活息息相关的学科在生活中很多方面都有很广泛的应用通过本学期对于这门课程的学习我更加深刻的体会到了这一点同...

学习统计学的心得(23篇)