|
發表於 2013-6-6 07:59:40
|
顯示全部樓層
Topvision 發表於 2013-6-5 13:31 
看後意見總有, 想法是筆者有意混淆視聽, 居心不良?!
第一段, 加入筆者主觀差測. 第一句便是"中共政權不堪 ...
在統計學的學說裡,600-1000個sample是足夠的(600是最少,1000會比較好),這是統計學家經過反覆研究得出來的結論。[上面其餘幾位師兄不妨撥冗來捧一捧場,聽吓佛仔發'口翕'瘋 ]
讓在下舉一個數學化一點的例子,政府若果想查吓港人薪金數字的分佈(在這個龐大的POPULATION裡,這種分佈是平均分佈的,另一個名稱大家可能也聽過,bell-shaped distribution) 平均分佈是兩邊的較少,中間的較多,所以呈現一個"鐘狀"的分佈。
於是在社會裡隨機(這是必需的)抽樣訪問600-1000人,得到數據之後當然唔係簡簡單單地加埋除受訪人數,就將嗰個數當平均數咁簡單喇,統計學者要用一種叫做sampling的方法去處理數據,呢一 part 就係戲肉,在下唔知用文字可否表達到當中的意思(要在這裡要打統計學裡的符號比打文字還要難,而且學這些已是上一個千禧世紀之前的事 ),讓在下一試吧。
學者從這600個數據中,先隨機抽第一組30個出來,這30個數據本身可以計出一個平均值(sample mean_01),重複這個做法,便會得到 sample mean_02,sample mean_03,sample mean_04,.......sample mean_50,sample mean_51,.......sample mean_100,sample mean_101........(generate 出來的這組新的分佈樣本是可以大過600這個數字的)
這一組新的數據本是已經係一個新的分佈圖,而這個分佈圖與未經處理的分佈圖的分別是經過sampling處理的數據是更能呈現總POPULATION的分佈情況的。
此話何解?在最初的600 個受訪者當中,可能有(舉例)3個人收入=0,但經過處理後的數據,大家可以看出就算以當中最極端、最低收入的三十個樣本來計算,其平均值都會是大過0的,從呢個趨勢大家可以看到處理後得的樣本分佈會集中返向中間,而這一組sampling mean的平均數,理論上是足以反映出整體環境的平均薪金的。
大致上係咁,但在下對統計學只懂皮毛,而且也是陳年舊野,希望這裡有真的行家高手,不介意出來指正教導,佛仔先行在此謝過。 |
|