2010年10月27日 星期三

推論統計99.10.27

推論統計


1.目的:利用樣本的資訊來推測母群體的特性。我們通常假定此樣本為由簡單隨機抽樣的方式得到的。



2.推論統計主要的兩大工作是:母數估計和假設測定。



3.研究假設(hypothesis):針對難以清楚找到真相的研究問題,研究者認為可能的答案。
  • 東方:從實招來、有罪推論。
  • 西方:無罪推論。-假設採用的方式。























  • 第一類型錯誤:α

  • 第二類型錯誤:β
4.母群VS樣本

  • 母群(populaion):N已知或未知、推論統計。

  • 樣本(sample):N已知、描述統計。


ex :小孩的特質推論出父母的特質。

5.中央極限定律:

  中央極限定理 (Central Limit Theorem) 是機率理論及統計學中最重要且常用的結果之一。如果已知在母群體中的平均售價為50元,標準差為5元,且每次從母群體中抽取 (如:30人)做為樣本,則所獲得的平均售價抽樣分佈圖會符合下列三點特質:1. 平均售價抽樣分佈的平均值(即所有樣本之平均售價的總平均值),將會等於母群體的平均值2. 平均售價抽樣分佈標準差,是相當於母群體中的標準差除以樣本數的平方根3. 如果樣本數 n 的值越大,則平均售價抽樣分佈圖會越趨近於常態z分佈。

資料來源:http://blog.xuite.net/winfor/1/5642138

6.重要名言:

  • 王老師語錄:現象觀察是研究問題的起點,沒有研究問題就沒有研究假設,沒有研究假設就沒有研究可做。

  • 胡適:大膽假設(創意思維),小心求證。

  • 劉鶚老殘遊記:清官比貪官可怕,因清官容易導致第一類型錯誤。

Homework:假設舉例





  • 第一類型錯誤-最嚴重:冤妄好人,白白被判刑。

  • 第二類型錯誤-次嚴重:放縱壞人,收錢收到飽飽。

2010年10月20日 星期三

常態分配與心智圖99.10.20

常態分配曲線
一、常態分配曲線






















1.Z分數、T分數、智商測驗之差別在於:標準差與平均數的不同。

2.能得知個標準差監所占人數的比例。

3.常態分配:眾數=中數=平均數。


二、非常態分配之常態化

1.正偏態:眾數<中數<平均數,因平均數最為穩定,眾數最不穩定,ex愛當人的老師。

2.負偏態:眾數>中數>平均數,因平均數最為穩定,眾數最不穩定,ex美術成績。














PS:記憶法-尾巴朝向那邊。



三、變異數有:四分差、標準差、全距。
四、眾數使用時機:無次序性的資料,即為名義變項,如姓名。

五、變項的種類:


1.名義變項

所謂名義變項(nominal variable),是指利用名稱或數值來分辨人、事、物之類別的變項。例如:宗教、血型、教學方法、學生學號,及國家發展程度等都是名義變項。

2.次序變項

所謂次序變項(ordinal variable),是指可利用數值或名稱來加以排序或賦予等第的變項。次序變項雖具有多少或優劣的次序和方向性,但並不說明多少或優劣之間差異的大小量。例如,前述的操行成績就是一種次序變項,中小學畢業獎項、段考名次都算是次序變項。

3.等距變項
所謂等距變項(interval variable),是指可以賦予名稱(類別)並加以排序,而且還可計算出期間差異之大小量的變項。等距變項須具有相等單位(equal unit)這一特性;所謂相等單位,是指在差異大小量的系列上各段之基本單位的間隔應完全相等(林清山,民81)。例如,溫度、燈光照明度、喇叭的音量。
所謂等比變項(ratio variable),是指可以賦予名稱、排序,並計算出差異大小量,還可以找出某比率(倍數)等於某比率的變項。等比變項必須具備有「絕對零點」,所謂絕對零點是指沒有數量存在的點。例如年齡、身高、體重、薪資。
資料來源:周文欽,民93,研究方法 -實徵性研究取向。http://chenchunlin.blogspot.com/2008/10/assignment-ch2-4.html


------------------------------------------

心智圖(free mind)

一、用途:

 1.腦力激盪:自由聯想、限定聯想。

 2.知識結構:王泛森的"如果讓我重做一次研究生"
HomeWork:
1.聯想式心智圖























2.結構式心智圖


















3. 10句啟發的話語:

(1)誰最愛孩子,孩子就愛他,只有愛孩子的人,他才可以教育孩子。 —— 高爾基

(2)教育不是灌輸,而是點燃火焰。 —— 蘇格拉底

(3)卡爾.桑得柏:「除非先有夢,否則一切皆不成。」

(4)尼采:「一棵樹要長得更高,接受更多的光明,那麼它的根就必須更深入黑暗。」

(5)面對光明,陰影就在我們身後--海倫凱勒

(6)當你真心渴望某一樣東西,整個宇宙都會聯合起來幫助你。----牧羊少年奇幻之旅

(7)放棄者不會勝利,勝利者永不放棄。

(8)托爾斯泰:「一個人就像一個分數,他的實際才能是分子,他對自己的評價是分母。分母越大,則分數的價值越小。」

(9)雨果:「被人揭下面具是一種失敗,自己揭下面具卻是種勝利。」

(10)教育的目的,不在應該思考什麼,而是教吾人怎樣思考

2010年10月13日 星期三

標準分數99.10.13

標準分數

一、標準分數:T分數、PR值(定位出個體在團體之表現,可與其他團體中的其他數進行比較)

 1.常態分配:常態曲線最重要的特性是其形狀為左右對稱若鐘形之曲線。

  (1)曲線只有一個眾數,並與中位數及平均數是三合一的。其區線的兩尾是向兩端無限延伸。

  (2)六個標準差涵蓋99%的分布。











  (3)標準差可作為不同群體間分數的比較。

 2.魏氏智商測驗:

  (1)平均數=100

  (2)標準差=15

  (3)99%學生智商55~145間。

 3.Z分數:原分數-平均分數/標準差,顯示與平均數間的距離。

 4.PR值(百分等級):是指將某次測驗中所有考生的總分(量尺總分)排序後,依照人數均分成一百等分,該生大約會落在第幾個等分中。簡單來說,若某位考生的PR值為90,即表示該生的分數高於該次測驗中90%的考生。因此,考生成績單上PR值的高低除了會受個人成績的表現影響外,亦常會受到參與同一測驗中學生程度的高低(測驗母群體學生素質)而受到影響。

例子:98_99年兩次基測量尺總分擇優之PR值及累積人數對照表
  (1)中數:273分


  (2)正一個標準差:374分
(3)正三個標準差:405分
  (4)負一個標準差:127分















  5.T分數=z*10+50

二、心智圖Freemind


三、數位學習平台web office(http://140.126.36.91/weboffice/weboffice.php?group=undefined















1.下載joint net


2.執行















Homework:















1.(a)圖實例:壽命長短

   (1)A:高所得國家人類壽命長度。
   (2)B:全世界人類壽命長度。
   (3)C:低所得國家人類壽命長度。


2.(b)圖實例:三個國家的毎位國民之收入(三國平均收入相同)

   (1)A: 國民之收入最整齊,貧富差距小。
   (2)B:國民之收入符合常態分配。
   (3)C: 國民之收入最不整齊,貧富差距大。

2010年10月6日 星期三

變異量數99.10.06



變異量數(Measure of Variation)

1.集中量數:平均數-可能是虛擬的。
2.使用單一種集中量數,無法看出資料的差異,因此才有變異量數的產生。

3.變異量數:分散分布。

4.T檢定(t-test):使用平均數的概念

T檢定適用的條件是:
當自變項是類別變項(nominal scale),依變項是等距(interval scale)時使用。但是僅是用於自變項只有兩類的變項中,像性別便只有兩種屬性。



5.ANOVA單因子變異數分析:使用變異數的概念。


ANOVA適用的條件是,當自變項是nominal scale,依變項是interval scale時使用,但是自變項三類以上時,就不能再用t檢定了,必須改採變異數分析,這是因為t檢定一次只能比較兩類之間的差異,當自變項有三類時,若用t檢定作兩兩比較,需比較三次,由於在作統計檢定時往往會有些許的誤差,若檢定一個假設需要比較那麼多次,則誤差會增加,檢定出來的結果較不準確,因此需改採ANOVA。




6.標準差(standard deviation, SD):平均數間的距離平方後轉換成面積相加後,每人平分而得。



簡單來說,標準差是一組數值自平均值分散開來的程度的一種測量觀念。一個較大的標準差,代表大部分的數值和其平均值之間差異較大;一個較小的標準差,代表這些數值較接近平均值。例如,兩組數的集合 {0, 5, 9, 14} 和 {5, 6, 8, 9} 其平均值都是 7 ,但第二個集合具有較小的標準差。
資料來源:http://zh.wikipedia.org/zh-tw/%E6%A8%99%E6%BA%96%E5%B7%AE


7.全距:

ω=XH-XL
其中的ω為全距,XH為最大值,XL為最小值

全距(Range),又稱極差,是用來表示統計資料中的變異量數(measures of variation),其最大值與最小值之間的差距;即最大值減最小值後所得之數據。
資料來源:http://zh.wikipedia.org/zh-tw/%E5%85%A8%E8%B7%9D


實作練習

8.母群:數目可能是已知或未知,經抽樣稱為樣本,稱為推論統計。

9.樣本:數目已知,樣本至少30人,稱為敘述統計。


實例:台灣25縣市總體閱讀競爭力大調查

29日公佈的閱讀大調查,是遠見雜誌民意調查中心在2010年7月26日至7月28日,針對居住在台灣地區、年滿18歲的民眾,進行電話訪問,樣本規模共1079人,信賴水準為95%時,抽樣誤差的理論值暨最大值為±3.0%。

資料來源:http://tw.news.yahoo.com/article/url/d/a/100929/17/2dzx7.html

10.常態分配(Normal distribution)

  在常態分佈中,此範圍所佔比率為全部數值之68%。根據常態分佈,兩個標準差之內(藍,棕)的比率合起來為95%。根據常態分佈,三個標準差之內(深藍,橙,黃)的比率合起來為99%。


11.六個標準差


  「六個標準差(Six Sigma)」是一個品質改善目標的代號,源自統計製程管制(Statistical Process Control,簡稱SPC)的理論。簡單的說,就是每生產一百萬個產品,其不良品不能超過四個。過去只有航空運輸業才有這麼高而近乎完美的品質管制要求,一般製造業或服務業大概可以做到每生產一百萬個產品或提供一百萬次服務時,不良品個數或是出錯次數控制在六千到二萬三千之間,相當於「三個半到四個標準差」。
每次製程上發生不良品,就已經造成成本與時間的浪費,將其修復又要再投入成本與時間,所以不良品出現的次數影響公司的營運績效甚鉅。「六個標準差」是顧客導向的持續品質改善策略,改善範圍包括產品的設計與製造,以及管理作業。任何作業過程只要有改善機會,就貫徹「六個標準差」策略,使不良率將低到百萬分之三或四以下。 因此也有學者把追求「六個標準差」品管目標定義為在製程初期即發現瑕疵點並加以改善的商業過程(Business Process)。

資料來源:http://web.ed.ntnu.edu.tw/~minfei/artical/sixsigma.pdf

12.心智圖



心智圖是由英國的托尼·博贊(托尼·布詹)於1970年代提出的一種輔助思考工具。心智圖通過在平面上的一個主題出發畫出相關聯的對象,像一個心臟及其周邊的血管圖,故稱為「心智圖」。由於這種表現方式和人思考時的空間想像比單純的文本更加接近,已經越來越為大家用於創造性思維過程中。



心智圖,又稱腦圖、思維導圖、靈感觸發圖、概念地圖或思維地圖,是一種圖像式思維的工具與及一種利用圖像式思考輔助工具來表達思維的工具。
心智圖是使用一個中央關鍵詞或想法引起形象化的構造和分類的想法; 它用一個中央關鍵詞或想法以輻射線形連接所有的代表字詞、想法、任務或其它關聯項目的圖解方式。它可以利用不同的方式去表現人們的想法,如引題式,可見形象化式,建構系統式和分類式。它是普遍地用作在研究、組織、解決問題和政策制定中。
心智圖是一張集中了所有關連資訊的語義網路或認知體系圖像。所有關連資訊都是被輻射線形及非線性圖解方式接連在一起,以頭腦風暴(激發靈感)方法為本去建立一個適當或相關的概念性組織任務框架。但頭腦風暴(激發靈感)方法,語義網路 或 認知體系是沒有一個既定製式鏈去互相連接使用,亦即是可以自由相連接使用的。元素是直覺地以概念的重要性而被安排及組織入分組、分支,或區域中。會集知識方法是能夠支援現有的記憶,去思考語義的結構資訊。


13.Freemind


FreeMind是一款跨平台的、基於GPL協議的自由軟體,用Java編寫,是一個用來繪製思維導圖的軟體。其產生的文件格式後綴為.mm 。可用來做筆記,腦圖記錄,腦力激盪等。


資料來源:http://zh.wikipedia.org/zh-tw/FreeMind