2016年9月11日 星期日

三十六、政府也失智


36. 根據台灣失智流行病學調查,2011~2013 年間,非五都(含桃園市)失智症盛行率為
1.403%,較五都的 0.657%高出 2 倍多。台灣失智症協會理事、長 X 醫院失智症中心主任徐 X 俊分析,主因為教育程度的差別。徐 X 俊解釋,在教育方面,非五都地區受教育年限低於五都,除了義務教育後,更強調的是在社會環境中再進修及終身學習,讓大腦保持不斷學習刺激,同時也要生活正常及飲食均衡。在五都人口之年齡的眾數落在 31 至 35 歲這一區段、中位數約為 36 歲、平均數約為 38 歲,而非五都則眾數落在 46 至 50 歲的區段、中位數約為 45 歲、平均數約為 44 歲。由這些資料徐 X 俊呼籲三組總統候選人,一定要加強非五都的年長者再進修與終身教育。以有效減少失智人口,也減少年輕一代的照護壓力。
(本文改自各項資料,部分數據、機構、人名是不完全正確的)

A1 文中資料只能說明失智症與教育程度頗為相關,卻不能拿來推論「加強教育」就能「減少失智人口」的因果關係。上缺乏證據指出,失智即是因為缺乏教育所引起的後果。

A2 又,兩組的眾數皆是落在中壯年,並非老年人口,實在不應和年長者再進修與終身教育扯上關係。

B1 忠實呈現資料。

三十五、文章還是短的好?

35. 網路易用性專家,也是認知心理學家老莊博士,為了驗證在電腦螢幕上閱讀短文較長文
容易理解的想法。設計了以下的實驗:老莊博士在高雄市及屏東縣政府之網站中找到 10 篇
各觀光地簡介的文章,每一篇字數均少於 200 字,作為短文材料。另外也在此兩政府網站法規彙編中找到 10 篇法律條文,每一篇字數均超過 1,000 字,作為長文材料。他在某一大學一年級中找了 70 位學生為實驗參與者,每一個實驗參與者以隨機的順序閱讀這 20 篇文章。老莊博士操弄的獨變項為同音之錯別字,每一篇文章中有 5%的錯別字。實驗參與者的作業就是找到電腦螢幕呈現的文章中找到錯別字用滑鼠點選。實驗參與者在可以自由調整自己閱讀的時間與每篇文章間休息時間,但看完每一篇後就不能再看同一篇文章。結果發現短文中平均找到 92.3%的錯別字,在長文中只找到 57.2%的錯別字。差異已達統計上之顯著,故老莊博士宣稱電腦螢幕上不宣呈現太長的文章,否則讀者不會用心閱讀。

A1 大於一個獨變項。兩組之間的差異除了文章長短之外,還有文本類別之不同。導致我們無法確定依變項「找到錯別字的%數」的差異,是哪一個或兩個獨變項的效果。

B1 因主要要探討的是文章長短對「找到錯別字的%數」的差異,因此建議選擇同一類別的文本。

三十四、當減肥者都白吃膩

34. 超覺冥想可以減肥
超覺冥想大師阿德師,發明冥想減肥法。他為了應證,找來 20 名自願者參加為期三週的超
覺冥想減肥課程。他們先學習一天的冥想課程,之後回家每天配合阿德特配之有機素食套餐,在每天三餐前十分鐘進行冥想。結果這 20 位平均減重 4.3Kg,最多的人減了 11.2Kg,所以阿德師宣稱實驗成功,也證實超覺冥想是可以減肥的!

A1 缺乏控制組。此實驗法的獨變項冥想,依變項減肥,所有實驗者皆搭配三週課程與素食
     套餐,無法直接釐清受試者減重為冥想所為,抑或熱量攝取下降導致體重減輕。
B1 增加控制組。將20名自願受試者隨機分派為兩組,實驗組在進食前進行冥想10分鐘,

     另一組則為控制組,進食前不進行冥想課程。其三週過程續觀察體重變化。

三十三、馬雲哩賣鬧

33. 阿里巴巴集團共同創辦人馬雲今在中國浙江烏鎮的世界網際網路大會上強調管制網路的
重要性。馬雲表示,阿里巴巴、百度和騰訊等世界級企業都來自中國,這顯示中國管制網路
並未扼殺創新。他更進一步說:「很多外國人跟我說,中國對網路的管制可能太嚴格,但我
認為無論如何,中國還是創造 7 億的上網人口。其實外國應該學習中國的網路管制,才能有
更多創新與增加網路人口!」
改自:

A1 無因果關聯。文中提及網路管制使中國的入口網站使用人數佔7億人口,其人口使用無法
    得知抽樣調查入口網站之目的為公事所用還是激盪創新,僅能看出瀏覽次數,不能單就
    上述推斷其他國家學習網路管制即可激盪國民創新。
A2 取樣誤差。中國網路管制,故使用資源有限,國民取得入口網站便利性較他國侷限,
    且中國人口為世界第二大國(近14億),集中資料使用總量為7億,無法直接斷定普遍人口
    皆有使用。
B1 更改結論。抽樣調查結果,僅能看出網路管制在大宗入口網路使用流量人數之關聯性。
B2 更改為分層抽樣調查,設計使用人數目的與年齡層,可減少重複抽樣誤差。再將數據與
     他國比較。

三十二、唐 X 琪豪準阿

32. 小明從星座專家唐 X 琪新書「星座別交友秘笈」上發現獅子座的小明與射手座的成為好
友程度是最高的,然後他發現他在臉書的好友(總共 370 人)中射手座果然是最多(35 人),小明再次確認唐 X 琪真準啊。(本題改自是王議賢老師的題目)
A1 小明的網路交友名單總人數為370人,其12星座平均人數分配約31人。小明的射手座
     朋友為35位,僅多出四人,在統計學上無明顯顯著,此現象可能為單一偶遇事件。
A2 巴南效應。小明閱讀星座書可能出現自我選擇性相信,再對照現實的網路交友狀態,
    兩者皆為符合,即認為星座書的推測是準確的。
B1 更改結論。此上述僅能看出星座交友的關聯性,無法推論唐X淇老師推測皆為準確。



三十一、用現在算未來是假設地球沒在轉ㄇ

31. 前途茫茫的心理系大四學生小蔡,今天看到一則新聞:「行政院首度公布大數據分析大
專院校畢業生就業薪資結果,大學畢業生起薪 25K,而非僅有 22K。數據也顯示,若投身最
熱門的電子業,博士畢業第 4 年平均月薪有 14.1 萬元,是學士的 3.5 倍。」。於是小蔡決
定碩士改唸電子相關科系且一路唸到博士。小蔡查了相關資料,電子相關科系碩士到博士畢
業最快只要五年,再加畢業後 4 年,也就是他到三十一歲就可以有月薪 14.1 萬元。小蔡認
為這樣他的收入一定超過同班同學!所以馬上去報名補習班了!!

A1 調查性研究無法推論因果。新聞調查數據中,電子業抽樣眾數較平均起薪高,求職背景
     與條件不同,可能平均落點在14萬上下,但樣本中也有可能因極高、極低薪資造成平均
     數誤差。故無法直接使用平均數比較代表整體月薪,推論起薪階層電子業博士必然較其
     他行業學士倍數成長。
A2 數據研究為當時的資料整合所現,無法細究職位所需賦予的責任與公司制度,故即使小
     蔡攻讀博士,起薪與畢業後四年的薪水也非必然同於數據研究。

B1 更改推論。此數據調查,僅能了解學歷與求職起薪之關聯性。

三十、新聞都降亂牽拖

30. 日本讀賣新聞社大規模調查發現,家戶年收入不到 200 萬日幣的低收入戶成員,相較於家戶年收入超過 600 萬日幣的高收入戶成員,抽煙人數高 1.5 倍,三高(高血壓、高血脂、 高血糖)的機會也高 2.3 倍。由此結果政策分析人士表示,政府應提高對低收入戶的現金補 助,以促進全民健康!

A1 調查性研究無法推論因果。此份研究藉由觀察收入高低對於罹患疾病與抽煙的影響,其
    疾病與抽煙的誘因眾多,撇除收入下降導致的壓力,還是有可能罹患疾病,故此項調查
   無法直接推論增加收入可能促進全民健康。

B1更改結論。大規模調查數據,僅能看出收入高低與抽煙、罹患三高之間的相關,非能推論因果。

二十九、千錯萬錯都是都是頂X的錯

29. 台灣腸癌發生率全球最高,10 歲孩子也無法悻免。高醫附設醫院收治一名 10 歲男童,因 解不出大便就醫,檢查竟發現有顆如乒乓球大的惡性腫瘤塞住大腸,為罹患第三期腸癌。雖 經手術切掉 25 公分腸道與腫瘤,男童仍因癌細胞擴散,還在進行化療,這也是國內被報告 年齡最小的腸癌患者。大腸直腸外科醫學會理事長、高雄長庚醫院大腸直腸科醫師陳鴻華指, 國內近來有許多黑心油與食品,一遇誘癌因子,即發生癌病變。由此學會發表新聞稿,一定 掃除黑心油、黑心食品,才能讓大腸癌消失。
(自:http://www.appledaily.com.tw/realtimenews/article/hot/20151206/747212/ 新 聞)

A1 此新聞報導為觀察性研究。無操弄變項,大腸癌即使無食入黑心商品,還是有可能發生,故無法由觀察數據直接推論大腸癌是由食入黑心商品所導致的。
A2 單一醫師的看診人數可能出現區域性樣本偏誤,無法經由此歸因推論母群。
B1 更改結論。由觀察報導中,僅能看出黑心油、黑心商品可能與罹患大腸癌有關聯。
B2 食用油與黑心食品對於人體的影響度,在無進行人體實驗下,可藉由大型資料庫細究,
     分析可能導致的原因。

二十八、要不要這麼腦

28. 諮商心理學家邱 X 林認為訓練右腦有助於學習英文單字。他設計一個實驗如下:找到未曾接觸英文的小學一年級學生十名,個別請到其右腦開發實驗室。每一位小朋友,先接受左腦條件,即英文單字依序出現在右視野,訊息經視交叉到左大腦,接受了 10 個國中一年級程度的後立即請小朋友在 A4 紙上 50 個單字中挑選剛看到的 10 個單字。再休息 10 分鐘後接受右腦條件,即英文單字依序出現在左視野,訊息經視交叉到右大腦,也接受同樣的 10 個 單字,看完後也從 50 個單字中挑選所看到的。結果,右腦條件正確 9.5 個,左腦條件只正確 4.6 個。據此邱 X 林主張英文課本要放在左視野,讓右腦來學習!!

A1 練習效應。實驗操弄不同視野接受相同英文單字,過程後者可能出現因重複練習導致答題
    正確率上升,無法直接推論右腦學習力較優於左腦。

A2大腦腦區的學習、記憶位置由視野進入腦區後,由大腦網絡相互連結,非獨立作業。測試孩童非分腦人,故無法直接由操弄英文單字推論左視野學習較為優勢。

B1前後測試的單字,應為50個單字中隨機挑選,降低練習效應所導致的偏誤。

B2改變推論:實驗結果僅能了解學習、記憶在左、右大腦學習之關聯強度,無法直接定論。

二十七、讚嘆馬主席

27. 社會心理學家小滿想在課堂中複作認知失調實驗,就在社會心理學的課程中請全班同學寫一篇讚美馬習會的短文,並給予他們全家小杯美式咖啡兌換卷為獎勵。課後再請他們填自創之統獨傾向量表,發現全班平均仍傾向支持臺灣獨立,小滿認為學生態度並沒有改變。故 小滿宣稱經過半世紀認知失調理論已經沒有用了!! (以上情節若有雷同之處純屬意外,與現存任何人無關!!)

A1缺乏前測。認知失調理論為口是心非,當情境可自由選擇,人為了促使內(態度)、外
   (行為)一致,而做出違反態度的行為。實驗中為先收集統獨傾向基準值,無法明確得知,最
   後全班平均傾向台灣獨立,來自於實驗導致態度改變,還是根本意願。

A2缺乏控制組。此研究設計獨變項(IV)為咖啡獎勵卷,依變項(DV)為統獨的傾向。有操弄變因
    ,但未設立對照組,無法直接推論態度改變為獎勵操弄所導致。

B1實驗前先預測統獨傾向,在與實驗操弄後數值對照。

B2採2x2多因子設計。變項一為支持統獨、不支持統獨,變項二為有咖啡兌換卷、無咖啡兌換

    卷。

二十六、皮膚炎就穿衣服?

26. 資深皮膚科名醫蕭 XX,根據他看診多年的經驗提出過敏性皮膚炎是由氣溫下降而引起的 理論。最近一波波寒流來襲,氣溫越來越低,到他診所看過敏性皮膚炎的患者也越來越多。 由此蕭醫生宣稱他的理論再次被證實,也呼籲有過敏性皮膚炎病史的人要注意保暖,以免讓 你的皮膚又發炎。

A1無法直接推論。蕭醫師的看診經驗為觀察性研究,無介入處置,氣溫偏低可能為皮膚發炎
    的疑似原因之一,無法直接證實氣溫與過敏之間的關聯性。

B1 更改結論。可以敘述過敏性皮膚炎可能與氣溫變化有關聯,若要細究主要原因,需尚待研

     究。

二十五、安西教練做研究

25. 一實驗心理學者與籃球教練決定共同研究運動學習的知識與視覺迴饋對籃球隊選手與大學生的影響。在實驗中實驗參與者投擲飛鏢至飛鏢板。在其中一種條件中,當飛鏢一離開實驗參與者之手燈光隨即關掉,故實驗參與者無法看到他投擲的結果。在另 一種條件中燈光始終開著。事後實驗參與者接受一相當長的問卷來檢驗其動作知覺之知識。無論在有迴饋或無迴饋的情形下,運動員均較大學生為優,但他們在問卷上表 現較差。兩組在有迴饋之情形下均較無迴饋的情形為佳,且交互作用不顯著。實驗者結論:動作技巧不能由動作知覺之知識增進,但可以由動作結果之知覺來促進。 此結論是否有瑕疵?瑕疵在那裡?   [可參考學姊網頁的第2題]
A1 樣本個別差異大。因為籃球選手的動作技巧本來就比大學生的好,而大學生在動作知覺上
    的知識也應比籃球選手好,所以兩者在兩方面的比較上各佔擅場,不能比較。

A2 籃球選手投籃與投擲飛鏢皆有拋丟的技巧,遷移效應可能導致於籃球選手的表現比一般
    大學生佳。
A3 缺乏前測了解籃球員與一般大學生對於運動知覺的背景知識,事後檢驗結果無法從中比
     較。
B1 更改為2x2多因子設計。變項一為大學生、籃球員,變項二為有回饋、無回饋,可平衡組
     內混淆變項。
B2 設計前測了解兩組人員對於運動知覺的程度,實驗操弄後再進行事後檢驗。

二十四、外遇94業力引爆

24. 一位心理學家發現在烏克蘭車諾比(Chernobyl)地區在核電廠災變之後,在遭到輻射塵汙染的民眾的婚外性行為明顯增加。據他訪問發現有些人在災後恣意放蕩,有些人有奇異的性活動。該心理學家由此結論,在輻射塵中可能有一新型的春藥。因此申請一研究經費,利用老鼠檢驗此假設。[可參考學姊網頁的第11題]
A1 此研究為調查法,觀察核電災害後居民的婚外性行為。行為可能因創傷後壓力症候
   群或其他心理因素影響,無法直接推論輻射塵中含有新型春藥使居民性行為增加。
B1 更改推論。調查法僅能觀察欲觀察項目之間的相關性,需作進一步深入探討或心理
    分析才能了解其原因,故此事件僅能看出災變與婚外性行為之間的相關。
A2 單就單一地區居民的生活型態與行為,無法類化至其他群體。

B2 採橫斷性研究,比較同一時段其他災害地區居民,經歷災變後的行為有無差異。

二十三、喂您好民調喔

23. 一位研究者被要求快速調查三個大城市中選民所關心的政治議題或問題。 該調查的結果要提供給候選人作為競選活動之依據。研究者由電話簿中隨機選出人名,並盡可能在星期一至星期五之上午九點至下午五點之打電話給他們。這結果經 整理並呈現給候選人,為一有效代表這三個城市選民的態度。[可參考學姊網頁的第10題]
A1抽樣誤差。電話訪談時段為每日的平時上班時間,容易導致受訪者為家庭主婦、老
    年人、待業中人口,無法直接代表全市民之意見。
B1更改為分層隨機抽樣。訪談時間設定為早上、下午、晚上各一時段電話訪問,可平

    衡人口混淆變項。

二十二、男生比較有創意?

22. 某一位實驗者想要檢驗男性比女性更有創造性的假設。她同時假設男性的創造性在有自我投入時更高。於是利用 2X2 之多因子設計,其中一因子為性別,另一因子為自我投入程度。她利用以 下的方式操弄自我投入程度:在一半的實驗參與者被告知這個作業是測量智力且他們的結果會公布在公布欄中(高自我投入)。另一半的實驗參與者被告知這個作業是考驗她 所發展的測驗之信度且為不記名的測驗(低自我投入)。創造力測驗是「非平常用途」測驗,即給一個物體名稱後(例如:鐵槌)在五分鐘中內盡可能寫出該物體的 各種不一樣的非平常用途。兩個不同的自我投入組各有 25 位男性與 25 位女性參加。男性實驗參與者來自預備軍官訓練班(ROTC)高年級學生,女性來自女學生聯誼會。在實驗中共使用了兩個物體:1. 軍用羅盤;2. 活動板手。實驗參與者對每一個物體給 5 分鐘。結果指出:男性在低自我投入情形下對每一物體平均列出 4.1 種非平常用途,在高自我投入時則 7.6 種;女性在低自我投入時為 3.2 種,高自我投入時為 2.4 種。兩種主要效果與交互作用均顯著,實驗者宣稱她的假設受到支持。
A1 抽樣偏誤。此實驗法為多因子設計,探討性別、自我投入兩變項對於創造性的影響
   。樣本群為軍校學生與聯誼會女性,無隨機取樣,所給予的非平常用途測試為軍用
    羅盤與板手,容易因軍校男性對於測試項目熟悉導致回答用途時答題數較高。
B1 維持多因子設計,樣本採隨機抽樣,可平衡受試者變項。
A2 自我投入操弄為有/無公告測驗分數,設定為高自我投入組答題率較高,受試者可
    能想要符合實驗者的期待,交互作用結果可能使表現行為較為自由施測(低投入組)
    專注,回答題數偏高,故就此實驗難直接推論自我投入高時,創造力較高。     
B2 此研究結果僅能看出自我投入程度與回答測驗題數間的關係,無法直接推論創造力

    高低。

二十一、到底準不準

21. 某一臨床研究者設計實驗要檢驗,對病患的面談或客觀化的測驗何者對診斷及預測住院時間有效。這個實驗在大型精神科醫院。在其中一組中有 10 個臨床心理學學生,每一個人面談 6 個初來醫院的病患,每次兩小時。另一組中 60 個病患給于標準化的心理測驗,而測驗結果由三位資深臨床心理學家來解釋,他們都有多年解釋經驗。每位臨床心理學家解 20 個病患。每一組均被要求列出病患之主要問題,並將歸入診斷分類中(例如:進行性思覺失調,倒退性思覺失調)。他們同時被要求預測病患之痊癒出院時間。結果指出,面談在分類上有 67% 之準確性,住院時間上有 22% 之準確性。測驗則在分類上有 83% 之準確性,住院時間上有 65% 之準確性。實驗者結論,面談無論對診斷分類或預測醫院支出均有不確定性,認為不應繼續使用。   [可參考學姐網頁的第1題]
A1 兩組診斷與預測人員不同。此實驗分組,一組診斷為三位資深心理師進行解釋,另
     一組則無特定資深人員,進行預測。臨床經驗的累積較易精準判斷病人的病情,
    預測準確度較高,此干擾變項會影響兩組測試的正確率。
A2  收集資料時,臨床心理學學生若無法辨識行為異常、病人對於實習生的不信任感
    ,皆會影響資料收集的完整性及後續診斷預測率。
A3  臨床心理師與實習生可能產生交互作用。
B1 更改實驗設計。更換為2X2多因子設計。

B2 將臨床心理師與實習學生分開,分別對病人執行測驗與面談,觀察此準確性。

2016年5月2日 星期一

二十、蜜月已結束

20. 某一心理學家有一理論認為:當一團體中成員間愈來愈熟習則其團體的生 產力將提高,但提高至某一程度之後下降一些。這下降(「蜜月已結束」效應)開始於成員間停止高度合作狀態,轉變成相互排擠狀態所造成。為了檢驗此一理論, 這個心理學家組成成員間相互不認識的團體,並要他們完成一系列的作業。總共有五個作業,每一個作業需時 35 分鐘完成,在兩個作業間並加入 5 分鐘之休息。他的結果指出,團體的生產力直到第五個作業之前一直上昇,但在第五個作業中明顯下降。由此證據他宣稱他的理論受到支持。[可參考學姊網頁的第15題]
A1 缺乏控制組。此實驗設定僅安排不認識團體,無設定相互認識團體作為對照比較,
     無法直接推論蜜月效應。
B1 新增控制組。設定一組相互認識組,可排除熟識間影響行為的干擾變項。
A1 出現練習效應。實驗指派了團體五組作業,每組的作業時間逐漸拉長,但休息時間
     卻無延長,可能導致受試者因疲勞以致表現變差。

B2 控制作業時間,減少疲勞效果影響實驗結果。

十九、不要當律師?

19. 一位心理學家想要發展可以預測未來成功律師之測驗。她從 Who's Who 隨機抽出一群律師,因為她假定其中必為成功的律師。然後寄給這些律師 包含有數百項題目的問卷。她分析回收的問卷,並據此描繪出成功律師之特徵輪廓。然後將這問卷給一群將以律師為職業之學生。發現些學生之分數與成功律師之特 徵輪廓之間有明顯的差異,由此建議學生不要從事法律方面之職業。[可參考學姊網頁的第24題]

A1 個人特質並非永久不變。此份研究為相關性研究,設定問卷特性預測是否能在未來
     成為成功的律師,但因優良工作表現的特質與學生時代的特性可能隨年紀與經歷
     改變,故無法直接預測或推論,問卷不符假定時,在從事法律相關工作時表現較
     佳。
A2 更改假設。維持隨機抽樣,進行學生時期的個人特質、優秀律師的特質間比較配對
B1 採單一時期研究,無介入操弄,每位優秀律師的屬性(成功輪廓)受社會文化因素(就
    業重大經驗或社會價值觀)影響。

B2 更改為縱貫性調查,了解成長經驗與文化因素對於成功輪廓培養的影響。

2016年4月25日 星期一

十八、YMCA有效否

18. 在小鎮中之一 YMCA 人員想要獲得一些證據證明他的領導人員訓練課程是有效的。於是尋找 20 年前該課程之成員名單中較活躍的男生的名單,同時也找到未參加 YMCA 的男生的名單。他比較這兩組的現在的職位、薪水等等,發現參加 YMCA 這一組比另一組好很多。因此結論,這些差異是受到他的課程的影響。[可參考學姊網頁的第19題]
A1 兩組受試者篩選條件的設定,會使得兩組受試者之間,在「參與動機」上有顯著差異。造成多於一個獨變項的情況(有無動機、有無實際參加)。

A2訓練課程無法直接推論20年後的職位、薪水與課程呈正比,較活躍的男生可能在工
 作表現較為積極、進階,薪水可能與工作成就與考績累積結果,無法直接與課程受
 訓做連結。
B1 改變抽樣方式:採立意取樣,找20年前同樣參加過YMCA課程的受試者,將特質分
     有參與領導課程組&參與其他課程組,分析現在的工作表現、薪水與職位。

十七、賞還是罰?


17. 第二次世界大戰期間,某位研究者試圖檢驗,訓練人員時處罰較獎賞為有效的假設。檢驗此假設的作業是辨認飛機敵我之工作。她要求實驗參與者坐在雷達螢幕之前,在螢幕上敵機與我機以陰影方式快速閃過(約 1 秒)。當陰影閃過時實驗參與者要在其前面兩個按鍵「敵機」或「我機」來反應。每一位實驗參與者接受連續五天每天兩小時的實驗。在第一天,每一嘗試之後實驗參與者均被告知有無正確辨認。自第二天開始實驗參與者被隨機分派到兩組。 A 組的實驗參與者在正確辨認時可以獲得 10 cents 之酬賞,但在錯誤的辨認時不受任何之處罰。在 B 組的實驗參與者在每一次錯誤的辨認時受時電擊的懲罰,但在正確辨認時未獲得任何獎賞。如此之程序在第三天與第四天中持續進行。在第五天實驗參與者亦接受辨認之作業但不給于獎賞、懲罰或任何訊息。在 100 個陰影中正確辨認的次數為訓練之有效度。如所預期,在五天的訓練期當中有些實驗參與者流失:在 A 組中約 5%,在 B 組約 35%的實驗參與者在五天之內流失。結果顯示在第五天的 100 次嘗試中, A 組之平均正確辨認次數為 80 , B 組平均正確辨認次數為 92 。這兩組平均數之間的差異統計上顯著。實驗者結論假設獲得確認,並建議所有訓練課程應利用懲罰的方式。
A1 研究目的是要辨明哪一種教學方式更能「有效學習」。有效學習的概念至少應包含「持續學習」與「正確辨認」。因此實驗本身須將流失的參與者(終止學習的人)也考慮進去,不能只看最後有留下來的(持續學習的人)。
B1 忠實地將流失比率報告,並客觀陳述:懲罰教學方式所流失的比率高出30%,但正確辨認次數則高出12次。

2016年4月11日 星期一

十六、老鼠跑迷津

16. 有一假設宣稱感覺剝奪會抑制動物智力的發展。要檢驗此一假設,實驗者利用兩隻老鼠,這兩隻老鼠各剛生出 8 隻小老鼠。其中一隻母鼠與其小鼠放在一個大籠子中,有足夠的空間與物體供其探索。另一隻母鼠之小老鼠則與母鼠分開,並將每一隻小老鼠單獨放在很小的籠中,只能看或聽四面牆與餵食器的影像及聲音。在五個月後,兩組均以食物為酬賞學習多分叉之 T 形迷津。經過 20 次之嘗試之後,所有沒被剝奪的小老鼠都能無錯誤地跑完迷津,但被剝奪的小老鼠仍有許多錯誤發生。後者,甚至常發生僵硬停頓的現象,需要戳動才會移動。故實驗者結論,感覺剝奪會阻礙智力發展,例如被剝奪的老鼠無法利用能去學習一簡單的迷津。[可參考學姊網頁的第7題]

A1  多於一個獨變項。研究者想了解感覺剝奪對發展的影響,卻同時操弄小鼠是否有
     母鼠陪伴。此情況下小鼠可能因為脫離母鼠出現分離焦慮使迷津行為表現變差,
     故無法推斷依變項學習能力下降是來自於哪一個獨變項。
B1 若感覺操弄實驗組非得將小鼠單獨安置,則控制組的小鼠也應該要單獨安置。
A1 兩組老鼠分別為不同母鼠所生,無法排出基因遺傳之變項,可能影響實驗結果。
B1 控制基因變項。將實驗老鼠源自於同一母鼠所生,並分成兩組,排除遺傳變項干

     擾。

十五、Wintermin的治療效果

15. 在一檢驗精神藥物 chlorpromazine 對於思覺失調症的效果時,兩位臨床研究者從精神科醫院中隨機選擇 20 個急性思覺失調裂症患者。這些病患被要求作依刺激之某一向度之特性排順序的作業,例如依重量之不同將 8 個物體排列。病患被要求作各種不同的排列作業。研究者利用受試者內之設計,首先給所有的病患注射生理食鹽水(白藥)後進行排序作業,在休息幾小時後再注射 chlorpromazine 並進行所有剛才之作業。結果指出,當注射 chlorpromazine 之後的錯誤較少,此結果暗示研究者,這一種藥物對於這一類病患之適當之認知功能的促進有正面效果。
A1 練習效果。此實驗設計為受試者內設計,先注射生理食鹽水(白藥)後再注射
    Wintermin,並進行相同排序作用。測驗方式因為同一組試驗,受試者可能因為重
    複練習使後者測試效果更好,故無法直接推論認知功能增進效果為藥物導致。
B1 更改實驗設計。改為受試者間設計,將思覺失調症的患者隨機分成三組,
     wintermin藥物組、生理食鹽水(白藥)控制組、控制組,觀察藥物注射後對於認知

     排序作業的表現,可排除練習效應。

2016年4月4日 星期一

十四、統計怎麼教


14. 某位統計老師想要比較兩種初級統計的教學方法。其中一種方法是著重在 理論教學方面(稱為理論法)。另一種為教導學生各種統計考驗方法,並解釋在什麼時機應用該統計方法(稱為食譜法)。該老師將理論法應用在一流的工學院之所 有初級統計課;將食譜法應用在洲立師院之所有初級統計課上。在學期結束時該教師利用標準化之統計測驗施測這兩組班級。結果發現,接受理論法之班級表現遠優 於食譜法教學之班級。故該老師結論,理論法是比較好的教學方法,並認為統計老師應該用此法。[可參考學姊網頁的第20題]

A1 超過一個獨變項的實驗設計。獨變項有「教學方法」以及「學生班級」,且兩組「學生班級」之間明顯有學業成績差異,可能會學習產生影響。此時,無法果斷地推論依變項「學習成效(班級表現)」的差異單單來自於「教學方法」。

B1 顯然「學生班級」不是我們所重視的干擾,「學業成績」才是。因此建議除了平衡「學生班級」,也要平衡「學業成績」。建議可以在取兩個學業成績沒有顯著差異的班級來做研究。

十三、糖果香菸惹的禍


13. 最近在報紙上一篇文章宣稱「糖果香煙影響小孩」,該報導指出買過糖果香煙的孩較沒有買過的小孩往後更可能吸煙。這個調查指出,在 7 年級的學生中,曾經買過兩次以上糖果香煙者較沒有購買過者更可能去嘗試真正的香煙。因為此結果相當清楚,故學校行政單位想要禁止在校販賣糖果香煙,因為他們認為糖果香煙導致孩子抽煙。這個調查同時指出若父母任何一方有抽煙,小孩更傾向於購買糖果香煙,且在各種場合下企圖抽煙。學校行政單位的作法正當嗎? [可參考學姊網頁的第25題]

A1 無論是「父母抽菸」和「購買果香菸的行為」之間的相關,或是「購買糖果香菸的行為」和「嘗試真正香菸」之間的相關。若要推論成因果,必須先支持兩者之間有先因後果的時序,由此研究中無法推論出這個結果。

B1 將推論改為,「父母抽菸」和「購買果香菸的行為」之間具有相關,與「購買糖果香菸的行為」和「嘗試真正香菸」之間具有相關。其相關是否來自於彼此之間的因果關係,或是來自於另一共同的原因,尚待研究。

2016年3月28日 星期一

十二、警察罹癌的秘密



12. 最近某一協會表示,紐澤西州的警察抱怨,在警察執勤中使用雷達鎗追蹤超速駕駛者,其癌症罹患率不尋常地高。這個協會出對紐澤西州政府提出訴訟,宣稱這些使用雷達鎗的警察與另一對照團體,即該州的停車管理員相較之下,警察之癌症罹患率高出 18% 。這個比較樣本和這些警察在教育水準、年齡、性別及服務年資上均相對,且樣本很大,警察有 238 人,停車管理員有 231 人。請問這個事例正當嗎?

A1 樣本變異性大。警員與停車場管理員雖樣本與條件相似,但工作屬性與環境落差大
    ,樣本混淆變項多,容易導致觀察結果偏誤。
B1 更改取樣樣本。樣本設定改為不同州一樣使用相同儀器雷達鎗執勤的警員。
A2 癌症的成因多樣,並非僅由單一雷達鎗之因素導致,去除此因素,癌症還是有可能
     發生的。
A3 此研究為相關性研究,觀察者欲了解雷達鎗對於員警的身體健康影響,過程無
    主動操弄變項,僅能探討雷達鎗對於罹癌之間的相關性,非因果關係。

B3 更改結論。調查協會報導可探究P『雷達鎗對於健康間的相關性』。

十一、老鼠喝糖水


11. 一群研究者發現,如果在每天固定食物上加上 20% 之糖水,則老鼠跑負重輪子之速度明顯增加。與之對照的是給于正常食物之老鼠。來自 Plymouth Rock Animal Breeders 之 Mayflower 種之老鼠,隨機分作兩組,其中前 50 隻老鼠供給正常食物,後 50 隻則增加了糖水(分組以丟銅板方式決定)。結果後者較前者為快,研究者據此宣稱,高糖分下精力較多的假設成立。研究者並推論說應給于在學學生垃圾食品中之未加工之糖。[可參考學姊網頁的第23題]

A1 獨變項大於一個。當操縱糖水攝取量時,不小心也同時操弄了總熱量,造成有兩個獨變項的情況。當獨變項大於一個,會難以推論依變項是來自於何者。
A2 研究結果的推論過多。在生理實驗上,老鼠或許是好的模式生物,但正常飲食並不對應垃圾食物。又,跑轉輪的精力屬生理,也不對應在學學生學業所需。
B1 總熱量不變,只更動糖份所占比例。

B2 若按照實驗結果,頂多只能推論高糖分飲食能增加生理上的精力。

2016年3月21日 星期一

十、雙胞胎精神疾病題



10. 在臨床心理學有一有趣的爭論是:精神疾病是由於遺傳抑或環境經驗所造成。有一環境論者假設:若與有精神疾病父母同住的小孩,在他未來的生活中可能發生同樣的問題。為了檢驗此一假設,找了 1000 名有精神疾病的成人與 1000 名正常成人,並檢驗其雙親是否有精神疾病。在正常成人組中少於 1% 有精神疾病的父母,但在精神疾病成人組中超過 30% 的人其父母為精神疾病患者。據此該研究者結論:精神疾病並非由於遺傳,而是因為兒童時與精神疾病之父母相處之經驗,使之有較易罹患精神疾病之傾向。[可參考學姊網頁的第22題]


A1 此實驗採觀察研究,實驗者無主動操弄變項,無法直接由精神檢驗結果推論精神疾
    病是由遺傳或環境導致。
B1 更改研究設計。同卵雙胞胎基因一致,可排除受試者因遺傳變項導致結果誤差,將
    罹患精神疾病之父母所生的同卵雙胞胎分別給原生父母/寄養家庭扶養,觀察其罹

    患精神疾病的機率有無差異。

九、新藥劑量題

Drugs can tamp down the hallucinations and delusions associated with schizophrenia, but at a cost. A newer approach to treatment aims to teach people to tune out the distractions instead.:

9. 設計一 2X3 之多因子實驗來評估實驗藥物(Remoh)治療思覺失調症之效果。首先將病人分為兩組(1)到該心理醫院初診之患者。(2)病人曾被該醫院收留兩年以上。兩組實驗參與者均未接受積極之住院治療。兩組實驗參與者再分接受三種不同劑量之 Remoh , 3 gm/day, 6 gm/day, 9 gm/day 。兩組實驗參與者隨機分派至以上三種不同劑量之組。六組中各有 20 個病人。除了給藥,實驗者亦同時評估每位病人每星期思覺失調症狀出現與否。兩個月後發現,長期收留病人各組中只有少數(10%)症狀改善,但大約 50% 的新病人在三種不同的劑量中均有改善。故研究者結論:(1) Remoh 僅對新的病人有效,對慢性患者無效。 (2) 3 gm/day 是最大有效劑量。[可參考學姊網頁的第6題]


A1 初診患者並不一定非慢性患者,也不一定是「新病人」。因此此種分組方式是不嚴謹的。
B1 建議按照症狀出現的時間長短做分組,才能比較出Remoh對於慢性、非慢性患者的效果是如何。
A2 無法得知3gm以下是否也有效。
B2 若最低劑量組別有效,則應再降低劑量往下測,若更低劑量無效,才能得出何種濃度是最低能達到效果的濃度。

2016年3月14日 星期一

八、占星真的可以預測未來嗎?



8. 某一實驗者選了 20 位相信占星術的實驗參與者,並給他們根據占星術測得之他們前幾天發生的事件,且詢問他們其準確度。實驗參與者在 6 點量表上回答其認為之準確度,由極準確至極不準確。所有 20 名實驗參與者報告占星術預測與實際發生事件間具有某一程度之準確性。該實驗者據此結論:占星術是正確的。[可參考學姊網頁的第21題]
A1 受試者取樣皆為相信占星數的參與者,無設立控制或對照組做比較,主觀相信可能
     導致取樣偏誤,造成實驗結果誤差。
B1 增加控制組(無表示相信或不相信)及對照組(不相信占星術)者,進行相同測試,觀
     察其結果。或者一開始就隨機抽樣。
A2 巴南效應。占星術使用的大多為共同、普及又模棱兩可的敘述,容易使受試者對號入座。
B2 增加事件的正向/負向評價字詞,在依此進行三組分別施測,統計其量表分數差

     異。