科學研究的方法(三)
圖片來自Pixabay
編者按:
做科學研究,首先要學習做研究工作的方法。所謂 「工欲善,必先利其器」,這句話就是講改進和完善自己工作方法的重要性。
作者蔣百川博士後期間,因教授Flom「世界上有多少事沒人做過,你做得過來嗎?這不能成為你要做這個研究的理由」的反問,開始認識到學習 「研究方法」 的重要性。之後蔣百川進行了相關課程的學習,並在實踐中不斷改進,逐步掌握了這方面的知識。2013年他退休後開始陸續撰文分享積累的經驗、心得體會,並匯聚成一本《科學研究的方法》。《知識分子》獲作者授權,將陸續為大家分享書中內容,此為該系列的第三篇。
撰文 |蔣百川(美國諾瓦東南大學教授)
責編 | 鄧志英
4.
如何提出研究問題和研究假設?
(1、2節請見本系列第一篇)
(3節請見本系列第二篇)
在這一部分,要講述實驗的設計方法。由於研究領域的不同,做實驗的方法也不一樣,所以不像閱讀文獻、綜述寫作一樣有比較共通的方法和規律可循,也不象在學術會議作報告及寫作科技論文那樣有比較刻板的模式。基於我本人專業的關係,這裡介紹的方法主要用於醫學研究。對於其他領域,或許有參考價值,或許沒有,取決於你的具體問題。
1. 研究設計的含義和作用
在知道了想研究什麼(what)以後,下一步是如何來(how)得到研究問題的答案。
傳統的研究設計是一份詳細的工作計劃:選擇可以測量的變數,決定所需的樣本大小,數據的收集(實驗設計)、統計分析,以及結論。研究設計是為了保證研究程序是妥適的,可以得到確實的(valid)、客觀的(objective)、精確的(accurate)關於所研究的問題的答案。
2. 在研究設計中對外部變數的考慮
一般的醫學研究(或某些其他研究)都是為了尋找一個原因。例如某種疾病的原因,某種藥物的療效。在上述第一種情況,產生疾病的原因就是自變數,而疾病則是因變數;在第二種情況,某藥物是自變數,而療效則是因變數。但是研究工作不會是那樣地簡單,因為在尋找這種自變數與因變數的關係時,還參雜著許多外部變數(如下圖的一個例子所示)。所以設計實驗時,首先必須清醒意識到有哪些外部變數,再採取如下的措施,或者排除、或者控制、或者包括進測量中。
圖1. 一個研究吸煙與肺癌關係的例子。此時還有許多因素作為中介變數影響研究結果,如果不對於這些因素採取適應措施,本研究結果可能沒有意義。
措施一:保證外部變數對於對照組和實驗組有相同的影響。
這裡先提到一下對照組,下面還會詳細講。
(1)隨機化-保證兩組在各項外部變數方面是有可比性的。
(2)匹配-這是另一種保證兩組有可比性的方式。
措施二:減少外部變數。
有時候可將外部變數作為一個因素考慮在實驗條件內,或者消除這個外部變數對結果的影響。
(1)將外部變數包括在實驗設計中。例如,要研究兒童健康服務對兒童死亡率的影響,由於兒童營養供給對嬰兒死亡率也有很大影響,所以設計了2X2 因子的研究。在這樣設計中,既可以研究外部變數單獨的,以及與自變數聯合的對因変量的影響。
(2)消除外部變數。例如文化背景可能對健康(因變數)有很大影響,可選擇有相同文化背景的受試者,使問題簡化。
3. 不同的研究設計
若以實驗者接觸受試對象的次數分類,可有:
(1) 一次: 橫向研究(cross-sectional study);
(2) 二次: 前後對照(before-after study);
(3) 三次或以上: 縱向研究(longitudinal study)。
若以研究所選擇的參照時間分類,可有:
(1) 回顧性(retrospective study);
(2) 前瞻性(prospective study);
(3) 回顧-前瞻(retrospective-prospective study)。
若以研究性質分類,可有:
(1) 實驗性(experimental study);
(2) 非實驗性(non-experimental study);
(3) 半實驗性(semi-experimental study)。
此外還有根據實驗者(主要是收集數據的人員)以及實驗對象對於實驗情況(實驗的因変量,如在藥物療效的實驗中對於服用藥物還是安慰劑的了解程度),可分為:
(1) 單盲研究(實驗對象或受試者不了解以上情況);
(2) 雙盲研究(實驗對象及上述的實驗者均不了解以上情況)。
現將幾種主要方式再詳細介紹如下:
(1) 一次:橫向研究(cross-sectional study)
用於發現人群中某個現象、情形、問題、態度等的分布情況。橫向研究適合描述變數和它們分布模式的研究目的。也可以用於檢查自變數(predictor)和因變數(outcome)之間的相關性。
研究者若根據橫向研究的結果來討論自變數與因變數的因果關係,往往會犯錯誤。例如在有一次國際會議上,新加坡一位資深同行根據兒童IQ與近視程度的相關性,下結論說IQ高的兒童因為書讀得多所以容易近視。她講完後,我上去質疑,我說IQ高的兒童,聰明,所以往往可以不讀書就考第一,你如何證明IQ高的兒童一定讀書多?說得滿堂大笑。這裡她至少犯了兩個錯誤,一是這樣一個橫向研究結果,僅說明兩件事情的相關性,無法證明它們有因果關係;二是她在IQ及近視眼外,又引入了另一個變數,即讀書時間,並且不加證明地將讀書多與IQ划上等號。這是搞科研工作不嚴謹的表現。
橫向研究的設計(見下圖)
橫向研究的設計步驟約為:
(1)確定研究問題;
(2)受試對象的取捨標準及取樣方法,得到樣本(sample);
(3)在這個取樣樣本中,需要觀察或測量哪方面的數據,再將數據分解為下圖中的四塊;
(4)確立測量方法。
樣本的確定是研究設計的重要一步。如果實驗對象太少,實驗結果出來後會發現無法得出需要的統計結果;如果太多,則無疑增加實驗成本,浪費人力物力。樣本數的估算需要使用統計方法和公式,特別是要知道(或估計)你的測量誤差,所以要作預實驗。詳細的計算樣本大小的公式可在統計學書籍或相關程序中找到。
橫向研究的優缺點
優點:一次性測量,快速、省錢,它的結果可以提示流行程度。這個方法可以作為縱向研究的第一步,測量結果可以作為被試對象的基線(baseline),並揭示橫向的變數的相關性。
缺點:從所收集的數據中,無法得出因果關係。對於少見病的研究,這種方法在一般人群中取樣便不現實。但可以在有疾病的人群中取樣。例如在1000位有AIDS的病人中,727人有同性戀性行為,236人有吸毒行為,於是甚至不必有對照組,可以認為這兩件事對於AIDS的發病率是有高度危險的。
(2)二次: 前後對照研究(before – after study)
優點:這是兩組橫向研究的數據。對於相同實驗對象,可以發現在某種干預之下,他們的某個(些)變數發生的變化。
缺點:
(1) 要做二次實驗,需相對長的研究時間;
(2)受試者在第二次測量時可能丟失;
(3)測量的是總的變化,不能把因變數和外部變數的因素分離開來;
(4)時間可能改變受試者的某些條件;
(5)受試者的學習,稱之為反應性效應(reactive effect);
(6)回歸效應(regression effect)。在第一次測量時作極端反應的受試者在第二次測量時會作趨向中間位置的反應(見下圖)。
(3) 縱向研究(longitudinal study or cohort study)
這種研究有兩個基本目的。一是描述在一個時間段內某種結果發生的情況;另一是分析危險因子(risk factors)與這些結果之間的關聯。這種研究可以是前瞻性,也可以是回顧性的(如果已有數據可以回答研究問題)。
前瞻性的縱向研究:
例如用於分析發病率和相對危險因子(見下圖)。
縱向研究通常是建立因(predictor)和果(outcome)變數之間的時間序列的唯一方法。最近在網上也經常看到關於科學研究中對因果關係的討論,多數都說得很對。對於經典研究而言,其最終目的是為了發現事物之間的因果關係。我以為最明了簡單的表述是藉助數學語言,即原因是結果發生的充分必要條件。由於原因的出現,發生了這個結果(充分條件);沒有這個原因,便不發生這個結果(必要條件)。同時,從時間序列角度,因必出現在果之前。從醫學實驗研究角度,沒有縱向研究,在研究中沒有對照組,是無法確定因果關係的。
研究步驟:
(1)從群體取樣;
(2)測量預期變數(危險因子,自變數);
(3)跟蹤該群體;
(4)測量結果變數(疾病,因變數)。
優點:
這種研究方法很有利於確定發病情況以及研究潛在的發病原因,因為危險因子是在發病前所測量的。
缺點:
對於發病率很低的疾病的研究,費錢費時。
如果變數之間的相關性是由於混雜變數(confounding variables)的關係,研究結果中發現的相關性可能會誤導研究者。
(4)實驗性研究的設計及對照組問題
下圖表示沒有對照組的一個設計:
這樣一個實驗性研究的設計,使得前後的測量數據有可比性。但是仍然不能確定任何(因變數)的變化,是否完全由干預(自變數)引起的。為了克服這個問題,必須引入對照組。
實驗組與對照組的設定必須是隨機的,並且保證其他外部變數在兩組之間無統計差異。
在一項研究工作中,可靠的實驗結果是基於縝密的實驗設計,所以實驗設計是科學研究工作中重要的環節之一。有些學生急於著手實驗,沒有很好注意這個環節,等到結果做出來以後,發現出了問題,還得從頭再來過。
更有人急於求成,違反科學道德,製造數據作假。需知你的工作若要真正有成就,首先是需要經得起同行的重複與認可,一旦作假被戳穿或者有人提出相反的證據,都會對你的學術名譽造成損害。國內目前對這種事情的處理太輕,也是造成某些人膽大妄為的原因。其實這樣的事情,還要從中學、大學裡學生考試或作業作弊之類事情抓起,在美國新生入學時,便對他們說清楚校規對作弊的處理,即一旦發現,立即開除。
下一篇,將講述《科學研究的方法》中「數據的採集和處理」。
作者簡介
蔣百川
美國NOVA東南大學教授,國際級眼視光學專家、美國視光研究院研究員,衛生部近視眼研究所外方所長。
歡迎個人轉發到朋友圈,
公眾號、報刊等轉載請聯繫授權
※盤點:2016年科學大事件;快樂的時間為何總是太短?
※錢穎一:大學治理中的「學術問題」和「行政問題」
※面對校園霸凌,家長的應對技巧
※西湖大學的未來選擇:普林斯頓大學還是羅格斯大學?
※中美教育差異背後的制度焦慮
TAG:知識分子 |
※科學研究的方法(七)
※科學研究的方法(一)
※閱讀文獻與綜述寫作|科學研究的方法(一)
※科學的練琴方法
※如何提出研究問題和研究假設? | 科學研究的方法(二)
※基礎研究、哲學與科學傳播
※催眠術的科學研究
※科學、計算科學與數據科學
※國家蛋白質科學中心-北京精準醫學方向博士後、研究助理招聘
※中國醫學科學院基礎醫學研究所&北京協和醫學院基礎學院鄭直教授課題組副研究員、助理研究員、博士後招聘
※曾紅葵:艾倫腦科學研究所的「大科學」
※科學家對「笑」的研究
※錢學森院士:技術科學的研究之路
※古代曆法:科學為偽科學服務?
※中國科學院理化技術研究所液態金屬研究方向博士後招聘
※物理學與腦科學裡的「美」與「丑」
※對科學的技術理解——評段偉文《可接受的科學:當代科學基礎的反思》
※黎樂民:理論與計算化學的關鍵科學問題和學科重要研究前沿
※華南師範大學成立腦科學與腦康復行為醫學研究院