統計與你

王新台

統計在生物醫學研究上的應用,乃是由收集有限樣本的資料,用「機率理論」做基礎,推估研究現象所傳達的訊息。推估的結果是否接近事實,取決於三大要素:(一)研究設計是否恰當?(二)樣本數大小是否足夠?及(三)統計分析方法是否適當?一般非統計專業者在應用統計方法上所欠缺的知識主要在於(三),而需要統計學者幫忙。但是根據我個人多年合作的經驗,真正造成許多研究統計推論上之困難,多半是由於研究者未能針對問題提出恰當的研究設計。譬如說在斷面性研究中,如要回答某變項與年齡之間的關係,將會因為無法區分出世代和年齡各別的效應,而造成推論上的困難。在這種情況下,即使再好的統計方法,也無法呈現正確的信息。針對這一點,我強烈建議在研究初期階段,應找統計學者或其它受過嚴格方法學訓練學者討論。而不是等到研究完成,才請他們打撈資料所傳遞的迅息。不管臨床或者是基礎的研究,除了要有好的點子之外,是否有高品質的研究設計,將決定學術論文是否為一流期刊所接受。

樣本數不足在臨床及基礎研究上是常常碰到很實際的問題,其原因可能是資料取得不易或者是受限於經費及時間。從統計的觀點,樣本數不足會造成統計推論不確定性增加(P值>0.05)。如果所研究現象本身變異性(variance)不大,樣本數雖少,仍可做適度地推論。在動物實驗方面,樣本數通常不大,而且並非每個現象的變異性都很小,因此由有限樣本所做之推論,並非都能採信。但是如果某種趨勢甚為明顯,則研究者不可因統計分析結果未達統計顯著意義而因噎廢食,應注意結果在專業上的實質意義。另一方面,如果因為樣本數很大而達到統計上之意義,研究者也應審慎檢視結果是否有專業上的實質意義。我要強調的是統計顯著意義和專業上的實質意義應共同考量,才不致造成過度或者是不足的解釋資料中所傳遞的訊息。

一般在選擇統計模型上常犯的錯誤有二個:(一)統計分析方法不符合實驗設計;(二)統計分析方法不適合資料的型態(常見的是分類型,序列型及連續型),譬如實驗設計中有配對,但分析時卻忽略。又譬如所收集資料是序列型,但分析時把他當連續型資料處理,這些都會造成錯誤的推估。

統計學者從研究的開始到文章的發表,應被視為合作中重要的成員,為增進研究的品質而共同努力。統計學者同時亦可從合作中找尋新的統計問題,擴展專業的進步。可說是雙贏的局面。過去在專業領域拓展方面的努力明顯得不足,為此公共衛生研究所正積極籌設方法學研究中心。除了量性的方法學,我們亦將強調質性的方法學的研究。我懷著感恩的心,能與院內的同仁共同的成長。期待進入二十一世紀,我們能更上一層樓,為自己及成大醫學院成長共同地努力。