醫(yī)學(xué)統(tǒng)計(jì)學(xué)課堂教學(xué)論文
時(shí)間:2022-03-04 11:38:00
導(dǎo)語:醫(yī)學(xué)統(tǒng)計(jì)學(xué)課堂教學(xué)論文一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
一、概率分布
概率分布(probabilitydistribution)是醫(yī)學(xué)統(tǒng)計(jì)學(xué)中多種統(tǒng)計(jì)分析方法的理論基礎(chǔ)。授課內(nèi)容一般包括:二項(xiàng)分布、Possion分布、正態(tài)分布、t分布、F分布等。
借助概率分布常??梢詭椭覀兞私馍笜?biāo)的特征、醫(yī)學(xué)現(xiàn)象的發(fā)生規(guī)律等等。例如,臨床檢驗(yàn)中計(jì)量實(shí)驗(yàn)室指標(biāo)的參考值范圍就是依據(jù)正態(tài)分布和t分布的原理計(jì)算得到;許多醫(yī)學(xué)試驗(yàn)的“陽性”結(jié)果服從二項(xiàng)分布,因此它被廣泛用于化學(xué)毒性的生物鑒定、樣本中某疾病陽性率的區(qū)間估計(jì)等;而一定人群中諸如遺傳缺陷、癌癥等發(fā)病率很低的非傳染性疾病患病數(shù)或死亡數(shù)的分布,單位面積(或容積)內(nèi)細(xì)菌數(shù)的分布等都服從Poisson分布,我們就可以借助Poisson分布的原理定量地對(duì)上述現(xiàn)象進(jìn)行研究。
在生物信息學(xué)中概率分布也有一定應(yīng)用。例如,Poisson分布可以用于基因(蛋白質(zhì))序列的相似性分析。被研究者廣泛使用的分析工具BLAST(BasicLocalAlignmentSearchTool)能迅速將研究者提交的蛋白質(zhì)(或DNA)數(shù)據(jù)與公開數(shù)據(jù)庫進(jìn)行相似性序列比對(duì)。對(duì)于序列a和b,BLAST發(fā)現(xiàn)的高得分匹配區(qū)稱為HSPs。而HSP得分超過閾值t的概率P(H(a,b)>t)可以依據(jù)Poisson分布的性質(zhì)計(jì)算得到。
二、假設(shè)檢驗(yàn)
假設(shè)檢驗(yàn)(hypothesis)是醫(yī)學(xué)統(tǒng)計(jì)學(xué)中統(tǒng)計(jì)推斷部分的重要內(nèi)容。假設(shè)檢驗(yàn)根據(jù)反證法和小概率原理,首先依據(jù)資料性質(zhì)和所需解決的問題,建立檢驗(yàn)假設(shè);在假設(shè)該檢驗(yàn)假設(shè)成立的前提下,采用適當(dāng)?shù)臋z驗(yàn)方法,根據(jù)樣本算得相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量;最后,依據(jù)概率分布的特點(diǎn)和算得的檢驗(yàn)統(tǒng)計(jì)量的大小來判斷是否支持所建立的檢驗(yàn)假設(shè),進(jìn)而推斷總體上該假設(shè)是否成立。其基本方法包括:u檢驗(yàn)、t檢驗(yàn)、方差分析(ANOVA)和非參數(shù)檢驗(yàn)方法。
假設(shè)檢驗(yàn)為醫(yī)學(xué)研究提供了一種很好的由樣本推斷總體的方法。例如,隨機(jī)抽取某市一定年齡段中100名兒童,將其平均身高(樣本均數(shù))與該年齡段兒童應(yīng)有的標(biāo)準(zhǔn)平均身高(總體均數(shù))做u檢驗(yàn),其檢驗(yàn)結(jié)果可以幫助我們推斷出該市該年齡段兒童身高是否與標(biāo)準(zhǔn)身高一致,為了解該市該年齡段兒童的生長(zhǎng)發(fā)育水平提供參考。又如,醫(yī)學(xué)中常??梢圆捎胻檢驗(yàn)、秩和檢驗(yàn)比較兩種藥物的療效有無差別;用2檢驗(yàn)比較不同治療方法的有效率是否相同等等。
這些假設(shè)檢驗(yàn)的方法在生物實(shí)驗(yàn)資料的分析前期應(yīng)用較多,但由于研究目的和資料性質(zhì)不同,一般會(huì)對(duì)某些方法進(jìn)行適當(dāng)調(diào)整和結(jié)合。
例如,基于基因芯片實(shí)驗(yàn)數(shù)據(jù)尋找差異表達(dá)基因的問題?;蛐酒╣enechip)是近年來實(shí)驗(yàn)分子生物學(xué)的技術(shù)突破之一,它允許研究者在一次實(shí)驗(yàn)中獲得成千上萬條基因在設(shè)定實(shí)驗(yàn)條件下的表達(dá)數(shù)據(jù)。為了從這海量的數(shù)據(jù)中尋找有意義的信息,在對(duì)基因表達(dá)數(shù)據(jù)進(jìn)行分析的過程中,找到那些在若干實(shí)驗(yàn)組中表達(dá)水平有明顯差異的基因是比較基礎(chǔ)和前期的方法。這些基因常常被稱為“差異表達(dá)基因”,或者“顯著性基因”。如果將不同實(shí)驗(yàn)條件下某條基因表達(dá)水平的重復(fù)測(cè)量數(shù)據(jù)看作一個(gè)樣本,尋找差異表達(dá)基因的問題其實(shí)就可以采用假設(shè)檢驗(yàn)方法加以解決。
如果表達(dá)數(shù)據(jù)服從正態(tài)分布,可以采用t-檢驗(yàn)(或者方差分析)比較兩樣本(或多樣本)平均表達(dá)水平的差異。
但是,由于表達(dá)數(shù)據(jù)很難滿足正態(tài)性假定,目前常用的方法基于非參數(shù)檢驗(yàn)的思想,并對(duì)其進(jìn)行了改進(jìn)。該方法分為兩步:首先,選擇一個(gè)統(tǒng)計(jì)量對(duì)基因排秩,用秩代替表達(dá)值本身;其次,為排秩統(tǒng)計(jì)量選擇一個(gè)判別值,在其之上的值判定為差異顯著。常用的排秩統(tǒng)計(jì)量有:任一特定基因在重復(fù)序列中表達(dá)水平M值的均值;考慮到基因在不同序列上變異程度的統(tǒng)計(jì)量,其中,s是M的標(biāo)準(zhǔn)差;以及用經(jīng)驗(yàn)Bayes方法修正后的t-統(tǒng)計(jì)量:,修正值a由M的方差s2的均數(shù)和標(biāo)準(zhǔn)差估計(jì)得到。三、一些高級(jí)統(tǒng)計(jì)方法在基因研究中的應(yīng)用
(一)聚類分析
聚類分析(clusteringanalysis)是按照“物以類聚”的原則,根據(jù)聚類對(duì)象的某些性質(zhì)與特征,運(yùn)用統(tǒng)計(jì)分析的方法,將聚類對(duì)象比較相似或相近的歸并為同一類。使得各類內(nèi)的差異相對(duì)較小,類與類間的差異相對(duì)較大1。聚類分析作為一種探索性的統(tǒng)計(jì)分析方法,其基本內(nèi)容包括:相似性度量方法、系統(tǒng)聚類法(HierarchicalClustering)、K-means聚類法、SOM方法等。
聚類分析可以幫助我們解決醫(yī)學(xué)中諸如:人的體型分類,某種疾病從發(fā)生、發(fā)展到治愈不同階段的劃分,青少年生長(zhǎng)發(fā)育分期的確定等問題。
近年來隨著基因表達(dá)譜數(shù)據(jù)的不斷積累,聚類分析已成為發(fā)掘基因信息的有效工具。在基因表達(dá)研究中,一項(xiàng)主要的任務(wù)是從基因表達(dá)數(shù)據(jù)中識(shí)別出基因的共同表達(dá)模式,由此將基因分成不同的種類,以便更為深入地了解其生物功能及關(guān)聯(lián)性。這種探索完全未知的數(shù)據(jù)特征的方法就是聚類分析,生物信息學(xué)中又稱為無監(jiān)督的分析(UnsupervisedAnalysis)。常用方法是利用基因表達(dá)數(shù)據(jù)對(duì)基因(樣本)進(jìn)行聚類,將具有相同表達(dá)模式的基因(樣本)聚為一類,根據(jù)聚類結(jié)果通過已知基因(樣本)的功能去認(rèn)識(shí)那些未知功能的基因。對(duì)于基因表達(dá)數(shù)據(jù)而言,系統(tǒng)聚類法易于使用、應(yīng)用廣泛,其結(jié)果——系統(tǒng)樹圖能提供一個(gè)可視化的數(shù)據(jù)結(jié)構(gòu),直觀具體,便于理解。而在幾種相似性的計(jì)算方法中,平均聯(lián)接法(AverageLinkageClustering)一般能給出較為合理的聚類結(jié)果2。
(二)判別分析
判別分析(discriminantanalysis)是根據(jù)觀測(cè)到的某些指標(biāo)的數(shù)據(jù)對(duì)所研究的對(duì)象建立判別函數(shù),并進(jìn)行分類的一種多元統(tǒng)計(jì)分析方法。它與聚類分析都是研究分類問題,所不同的是判別分析是在已知分類的前提下,判定觀察對(duì)象的歸屬3。其基本方法包括:Fisher線性判別(FLD)、最鄰近分類法(k-NearestNeighborClassifiers)、分類樹算法(ClassificationTreeAlgorithm),人工神經(jīng)網(wǎng)絡(luò)(ANNs)和支持向量機(jī)(SVMs)。
判別分析常用于臨床輔助鑒別診斷,計(jì)量診斷學(xué)就是以判別分析為主要基礎(chǔ)迅速發(fā)展起來的一門科學(xué)。如臨床醫(yī)生根據(jù)患者的主訴、體征及檢查結(jié)果作出診斷;根據(jù)各種癥狀的嚴(yán)重程度預(yù)測(cè)病人的預(yù)后或進(jìn)行某些治療方法的療效評(píng)估;以及流行病學(xué)中某些疾病的早期預(yù)報(bào),環(huán)境污染程度的堅(jiān)定及環(huán)保措施、勞保措施的效果評(píng)估等。
在生物信息學(xué)針對(duì)基因的研究工作中,由于借助了精確的生物實(shí)驗(yàn),研究者通常能得到基因(樣本)的準(zhǔn)確分類,如,基因的功能類、樣本歸結(jié)于疾?。ㄕ#顟B(tài)等等。當(dāng)利用了這些分類信息時(shí),就可以采用判別分析的方法對(duì)基因進(jìn)行分類,生物信息學(xué)中又稱為有監(jiān)督的分析(SupervisedAnalysis)。例如,基因表達(dá)數(shù)據(jù)分析中,對(duì)于已經(jīng)過濾的基因,前三種方法的應(yīng)用較為簡(jiǎn)單。而支持向量機(jī)(SVMs)和人工神經(jīng)網(wǎng)絡(luò)(ANNs)是兩種較新,但很有應(yīng)用前景的方法。
(三)相關(guān)分析
相關(guān)分析(correlationanalysis)是醫(yī)學(xué)統(tǒng)計(jì)學(xué)中研究?jī)勺兞块g關(guān)系的重要方法。它借助相關(guān)系數(shù)來衡量?jī)勺兞恐g的關(guān)系是否存在、關(guān)系的強(qiáng)弱,以及相互影響的方向。其基本內(nèi)容包括:線性相關(guān)系數(shù)、秩相關(guān)系數(shù)、相關(guān)系數(shù)的檢驗(yàn)、典型相關(guān)分析等。
我們常常可以借助相關(guān)分析判斷研究者所感興趣的兩個(gè)醫(yī)學(xué)現(xiàn)象之間是否存在聯(lián)系。例如,采用秩相關(guān)分析我們發(fā)現(xiàn)某種食物中黃曲霉毒素相對(duì)含量與肝癌死亡率間存在正相關(guān)關(guān)系;采用線性相關(guān)方法發(fā)現(xiàn)中年女性體重與血壓之間具有非常密切的正相關(guān)關(guān)系等等。
生物信息學(xué)中可以利用相關(guān)分析建立基因調(diào)控網(wǎng)絡(luò)。如果將兩個(gè)不同的基因在不同實(shí)驗(yàn)條件下的表達(dá)看作是兩個(gè)變量,相關(guān)分析所研究的正是兩者之間的調(diào)控關(guān)系。如采用線性相關(guān)系數(shù)進(jìn)行兩基因關(guān)系的分析時(shí),其大小反應(yīng)了基因調(diào)控關(guān)系的強(qiáng)弱,符號(hào)則反應(yīng)了兩基因是協(xié)同關(guān)系(相關(guān)系數(shù)為正),還是抑制關(guān)系(相關(guān)系數(shù)為負(fù))。
四、意義
生物信息學(xué)不僅是醫(yī)學(xué)統(tǒng)計(jì)學(xué)的研究前沿,更是醫(yī)學(xué)研究由宏觀向微觀拓展的重要領(lǐng)域,其研究?jī)?nèi)容已逐漸為多數(shù)醫(yī)學(xué)院校的學(xué)員了解和熟悉。而如何對(duì)新技術(shù)產(chǎn)生的生物實(shí)驗(yàn)數(shù)據(jù)進(jìn)行準(zhǔn)確合理的分析,卻成為生物信息學(xué)研究的主要瓶頸之一。
在醫(yī)學(xué)統(tǒng)計(jì)學(xué)課堂教學(xué)中引入生物信息學(xué)實(shí)例,而不僅僅局限于常見的醫(yī)學(xué)、衛(wèi)生領(lǐng)域的例子,將難以理解的統(tǒng)計(jì)理論和方法與前沿的生物實(shí)例相結(jié)合,拓寬了學(xué)員的視野,提高了學(xué)員的學(xué)習(xí)興趣,更可以加深對(duì)所學(xué)知識(shí)的理解;與此同時(shí),使學(xué)員掌握了生物實(shí)驗(yàn)數(shù)據(jù)的先進(jìn)分析方法,擴(kuò)大了學(xué)員的知識(shí)面,提高了他們今后開展醫(yī)學(xué)科研工作的能力。
還有一些醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法目前也逐漸應(yīng)用于生物信息學(xué)研究中,諸如:遺傳算法、熵理論等等。但這些方法已經(jīng)超出了醫(yī)學(xué)統(tǒng)計(jì)學(xué)課堂教學(xué)的范圍,我們將嘗試在第二課堂或選修課中,作為補(bǔ)充知識(shí)進(jìn)行講授,供那些學(xué)有余力的學(xué)員學(xué)習(xí)交流摘要:生物信息學(xué)的蓬勃發(fā)展已使醫(yī)學(xué)研究由宏觀逐步探索到微觀。醫(yī)學(xué)統(tǒng)計(jì)學(xué)作為一門醫(yī)學(xué)院校的基礎(chǔ)課程,其理論和方法在醫(yī)學(xué)研究的新要求下其理論和方法也有了新的發(fā)展與應(yīng)用。將生物信息學(xué)知識(shí)帶入醫(yī)學(xué)統(tǒng)計(jì)學(xué)課堂教學(xué),介紹醫(yī)學(xué)統(tǒng)計(jì)學(xué)的新發(fā)展,不但能使學(xué)員了解到本學(xué)科的前沿研究?jī)?nèi)容,有效地激發(fā)學(xué)員的學(xué)習(xí)興趣,還能使他們掌握生物信息學(xué)研究的工具,提高今后從事醫(yī)學(xué)科研工作的能力。
關(guān)鍵詞:生物信息學(xué)醫(yī)學(xué)統(tǒng)計(jì)學(xué)課堂教學(xué)
熱門標(biāo)簽
醫(yī)學(xué)科普 醫(yī)學(xué)科普論文 醫(yī)學(xué)論文 醫(yī)學(xué)思政教育 醫(yī)學(xué)綜述 醫(yī)學(xué)科普教育 醫(yī)學(xué)教學(xué)論文 醫(yī)學(xué)職稱論文 醫(yī)學(xué)影像論文 醫(yī)學(xué)護(hù)理論文 心理培訓(xùn) 人文科學(xué)概論