蕭朱杏 Chuhsing Kate Hsiao

聯絡資料

地址　　國立台灣大學公共衛生學院公共衛生系　　台北市10055徐州路17號523室	電話:	(02)3366-8032
	傳真:	(02)2341-8562
	E-mail:	ckhsiao@ntu.edu.tw
	網址:	http://homepage.ntu.edu.tw/~ckhsiao/

學歷

　統計博士, 1994, 美國卡內基馬隆大學
　統計碩士, 1989, 美國卡內基馬隆大學
　數學學士, 1986, 國立清華大學

經歷

　臺大流行病學與預防醫學研究所，專任教授2003-迄今
臺大公共衛生學系，專任教授2006-迄今

臺大公共衛生學院，副院長兼公衛系主任 2011-2013; 公共衛生碩士學位學程(MPH)主任 2011-2013.
　臺大公共衛生學系，專任教授2006-迄今; 合聘教授2005-2006, 2002-2004.
　臺大流行病學研究所、流行病學與預防醫學研究所，專任教授2003-2006; 代理所長Aug.-Dec. 2005;
　　副教授1995-2003;講師1994-1995.
　臺大醫學院口腔生物科學研究所，合聘副教授1997-2001.

專長與研究興趣

　貝氏統計(Bayesian Statistics); 生物統計(Biostatistics);
　生物資訊(Bioinformatics); 遺傳統計(Genetic Statistics)

研究室簡介

本研究室主要研究方向以貝氏統計與統計計算為基礎，致力於生物統計相關方法的發展與延伸；同時也結合生物資訊，針對大量基因資料開發新的統計分析方法。近年來的生物醫學研究進展快速，很多分析都必須結合跨領域的知識，本研究室也與其他領域的學者合作，結合不同專長。以下簡述幾項近期研究方向：

貝氏統計與遺傳相關性研究

遺傳相關性研究(association studies)一直是本研究室的主要研究方向，而且著重開發及利用貝氏統計方法進行候選基因之尋找、選擇，以及基因彼此之間、基因與環境之間的交互作用。

例如：利用單一核?酸多型性(single nucleotide polymorphism, SNP)與貝氏統計混合模式(Bayesian mixture model)進行相關性研究分析(SNP-based association study with Bayesian mixture model)。本研究針對複雜性疾病的大量標誌基因，利用貝氏統計混合模式並設計先驗分佈，來估計資料中與疾病具相關的比例；再進一步利用貝氏因子 (Bayes factor)選擇標誌基因。這個方法已經有免費線上軟體供使用者下載使用(Wei et al. 2010)。除此之外，這個方法也可延伸到單倍體資料的相關性研究，以期能對單倍體候選區域的相關提出更有效的方法。

又例如以候選單倍體區塊(candidate haplotype block)為開始，以單倍體為資料基礎，進行相關性研究(haplotype-based association study)。在研究疾病與標識基因之間的相關性時，相較於單一核?酸多型性只有ATCG四個類別的資料型態，具有連鎖不平衡的單倍體雖有多型性 (polymorphism)與具生物意義等優點，但卻需要克服高維度(high dimension)與單倍體組成狀態不明(haplotype phase uncertainty)的情況。本研究室採用演化(evolution)的概念，將頻率稀少的單倍體歸類到利用相似度(similarity)而決定的少數幾個主要單倍體(core haplotypes)，再進行下一步的相關性分析。這個方法在病例對照研究資料的迴歸分析(Tzeng et al. 2006)、以及在家族資料上的群聚型概似函數檢定(clustered likelihood ratio test)都已經有了成果(Lee et al. 2010)。此外，這個方法也結合了貝氏統計分析，在家族資料的相關性研究迴歸分析中也有初步的成果( Huang et al. 2010)。

另一個方向則探討候選基因之間的交互作用(gene-gene, GG, interaction)與基因與環境之間的交互作用(gene-environment, GE, interaction)。基因之間的交互作用在生物意義尚不明確時，有時可以藉由探索性的分析來尋找。例如利用標識基因之間的空間距離與隨機效應模式所發展的貝氏統計模式(Bayesian spatial multimarker genetic random-effects model)與馬可夫鏈蒙地卡羅(Markov chain Monte Carlo)分析方法，可以有效偵測基因與基因之間的交互作用(Tsai et al. 2008)；又例如利用貝氏模式加權的方法(Bayesian model averaging)可以估計基因之間的交互作用程度(Tsai et al. 2010)。此外，本研究室也利用家族資料探討不同層級之間的基因與環境交互作用，這種情況的分析能以貝氏統計的廣義線性模式(Bayesian generalized linear mixed effects model, Bayesian GLMM)，同步解決家族成員之間的相關性，以及個人層級(individual level)之基因風險、與社區環境層級(group level)之風險間的跨層級交互作用(cross levels interaction)。這部份的研究也已經有了初步成果( Wang et al. 2010)。

生物資訊研究

鑒於基因晶片分析所得到的資料型態皆為大量資料，因此，不論是探索性分析或是統計分析方法都必須考量到因為資料量大所帶來的難題(curse of dimensionality)。本研究室針對全基因體相關性研究(Genome-wide association studies, GWAS)，利用兩階段(two-stage)選擇的方式，逐步降低入選單一核?酸多型性(SNP)標識基因(marker)數，再完成與疾病相關性的檢定(Wen et al. 2006; 2007)。另外，也結合資料採礦的機器學習理論(machine learning)，利用基因晶片資料探索彼此之間的相似性(similarity)，以及利用核函數(kernel function)來建立這些大量標誌基因與疾病的相關性，再據以選擇與疾病有相關的標識基因。這個方法也已經設計為免費軟體，供使用者下載使用 (Chen et al. al. 2009)。本研究室也針對全基因體相關性研究(Genome-wide association studies, GWAS)，利用與貝氏統計混合模式(Bayesian mixture model)來進行相關性研究分析(SNP-based association study with Bayesian mixture model)。這個方法已經有免費軟體供使用者下載使用(Wei et al., 2010)。此外，本研究室目前針對以序列(sequence)表示之鹼基所組成的標識基因，利用訊息理論(information theory)建立單一核?酸多型性群集(SNP clusters)之間的相似性測度，發展運算方法以期為生物資訊研究領域貢獻心力。

生物統計相關研究

本研究室目前也參與其他研究計畫，例如近視的遺傳相關性研究與全國調查、流行性感冒的死亡率以及貝氏統計監測系統、根管治療品質評估以及與慢性疾病之關係、以基因體方式篩選臺灣非吸菸女性肺癌候選生物標記、心血管疾病風險與B型肝炎、精神疾病遺傳研究、精卵捐贈者活產數限制等研究計畫。這些與其他領域專家的合作除了結合不同專長，也結合了跨領域的知識，對研究室的每個人都有許多的幫助。

English

蕭朱杏 Professor Chuhsing Kate Hsiao