变点理论统计分析方法应用试例
摘 要:变点是模型中突然发生变化的某个或某一些量变化的点。研究突变点,通常能够发现事物的某种质的变化,差异基因表达检测就是寻找基因表达谱数据中样本数据相对于正常组样本数据有过表达的有变化的现象。该文探讨变点理论的统计方法在差异基因表达检测中的应用。
关键词:变点理论 统计方法 差异表达基因检测
中图分类号:P618.13 文献标识码:A 文章编号:1674-098X(2013)03(b)-0-02
变点是是模型中突然发生变化的某个或某一些量发生变化的点。研究突变点,通常能够发现事物的某种质的变化[1]。随着科学发展,在临床医学上分析癌症病理时,通常都要挖掘基因表达谱数据中是否存在过高或者过低表达的“过表达”数据,也就是致癌基因表达值反映出来的突变点。差异表达基因检测就是研究单基因水平的基因表达谱数据,从而发现不同环境实验条件下过表达的致癌基因。
1 基于变点理论的统计方法
国外对于变点的研究中涉及比较早的是突变点,渐变式变点的研究也有一些成果。针对位置参数模型,有人提出了变点的最小二乘法的估计。中国科学院院士陈希孺教授认为:变点分析是数理统计以及非线性时间序列的范畴,统计判断变点问题,能够分析估计量的性质[1]。
变点问题涉及的模型主要有三种情况,即均值有突然变化的均值变点、回归系数有突然变化的回归变点和实践的概率有突然变化的概率变点。变点问题中,可以是一系列的样本观察值按一定次序的先后排列,也可以是空间中的位置或者界面[2]。因此,在研究基因表达谱数据中差异表达基因时,通常是研究在一系列样本值中有突然变化的一个或者多个均值变点。
设是独立随机变量,F1 和F2为两个不相等的连续分布函数,使得X1,…,Xr iid.~F2,Xr+1,…,Xn iid.~F2。则r(1 变点理论把统计控制理论、估计和假设检验理论、非贝叶斯方法和贝叶斯方法结合起来,通过研究统计推断问题,对估计量的性质进行了统计分析,在医学、金融、工业自动控制等领域都有大量的应用[1]。 2 癌症差异表达基因检测 在研究癌症问题时,会发现癌细胞中能发生基因的异位,而且这些异位导致了致癌基因的表达值发生变化,并可能影响癌症的发展。因为一个给定的异位在每个样本中只发生一次,如果一个给定的活化基因有多对,某个癌症样本有基因A的过高表达,而其他癌症样本有基因B的过高表达,但这些样本是相互排斥的。但人们期望在正常样本中没有出现基因A或者基因B的过表达,利用这样的思想,就能筛选找到异位的感兴趣基因,这种思想即为对差异表达基因的检测[3]。 差异表达基因检测是医学领域中,在分子水平实现准确识别癌症亚型的检测判别方法。针对基因表达谱的差异表达基因检测技术,其核心方法就是采用统计学中的假设检测方法,同时、快速、准确的检测成千上万的基因表达谱数据中的基因值是否具有差异表达,从中挖掘出潜在的特异性基因,并分析基因表达谱数据的生物学意义[5]。 具有差异表达现象的基因在基因表达谱上的基因信号强度数值,在表达上是具有差异性和相关性的,所以,差异表达基因的表达强度值就能够看作为基因表达谱数据中的异常变点值。 3 变点统计分析方法在差异表达基因检测中的应用 基于变点理论的统计方法在癌症基因表达谱数据分析中的应用,是对变点理论的实践应用以及差异表达基因检测的研究都具有新的挑战。 4 结语 把变点分析的理论应用到差异表达基因检测中,用来检测潜在的癌症基因,给出该变点位置的估计,为理解、分析癌症基因的数据特性提供帮助。根据变点理论的非参数法可以检测差异表达基因,把癌症异常点样本能够看成是比所有正常样本来自更高平均表达密度的分布,检测在癌症组中的基因表达强度的的一个改变点根据分布变点的非参数统计算法思想,对于一个独立的基因表达谱随机变量,寻找估计的变点。 诱发癌症疾病发生的因素可能是多方面的,从生物信息学理论研究诱发同该癌症疾病有关的致病基因,分析通过微阵列数据得到的基因表达谱数据,检测到具有实际意义的差异表达基因,这并将具有广泛的应用,将在研究适应药物作用的分子机制,寻找新药开发源头的药物靶标等方面都有重要的意义。 参考文献 [1]陈希孺.变点统计分析简介[J].数据统计与管理,1991,3(2):55-58. [2]王黎明.三种变点问题理论及其应用[J].泰山学院学报,2007,11(29):1-4. [3]谭智平,缪柏其.关于分布变点问题的非参数统计推断[J].中国科学技术大学学报,2000,30(3):270-277. [4]Tomlins S A,Rhodes D R,Perner S,et al.Recurrent fusion of TMPRSS2 and ETS transcription factor genes in Prostate Cancer[J].Science,2005,10(310):644-648. [5]Zhaohua Ji,Yao Wang,Chunguo Wu,et al.Mean,Median and Tri-Mean Based Statistical Detection Methods for Differential Gene Expression in Microarray Data.CISP"10-BMEI"10,Yantai,2010:3142-3146. [6]Hu JH.Cancer outlier detection based on likelihood ratio test[J].Bioinformatics,2008,24(19):2193-2199.
版权声明:
1.十号范文网的资料来自互联网以及用户的投稿,用于非商业性学习目的免费阅览。
2.《变点理论统计分析方法应用试例》一文的著作权归原作者所有,仅供学习参考,转载或引用时请保留版权信息。
3.如果本网所转载内容不慎侵犯了您的权益,请联系我们,我们将会及时删除。
本栏目阅读排行
栏目最新
- 1在农民收入调查工作动员培训会上讲话
- 22024年领导干部政治素质自评材料(完整)
- 3公司党委党建工作总结报告【完整版】
- 42024年主题教育党建调研开展情况总结
- 52024年度区妇联关于党建工作述职报告(完整)
- 6关于加强企业人才队伍建设调研与思考(完整文档)
- 72024县党员干部抓基层党建工作述职报告
- 8第二批主题教育研讨发言:时刻“以民为本”,听“实言实语”,办实事好事
- 92024关于党员干部法治信仰情况调研报告(2024年)
- 10局网络安全工作责任制落实自查报告(全文)
- 11XX国企分管领导关于党建设引领企业高质量发展研讨发言(范文推荐)
- 122024年第二批主题教育专题读书班研讨发言提纲(6)【完整版】