首页 > DAVID使用方法介绍

DAVID使用方法介绍

发布时间：2024-04-25 01:49:12 来源：文档文库

小中大

字号：

手机查看

.DAVID使用说明文档

一、DAVID简介
DAVID〔theDatabaseforAnnotation，VisualizationandIntegratedDiscovery〕的网址是。DAVID是一个生物信息数据库，整合了生物学数据和分析工具，为大规模的基因或蛋白列表〔成百上千个基因ID或者蛋白ID列表〕提供系统综合的生物功能注释信息，帮助用户从中提取生物学信息。
DAVID这个工具在2003年发布，目前版本是v6.7。和其他类似的分析工具，如GoMiner，GOstat等一样，都是将输入列表中的基因关联到生物学注释上，进而从统计的层面，在数千个关联的注释中，找出最显著富集的生物学注释。最主要是功能注释和信息。
二、分析工具：
DAVID需要用户提供感兴趣的基因列表，在基因背景下，使用提供的分析工具，提取该列表中含有的生物信息。这里说的基因列表和背景文件的选取对结果至关重要。
1.基因列表：这个基因列表可能是上游的生物信息分析产生的基因ID列表。对于富集分析而言，一般情况下，大量的基因组成的列表有更高的统计意义，对富集程度高的特殊Terms有更高的敏感度。富集分析产生的p-value在一样或者数量一样的基因列表中具有可比性。
DAVID对于基因列表的格式要求为每行一个基因ID或者是基因ID用逗号分隔开。基因列表的质量会直接影响到分析结果。这里定性给出好的基因列表应该具有的特点，一个好的基因列表至少要满足以下的大局部的要求：（1）包含与研究目的相关的大局部重要的基因〔如标识基因〕。
word版

.（2）基因的数量不能太多或者太少，一般是100至10000这个数量级。
（3）大局部基因可以较好的通过统计筛选，例如，在控制组和对照组样品间选择显著差异表达基因时，使用的t-test标准：foldchanges>=2&&P-values<=0.05。
（4）大局部是上下调的基因都涉及到特定的某一生物过程，而不是随机的散布到所有可能的生物过程中。（5）一个好的基因列表比起随机产生的一个基因列表，应该含有更丰富的生物信息。（6）在同样的条件下，列表具有高度可重复性。（7）高通量数据的质量能够被其他独立的实验证实。
以上〔2〕，〔3〕，〔6〕&〔7〕是来自上游的数据标准，DAVID会自动检查其余的各项要求，即〔1〕，〔4〕&〔7〕。
2.
基因背景：在一项研究中，如果一个生物过程不正常，那么通过高通量筛选技术，对该过程共同作用的基因有更大的可能性被选为相关的一组。富集分析正是以此为根底。为检测富集的程度，必须选取一个背景来进展比照。基因背景的选取有一个指导原那么，就是必须构建一个足够大的，研究者可能涉及的所有基因的集合。用户使用默认的背景文件〔默认为该物种的所有基因〕，或者是上传一个基因列表文件作为基因背景。
3.DAVID为实现各项功能分析，提供了以下4个分析内容〔共6个分析工具〕：
〔1〕
GeneNameBatchViewer这个工具能够实现将基因ID迅速翻译成基因名称，从而给研究者对于基因ID列表一个直观的印象，初步判断基因列表是否符合要求目的。
图1中显示了该工具的分析结果，具体说明图1中标注。
word版

本文来源：https://www.2haoxitong.net/k/doc/694a31e1edf9aef8941ea76e58fafab068dc4435.html