转基因植物是基因组中含有外源基因的植物。通过原生质体融合、细胞重组、遗传物质转移、染色体工程技术获得,改变植物的某些遗传特性。
人工转基因动物就是基因组中含有外源基因的动物。它是按照预先的设计,融合重组细胞、遗传物质转移、染色体工程和基因工程技术将外源基因导入精子、卵细胞或受精卵,再以生殖工程技术,有可能育成转基因动物。
遗传转化的方法按其是否需要通过组织培养、再生植株通常可分成两大类,第一类需要通过组织培养再生植株,常用的方法有农杆菌介导转化法、基因枪法;另一类方法不需要通过组织培养,比较成熟的主要有花粉管通道法,花粉管通道法是中国科学家提出的。
农杆菌介导转化
农杆菌是普遍存在于土壤中的一种革兰氏阴性细菌,它能在自然条件下趋化性地感染大多数双子叶植物的受伤部位,并诱导产生冠瘿瘤或发状根。根癌农杆菌和发根农杆菌中细胞中分别含有Ti质粒和Ri质粒,其上有一段T-DNA,农杆菌通过侵染植物伤口进入细胞后,可将T-DNA插入到植物基因组中。
因此,农杆菌是一种天然的植物遗传转化体系。人们将目的基因插入到经过改造的T-DNA区,借助农杆菌的感染实现外源基因向植物细胞的转移与整合,然后通过细胞和组织培养技术,再生出转基因植株。
农杆菌介导法起初只被用于双子叶植物中,自从技术瓶颈被打破之后,农杆菌介导转化在单子叶植物中也得到了广泛应用,其中水稻已经被当作模式植物进行研究。
花粉管通道法
在授粉后向子房注射含目的基因的DNA溶液,利用植物在开花、受精过程中形成的花粉管通道,将外源DNA导入受精卵细胞,并进一步地被整合到受体细胞的基因组中,随着受精卵的发育而成为带转基因的新个体。该方法于80年代初期由中国学者周光宇提出,中国目前推广面积最大的转基因抗虫棉就是用花粉管通道法培育出来的。该法的最大优点是不依赖组织培养人工再生植株,技术简单,不需要装备精良的实验室,常规育种工作者易于掌握。
核显微注射法
核显微注射法是动物转基因技术中最常用的方法。它是在显微镜下将外源基因注射到受精卵细胞的原核内,注射的外源基因与胚胎基因组融合,然后进行体外培养,最后移植到受体母畜子宫内发育,这样分娩的动物体内的每一个细胞都含有新的DNA片段。-这种方法的缺点是效率低、位置效应(外源基因插入位点随机性)造成的表达结果的不确定性、动物利用率低等,在反刍动物还存在着繁殖周期长,有较强的时间限制、需要大量的供体和受体动物等特点。
详细步骤:在显微镜下,用一根极细的玻璃针(直径1-2微米)直接将DNA注射到胚胎的细胞核内,再把注射过DNA的胚胎移植到动物体内,使之发育成正常的幼仔。用这种方法生产的动物约有十分之一是整合外源基因的转基因动物。
基因枪法
利用火药爆炸或高压气体加速(这一加速设备被称为基因枪),将包裹了带目的基因的DNA溶液的高速微弹直接送入完整的植物组织和细胞中,然后通过细胞和组织培养技术,再生出植株,选出其中转基因阳性植株即为转基因植株。与农杆菌转化相比,基因枪法转化的一个主要优点是不受受体植物范围的限制。而且其载体质粒的构建也相对简单,因此也是转基因研究中应用较为广泛的一种方法。
精子介导法
精子介导的基因转移是把精子作适当处理后,使其具有携带外源基因的能力。然后,用携带有外源基因的精子给发情母畜授精。在母畜所生的后代中,就有一定比例的动物是整合外源基因的转基因动物。
同显微注射方法相比,精子介导的基因转移有两个优点:首先是它的成本很低,只有显微注射法成本的1/10。其次,由于它不涉及对动物进行处理,因此,可以用生产牛群或羊群进行实验,以保证每次实验都能够获得成功。
核移植转基因法
体细胞核移植是一种转基因技术。该方法是先把外源基因与供体细胞在培养基中培养,使外源基因整合到供体细胞上,然后将供体细胞细胞核移植到受体细胞——去核卵母细胞,构成重建胚,再把其移植到假孕母体,待其妊娠、分娩,便可得到转基因的克隆动物。
体细胞核移植法
先在体外培养的体细胞中进行基因导入,筛选获得带转基因的细胞。然后,将带转基因体细胞核移植到去掉细胞核的卵细胞中,生产重构胚胎。重构胚胎经移植到母体中,产生的仔畜百分之百是转基因动物。
安装工作流程所需的 biconductor 包
VariantAnnotation包能够有效的从Variant Calling Format(VCF)文件读取部分或所有内容。
这些文本文件包括元信息行(meta-information lines),标题行(header line)和数据行(data lines),其中数据行每一行都含有基因组位置信息。这类格式同样包含每个位置上样本的基因型信息。更多该文件相关的信息可以看 VCF specs
本文所介绍的工作流程需要一些Biocondutor的包,下面几节会仔细介绍每个包的具体用法。
可以用 biocLite 安装那些未安装的包
本工作流程着眼于17号染色体上Transient Receptor Potential Vanilloid (TRPV)基因家族的变异位点。样本数据来自于Bioconductor的cgdv17实验数据包,内部包含46个17号染色体上的完整的基因组多样性面板数据(pannel data)如果想知道这些数据是如何组织的信息,可以查看包的小品文。
我们所使用的包中的VCF文件,是CEU群体其中一个17号染色体的子集。
为了大致了解该文件有哪些数据,我们可以查看标题部分。 scanVcfHeader() 解析文件的标题部分,将解析的内容存入 VCFHeader 对象,然后就可以使用 info() 和 geno() 存取器(accessor)提取字段特定(field-specific)数据
由下可知,VCF中的变异比对到NCBI构建的基因组GRCh37
使用 orgHsegdb 包将基因符号转为基因ID。
我们使用USCS的hg19已知基因轨道(hg19 known gene track)识别TRPV基因范围。这些基因范围最终会根据VCF文件提取变异位点。
载入注释包
我们的VCF已经比对到NCBI的基因组,并且已知基因轨道来自于UCSC。这些机构对染色体有不同的命名传统。为了在匹配(match)或者重叠(overlap)操作用到这些数据,染色体命名方式(或者叫seqlevels)需要匹配。我们会修改txdb以匹配VCF文件
根据基因创建转录本列表
为TRPV基因创建基因范围
ScanVcfParam 对象用于提取数据子集。该对象能够指定基因组坐标(范围)或单独的VCF元素。提取范围(vs 字段)需要一个tabix索引。使用 indexTabix 查看细节。
locateVariants 根据基因结构(例如exon, utr, splice site等)判断变异位点的位置。我们使用之前加载的 TxDbHsapiensUCSChg19knownGene 包内的基因模型。
CDS的每一行都代表一个变异位点-转录本匹配,因此一行变异位点对应多行也是可以的。如果我们对基因中心的问题感兴趣,数据就可以根据基因进行描述性分析,而不用考虑转录本。
可用 predictCoding 函数得到非同义变异的氨基酸改变。 BSgenomeHsapiensUCSChg19 包用作参考等位基因的源。变异的等位基因由使用者提供。
predictCoding 仅仅返回编码变异位点的结果。与 locateVariants 一样,每个变异位点-转录匹配项的输出都有一行,因此每个变异位点可以有多行。
当 predictCoding 调用时,变异位点“not translated”在抛出的警告进行说明。 在varAllele中缺少varAllele或“N”的变异位点不会被翻译。 如果varAllele替换已经导致了移位,则后果将是“frameshift”。 有关详细信息,请参阅 predictCoding
ensemblVEP 包能够访问在线Ensembl Variant Effect Predictor (VEP tool)。VEP工具输出的已知或者未知变异位点的功能后果预测,通过序列本体论(Sequence Ontology)或Ensembl报告。可选输出有Regulatory region consequences, HGNC, Ensembl protein identifiers, HGVS, co-located variants。 ensemblVEP() 接受VCF文件名,在R工作环境中返回一个磁盘上的VCF或者GRanges
加载ensemblVEP:
ensemblVEP的 file 参数必须是硬盘上的VCF
第一,一个9~10碱基的短核苷酸序列标签包含有足够的信息,能够唯一确认一种转录物。例如,一个9碱基顺序能够分辨262144个不同的转录物(49),而人类基因组估计仅能编码80000种转录物,所以理论上每一个9碱基标签能够代表一种转录物的特征序列。
第二,如果能将9碱基的标签集中于一个克隆中进行测序,并将得到的短序列核苷酸顺序以连续的数据形式输入计算机中进行处理,就能对数以千计的mRNA转录物进行分析。 (1) 以biotinylated oligo(dT)为引物反转录合成cDNA,以一种限制性内切酶(锚定酶 Anchoring Enzyme, AE)酶切。锚定酶要求至少在每一种转录物上有一个酶切位点,一般4碱基限制性内切酶能达到这种要求,因为大多数mRNA要长于256碱基(44)。通过链霉抗生物素蛋白珠收集cDNA3′端部分。对每一个mRNA只收集其polyA尾与最近的酶切位点之间的片段。
(2) 将cDNA等分为A和B两部分,分别连接接头A或接头B。每一种接头都含有标签酶(Tagging Enzyme TE)酶切位点序列(标签酶是一种Ⅱ类限制酶,它能在距识别位点约20碱基的位置切割DNA双链)。接头的结构为引物A/B序列+标签酶识别位点+锚定酶识别位点。
(3) 用标签酶酶切产生连有接头的短cDNA片段(约9~10碱基),混合并连接两个cDNA池的短cDNA片段,构成双标签后,以引物A和B扩增。
(4) 用锚定酶切割扩增产物,抽提双标签(Ditga)片段并克隆、测序。一般每一个克隆最少有10个标签序列,克隆的标签数处于10~50之间。
(5) 对标签数据进行处理。在所测序列中的每个标签间以锚定酶序列间隔,如图1中锚定酶采用Nia Ⅲ限制性内切酶,则以CATG/GTAC序列确定标签的起始位置和方向。图1 基因表达系列分析(SAGE)示意 锚定酶(AE)和标签酶(TE)是NiaⅢ、FokI X和O分别表示不同标签的核苷酸顺序 由于双标签体的长度基本相同,不会导致扩增的偏态性,同时数量和种类极大的转录物使同一种标签连接成双标签体的可能性极小,这保证了克隆中的每一个标签代表一种转录物在当前细胞状态下的一个单位的转录产物,因此通过计算机软件的分析能够得到上千种基因表达产物的标签序列以及丰裕度。
虽然SAGE技术能够尽可能全面地收集生物组织的基因表达信息,但也不能完全保证涵盖所有的低丰度的mRNA。另外标签体的连接可能因接头的干扰造成克隆所包含的标签体过少和克隆序列末端不能高效地连入载体。Powell利用磁性生物素珠特异吸附引物,避免了接头的干扰(Powell 1998)。
欢迎分享,转载请注明来源:品搜搜测评网