科学网

 找回密码
  注册

tag 标签: wheat

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

Nature Genetics发表文章解析现代小麦的起源
mashengwei 2019-5-2 17:31
Nature Genetics发表文章解析现代小麦的起源 5月1号Nature Genetics发表了两篇小麦的文章。前几天我们还念叨着一篇文章即将在NG发表( 厉害了|小麦大规模外显子测序 ),没成想在五一假期的第一天就上线了,而且还是双黄蛋,其中一篇“ Exome sequencing highlights the role of wild-relative introgression in shaping the adaptive landscape of the wheat genome ”,我们已邀请一作贺飞给我们介绍这篇文章。今天我们要说的的是另外一篇文章“ Tracing the ancestry of modern bread wheats ”。 简介 利用外显子组测序技术从全世界范围内选出的大约500个小麦品种进行基因分型,来探索10000年的杂交、选择、适应和植物育种如何塑造了现代面包小麦的基因组成。 在基因、染色体和亚基因组水平上观察到大量的遗传变异,并利用这些信息来破译现代小麦的可能起源、迁移以及自驯化以来选择的等位基因变异。 我们的数据支持先前的小麦进化模型(reconciled model of wheat evolution),并为未来的育种改良提供了新的途径。 背景 面包小麦具有三个密切相关的亚基因组(AABBDD)组成的异源六倍体基因组。 它被认为起源于两次多倍化事件: 第一次是野生四倍体小麦(Triticum urartu Tumanian ex Gandilyan,AA)与未发现的节节麦(Aegilops speltoides Tausch)谱系(BB)杂交形成的四倍体,距今约50万年; 第二次是原始四倍体杂种(AABB)与野生二倍体节节麦(DD)杂交形成的六倍体,约10,000 年。 考古植物学的证据表明,由此产生的六倍体小麦是在从以色列、约旦、黎巴嫩、叙利亚到土耳其东南部、伊拉克伊朗的西部一个地区新月沃土被驯化的。 因此,现代栽培的面包小麦是至少一万年来人类在驯化和栽培(改良和繁殖)过程中选择的产物。 今天,它们包括适应各种环境的高产品种,从尼日利亚、澳大利亚、印度和埃及的低湿度地区到南美洲等高湿度地区。 结果 为了探索目前可获得的小麦基因库中存在的遗传多样性的起源和模式,我们构建了一个由分布在全世界范围内的487个小麦材料组成的群体,包括野生二倍体和四倍体近亲、驯化的四倍体和六倍体地方品种、古老品种和现代优良品种。 将这些品系的外显子组捕获序列数据映射到中国春参考基因组序列,发现了620,158个高可信度遗传变异,分布在41,032个小麦基因上。 该变异数据集提供了小麦基因组多样性在不同尺度(基因、区域、染色体和基因组)的全面综述,并代表了丰富的遗传信息来源,可供学术界和农业研究界利用。 系统发育和主成分分析(PCAs)揭示了三个主要因素驱动文中所使用小麦品系的多样性分区(图2) : 春化要求(冬季 vs 春季) ,历史群体(i 至 IV,最古老到最新: 从古老的地方品种到现代精英品系)和地理起源(欧洲,亚洲,大洋洲,非洲和美洲)(图2a )。 在基于大小、代表性和统计支持度选择的11个主要树支中,单系保护的排列检验证实了这三个因子的强大作用( P   1 × 10^˗6^)。 然而,系统发育的深层结构主要围绕大陆差异,随后由于现代小麦育种实践中对产量的强烈选择导致生长习性性状(如春化要求)的近期变化。 国家和大陆同时叠加在系统发育群上表明,所观察到的遗传多样性主要是沿着东西轴构成的,与人类迁出新月沃土的既定路线相一致。 两条通往西欧的道路沿着一条内陆路线(经过安纳托利亚和巴尔干到中欧)和一条沿海路线(经过埃及到马格里布和伊比利亚半岛) ,辅之以东北和内亚山走廊的另外两条路线,随后在美国、大洋洲和非洲领土上又发生了殖民活动(图2b )。 接下来探讨了驯化(比较野生小麦和驯化小麦)和育种(比较历史面包小麦类群 i 和 IV)所产生的选择足迹。 为了检测驯化信号,我们计算了来自亚洲的野生二倍体(T.urartu,A.speltoides,A.tauschii)、野生四倍体(T.diccoides)和驯化的六倍体(T.aestivum)小麦的每个位点的核苷酸多样性。 野生小麦祖先和六倍体地方品种之间的对比表明,在小麦的驯化过程中,基因组多样性(ROD)的减少具有很大的异质性(补充图6)。 受到强烈影响的基因组区域(1221) ,显示至少丧失了五分之四的多样性 ,覆盖了9% 的小麦基因组(1.2 Gb)。 已知的驯化基因如脆性穗轴(Brt)、韧性颖片(Tg)、同源配对(Ph)和非自由脱粒性状(Q)位于受到选择的区域内(小于 5Mb)。 有趣的是,已知的驯化基因只占受选择基因组区域的一小部分,这表明进一步的驯化基因仍有待发现。 为了揭示在过去两个世纪中(自1830年以来)小麦改良育种者所选择的基因组区域,我们比较了欧洲研究小组在历史群体 II、 III 和 IV (即那些受到育种影响的群体)与群体 I (地方品种)的多样性减少统计数据(图3a)。 我们的结果与两轮主要的多样性减少是一致的,第一波在第 I和第 II 组之间(11.7% 的多样性减少) ,反映了早期的育种改良。第二波在第 III 和第 IV 组之间(13.3% 的多样性减少) ,反映了绿色革命期间的育种实践(即从1950年到1960年代后期开始的农业实践的更新)。 现代小麦品种与I类相比,核苷酸多样性平均损失21.8% ,染色体内和染色体之间变异很大(图3 b)。 与 D 亚基因组(中位数 多样性减少 为5.8%)相比,A亚基因组(中位数多样性减少为33.2%)和B亚基因组(中位数多样性减少为28.0%)似乎更强烈,这可能反映了它们对小麦改良的不同贡献(图3a)。 为了确定小麦育种者选择的遗传标记和区域,我们对所有样本进行了全基因组扫描,以考虑群体内部和群体之间的渐进群体结构,并在欧洲和亚洲样本中分别以较高的粒度(granularity)进行扫描。 我们确定了5,089个多态位点显示改善信号( P   0.0001)。 已知基因包括光周期敏感基因(Ppd)和春化基因(VRN)、矮化基因(Rht)、谷蛋白(Glu)和醇溶蛋白(Gli)基因、卷曲圆锥花序基因(FZP)、粒数基因(GNS)、蜡质基因(Wx)以及驱动植物构型的 都与这些改良信号密切相关(在5 Mb之内)。 大的基因组区域(10 Mb) ,在过去的两个世纪中(在历史的第I和第IV之间)选择似乎已经发生,并最终变得固定,特别是在染色体1A 和两个结构重新排列的染色体4A 和7B 上观察到(图3b)。 将欧洲和亚洲基因型的8,308和9,948个与改良足迹相关的多态位点扩展到超过2 Mb 的重叠窗口,定义了一个950 Mb (基因组的7%)和1.3 Gb (基因组的9%)的基因组空间,这两个地理区域分别具有选择标记。 有趣的是,在欧洲和亚洲种质之间,只有168 Mb的基因组区域的选择特征是相同的。 通过多环境全基因组关联研究(GWAS) ,检验了观察到的等位变异是否与抽穗期和株高这两个关键的生活史性状相关。 我们的调查了四个环境(法国、匈牙利、土耳其和英国)中的435个六倍体小麦基因型的开花期和株高。 我们分别鉴定了48个和40个与开花期和 株高变异显著相关的基因组位点,其中包括已知控制开花期的基因(Ppd,VRN,FDL,WPCL)和影响株高的Rht基因等。 目前的数据可以为从目前未知的位点中识别相关候选基因以进行功能验证提供了基础,例如在2A染色体上检测到的主要开花期关联的位点,其中 Cry (隐花色素)基因是一个推定的驱动因子。 值得注意的是,多样性、选择足迹和 GWAS 分析清楚地表明,只有一小部分同源基因座含有重合信号,这支持了现代六倍体面包小麦具有二倍体遗传行为的观点,正如前面从平行优势选择中得出的结论,选择同时发生在同源基因区域之间很罕见。 最后,利用一个基于网络的系统发育方法重建现代六倍体小麦的网状进化历史。 聚集共识网络(图4a)包括垂直(物种关系)和水平(网状)事件的信号在小麦-山羊草物种复合体。 小麦进化的综合模型(图4b)是深入分析网络的边缘和边缘权重(图4a)之后得出的综合结论得出的,并通过评价替代共识树拓扑等得到支持。 图4b中的模型通过野生二倍体AA和SS(接近BB)杂交产生野生四倍体AABB杂交后代,并与野生二倍体DD基因型杂交产生六倍体AADDBB),大大改进了现代面包小麦的进化路径。 我们的分析证实,小麦B基因组来源于山羊草属(Aegilops)系,该系产生了小麦 s. speltoides (SS) ,而 tauschii 和 T.urartu 的祖先分别代表了D和A基因组系的起源。 T. araraticum (也被称作 T. araraticum Jakubz) 代表了 AAGG 四倍体祖先最接近的野生后代。 它似乎随后被驯化形成 T. timopheevii (Zhuk.) 同时也与 T. boeoticum 杂交,形成 T. zhukovskyi (Menabde Ericzjan)谱系(AAAAGG)。 该模型证实了野生二粒小麦是所有现代四倍体AABB和六倍体AABBDD基因型的现代A和B小麦亚基因组祖先的最近的后代。 我们的数据表明,在驯化和栽培的早期阶段,野生二粒小麦池 T. dicoccoides (Körn. ex Asch. and Graebner) Schweinf 产生了至少两个不同的栽培四倍体谱系, T. dicoccum Schrank ex Schübl. (domesticated emmer, also known as T. dicoccon Schrank) and T. durum Desf. (domesticated durum or hard or pasta wheat)。 最后,该模型支持了这样的假设,即普通小麦最有可能来源于 T. durum 和接近 A. tauschii 的 D 基因组之间的一个祖先杂交事件(图4b)。 随后,在六倍体小麦与四倍体小麦杂交中发现了 T. spelta ,至今仍有 T. dicoccum 渐渗的证据。 其他推定的网状事件 ,少于3个证据支持,需要进一步研究,并没有纳入我们的进化模型(图4b)。 网状进化场景在驯化期间和之后首先建立了一个基本的六倍体面包小麦基因库α(图4a, α community)。 这可能包括起源于新月沃土的原始小麦地方品种,并衍生了两个六倍体群落β和γ(图4a),γ集群主要包括来自西欧的现代基因型,即1986年或更晚的品系主要由小麦品种和当前品种组成,β集群主要包括在东欧国家的一些材料,即冷战期间属于华沙条约组织的国家。 这两个现代群体(β和γ)在进化史上的明显分离可能反映了人类历史和由此产生的社会经济后果如何影响了现代小麦种质的遗传构成,β基因型今天仍在匈牙利和乌克兰种植,而γ基因型在欧洲联盟的许多地区仍占主导地位。 讨论 面包小麦的进化来源于其二倍体和四倍体的祖先,包括大规模和反复的杂交和基因流动事件, T. durum 是当今面包小麦种质资源最可能的祖先。 这种复杂的杂交和基因流动解释了在基因组尺度上观察到的多样性分配(D亚基因组贫乏) ,并支持这样的观点,即现代六倍体小麦在遗传上和表型上表现为类似二倍体的特征,只有一小部分同源基因位点同时具有驯化、选择等信号。 现代面包小麦起源于约10,000年前的新月沃土,今天在小麦基因库中观察到的变异是在人类迁徙、人为选择和后来的育种驯化过程中形成的。 重要的是,在气候变化加速期间,适应新环境的标志仍然是备受关注的研究课题,我们的选择性扫描分析和 GWAS 都强调了未来基因和 / 或等位基因发现的目标。 我们在这里报告的数据和种质收集,以及我们提供给更广泛的研究团体的数据和种质收集,代表了遗传多样性的丰富来源,可以应用于理解和改善多样性,从环境适应到抗病性和营养物质利用效率。
13803 次阅读|0 个评论
错过就可惜了 | NCBI blast 结果页面更新啦
mashengwei 2019-4-27 15:30
错过就可惜了 | NCBI blast 结果页面更新啦 先吐槽下题目的前半段,这是标题党。 废话不多数,看图说话。 image-20190427151813607
4816 次阅读|0 个评论
小麦有关的会议摘要——第十九届国际动植物基因组学大会
mashengwei 2019-1-11 17:20
小麦有关的会议摘要——第十九届国际动植物基因组学大会 摘要网址 https://plan.core-apps.com/pag_2019/. 打开下面这个网址( https://plan.core-apps.com/pag_2019/search?query=WHEAT )就是与小麦有关的摘要等。 大概浏览了一些,今年随着小麦基因组的发表,很多和小麦有关的在线网站出现。另外一个感受就是现在小麦研究正有蓝海向红海转变,特别是与基因组学领域。以前我们可以按部就班的做研究,竞争很少。现在再看,哪怕以前没有小麦研究基础的课题组,也能快速切入到小麦研究中。随着组学数据的增多,我们要善于利用这样的数据来加速我们的研究。 下面我们以截图的形式给大家展示,具体信息还请上网站查询。 image-20190111093933119 image-20190111094253568 image-20190111094517087 image-20190111094644862 image-20190111094809539 image-20190111094917423 image-20190111095003864 image-20190111095101864 image-20190111095206424 image-20190111095312828 image-20190111095441186 image-20190111095529206 image-20190111095612238 image-20190111095807686 image-20190111095857250 image-20190111095947651 image-20190111100031724 image-20190111100129566 image-20190111100210813 image-20190111100309608 image-20190111100359741 image-20190111100447689 image-20190111100532675 image-20190111100654871 image-20190111100733299 image-20190111100847934 image-20190111100953970 image-20190111101129268 image-20190111101219488 image-20190111102346128 image-20190111102505067 image-20190111102650579 image-20190111102753042 image-20190111102944124 image-20190111103128209 image-20190111103300513 image-20190111103401854 image-20190111103512852 image-20190111103604665 image-20190111105045913 image-20190111105552328 image-20190111105501267 image-20190111105649196 image-20190111105754772 image-20190111105901201 image-20190111110000186 image-20190111110143339 image-20190111110459425 image-20190111110550452 image-20190111110631426 image-20190111110714600 image-20190111110812027 image-20190111110842139 image-20190111110939152 image-20190111111052652 image-20190111111205774 image-20190111111358120 image-20190111111443884 image-20190111111653487 image-20190111114832235 image-20190111114918242 image-20190111115038956 image-20190111115119310 image-20190111115633934 image-20190111115756711 image-20190111115901880 image-20190111120047200 image-20190111120118812 image-20190111120217279 image-20190111120359641 image-20190111120558390 image-20190111120653823 image-20190111120821836 image-20190111145839850 image-20190111145957558 image-20190111150133898 image-20190111150309543 image-20190111150406032 image-20190111150504607 image-20190111150558676 image-20190111150653506 image-20190111150802404 image-20190111150930640 image-20190111151015325 image-20190111151153562 image-20190111151257317 image-20190111151410683 image-20190111151516527 image-20190111151639093 image-20190111151742327 image-20190111151840725 image-20190111151931346 image-20190111152141768 image-20190111152246969 image-20190111153244405 image-20190111153408247 image-20190111153504274 image-20190111153600445 image-20190111153714944 image-20190111153803302 image-20190111153906634 image-20190111154023820 image-20190111154128504 image-20190111154348179 image-20190111154450978 image-20190111154848685 image-20190111154939267 image-20190111155121248 image-20190111155232716 image-20190111155403622 image-20190111155519009 image-20190111155646851 image-20190111155759688 image-20190111155900342 image-20190111160025028 image-20190111160125894 image-20190111160708183 image-20190111160955419 image-20190111161126024 image-20190111161558969 image-20190111161743210 image-20190111161859313 image-20190111162038442 image-20190111162129183 image-20190111162300182 image-20190111162346839 image-20190111162509835 image-20190111162753521 image-20190111162839949 image-20190111162929407 image-20190111163035041 image-20190111163142337 image-20190111163429365 image-20190111163527863 LOGO End
4252 次阅读|0 个评论
[转载]中国春甲基化数据
mashengwei 2018-11-27 15:57
中国春甲基化数据 表观遗传学中,甲基化的研究是重要的一块研究内容。最近小麦品种中国春的参考基因组在science杂志上发表。文章中有甲基化的数据,为了让大家在实际研究过程中方便的使用这个数据,我们特别邀请了中国农大的郭伟龙团队进行了数据的分析和处理,并最终呈现在我们小麦多组学网站上。下面我们具体介绍下这块内容。 1 数据来源: NCBI登录号 SRP133674 , 文章:Shifting the limits in wheat research and breeding using a fully annotated reference genome 取材时期 Cytosine methylation was profiled in DNA extracted from two-week old CS leaf tissue in three different contexts: CpG dinucleotides, CHG and CHH (where H corresponds to A, T or C). The frozen leaves from the five samples at 3-leaf stage (Zadok stage 13) were ground and divided as input for the preparation of both RNA-seq libraries (detailed in Chinese Spring tissues study) and whole genome bisulfite sequencing (WGBS) libraries. 2 结果描述 前面我们提到了这些数据来自science杂志上的中国春参考基因组。下面我们就总结下这篇文章中甲基化方面的结果。 Wheat DNA methylation frequency of cytosines in the sequence contexts of CpG (average 92.7%), CHG (average 51.3%) and CHH (average 2.7%). The observed levels of cytosine methylations are among the highest observed in angiosperms (161), likely reflecting the abundance of repetitive elements throughout the wheat genome. Methylation patterns in wheat largely follow those observed in other species, showing enrichment in CpG and CHG sequence contexts at pericentromeric regions (gene poor) and depletion toward the chromosome ends (gene rich). 首先看一看high confidence genes的甲基化pattern。如下图所示,在基因编码区相对较低,CpG和CHG而在上有启动子和下游则相对较高。而CHH则相对较平稳。大家分析自己的基因时可以看看是否属于这个pattern。 high confidence genes ​ (TSS = transcription start site; TTS = transcription termination site) High rates of DNA methylation likely serve to prevent transposition by restricting the expression of transposable elements. However, where repetitive elements are proximal to gene sequences, the enriched methylation can perform a regulatory function, predominantly silencing expression. The distinct and highly conserved methylation patterns observed in regions of HC genes and their regulatory regions showed higher levels of DNA methylation associated with the 5’ regulatory regions in all contexts that diminished rapidly at the transcriptional start site (TSS). 而low confidence (LC) genes的甲基化pattern又是如何呢?如下图,3种类型都相对平稳。 ​ (TSS = transcription start site; TTS = transcription termination site) DNA methylation increased in the gene body where the CpG methylation formed a peak, whereas gene body methylation levels remained at extremely low levels at CHG and CHH sites. In the 3’ regulatory region after the transcriptional termination site (TTS) methylation rapidly reverted to the levels in 5’ sequences. This contrasted with the pattern observed for LC genes, where a near uniform level of methylation was observed in all sequence contexts. As a conclusion, many of the features included in the LC annotation are either no genes, are truncated or have lost their function through mutation (i.e. pseudogenes). 有一点很重要,甲基化也是一个动态变化的过程,不同发育时期,不同环境下都会发生变化。有些结论要辩证的看待。 Copia repeat elements TE序列相对来说甲基化程度要高很多 3 甲基化分析 农大的郭伟龙老师开发了甲基化mapping软件BS-Seeker2(BS-Seeker2: a versatile aligning pipeline for bisulfite sequencing data)以及后续甲基化分析软件CGmapTools(CGmapTools improves the precision of heterozygous SNV calls and supports allele-specific methylation detection and visualization in bisulfite-sequencing data)。 具体的分析流程见 这里 。 需要注意的地方: 1、单条染色体需要拆分成两部分,即使用官方提供的161010_Chinese_Spring_v1.0_pseudomolecules_parts.fasta进行基因组index 2、使用bs_seeker2-call_methylation.py时不要整个基因组一起call methylation,一来速度太慢,二来整个基因组一起会出现bug(其他人有没有还不清楚)。我简单的说下我的测试过程,整个基因组进行call methylation,根据程序提示如果1A部分已经运行完毕,直接停止;分离出1A的bam文件单独对1A进行call methylation;将1A和2A合并到一起call methylation。最后发现,整个基因组call methylation的结果与其它两个均不同;而无论是1A单独还是1A和2A一起call methylation,结果都是相同的。 4 Jbrowse呈现 目前可以在我们网站(http://202.194.139.32)上查询感兴趣基因的甲基化水平。 绿色箭头处可输入转录本名字,如*TraesCS7A02G208100.1* 下面我们看一个例子。GS5基因在水稻中控制水稻的粒形和粒重,在小麦里中GS5(TraesCS3A02G212900LC, TraesCS3B02G277100LC和TraesCS3D02G172900)也已经被多个课题组同源克隆,其中3B基因有两处大插入,破坏了基因结构。从甲基化水平上来看,两处插入序列的甲基化水平较高(如下图)。 TaGS5 最后再强调一点,这里的甲基化是苗期叶片中的,不代表其他组织中的甲基化水平一定也是这样。
2013 次阅读|0 个评论
使用salmon和sleuth进行小麦RNA-seq差异表达分析
mashengwei 2018-9-27 18:15
blast大家一定熟悉吧, 最近有大神爆出一个bug。也即参数“-max_target_seqs”并不是你理解的那样。下图红色箭头处是NCBI上的设置选项。根据NCBI的官方文件,这个选项是返回前N个最匹配的结果。如果我们设定为1,则表示返回数据库中最匹配的那个。但实际上却不是,该选项意味着返回数据库中第一个匹配良好的结果(simply returns the first good hit found in the database, not the best hit as one would assume )。据说该bug最早在2015年被发现,但是迄今NCBI还没有任何改动,哪怕是对“-max_target_seqs”参数所表示的实际意思进行修改。 目前的解决办法就是事后处理,即blast运行完之后再进行筛选。 好了,我们言归正传。上次我们在“ 评估salmon和kallisto在小麦RNA-seq定量中的异同 ”中论证了salmon能够充分区分小麦的同源基因,哪怕只有一个SNP也能够有效区分。同时我们也发现,早期版本的kallisto有重大bug,要尽快升级到最新版本。以前使用kallisto进行定量时,有专门的软件sleuth进行差异表达分析。那么sleuth是何方神圣?sleuth2017年年中被发表在nature methods。谷歌显示至今大约被引用116次。自然要比我们常用的DESeq2,edgeR等软件的准确率要高。 下面我们就就重点谈一谈如何使用这两个软件进行差异基因的表达分析。在实际使用过程中发现,这里边很多坑。特此记录一下。 第一部分 参考转录组 参考转录组也即中国春参考基因组上注释出来的基因序列。参考转录组当然越全面越准确才好。变好总得需要一个过程。目前1.0版本的数据有如下几个不足:首先,基因的3’和5’端比较短,没有到头;第二是,很多基因具有多个转录本,1.0给的比较少;第三,遗漏了不少转录本。 具体到我们手里的数据,我们可以采用以下做法。也即先找出自己数据中的新的转录本和新基因,然后补充进参考转录组进行下面的分析。这样有利于发现,我们数据中独特的转录本或基因。当然了,如果只用中国春1.0的参考转录组,对最终的结果影响也不大,例如,功能富集分析等。这些比参考转录组多出来的基因,这些新基因往往是功能未知基因,没有保守结构域等,可以根据表达等筛选比较有趣的进行具体的研究。 下面,我们谈一谈如何获取相对中国春1.0的新转录本或新基因。 1 使用STAR将reads映射至中国春参考基因组。这一步也可以使用其他mapping软件,如hisat2, bowtie2, bbmap等。因为处理的样本较多,我这里使用python写了一个循环处理。熟悉shell的也可以写shell脚本。 #!/usr/bin/envpython #-*-coding:utf-8-*- __author__= 'wheatomics' import subprocess with open( 'input.txt' , 'r' ) as f: for line in f: line=line.strip().split() fq1,fq2=line print fq1,fq2 proc=subprocess.Popen( .split( '.' ) , 'SM:' +fq1.split( '/' ) .split( '.' ) , 'PL:ILLUMINA' , '--outFileNamePrefix' ,fq1.split( '/' ) .split( '.' ) ],shell= False ) proc.wait() #注意这个参数--outSAMmapqUnique60,这是为了后面使用GATKcallvariants.如果没有这个需求,可以不用设置,但是如果callvariants又只能将一整条染色体分成两部分。所以不能两全其美。 2 筛选bam文件。这里将bam文件里unmapped的reads去掉;因为,我们的样品来自中国春的叶片,所以大于一个mismatch的reads也去掉;去掉mapping长度小于80的reads;只保留proper pair的reads。 请参考这里吧 https://www.jianshu.com/p/73420cb70548 。科学网对代码支持不是特别好,明明都排好了,提交之后就乱成鬼了。 foriin{CS_CT_1_1,CS_CT_2_1,CS_CT_3_1,ABA1h_1_1,ABA1h_2_1,ABA1h_3_1,ABA12h_1_1,ABA12h_2_1,ABA12h_3_1,ABA24h_1_1,ABA24h_2_1,ABA24h_3_1};dobamutilsfilter$i.sorted.bam$i.filtered.sorted.bam-minlen80-mapped-properpair-mismatch1;done 顺带交代下样本的背景。这里是对中国春叶片外施ABA后,分别在1h,12h,24h取样。每个时间点3个重复。这是我现编的。 3 组装转录本。输入文件是上面筛选过的bam文件。软件使用scallop。scallop是去年发表在nature biotechnology上的一款有参转录本组装软件。 据作者的评测要比过往的软件好。但这并不意味着使用二代测序reads组装出来的转录本就是无比正确的,这一点要铭记,特别是当要针对具体的某条转录本进行研究时。 “On 10 human RNA-seq samples, Scallop produces 34.5% and 36.3% more correct multi-exon transcripts than StringTie and TransComb, and respectively identifies 67.5% and 52.3% more lowly expressed transcripts. Scallop achieves higher sensitivity and precision than previous approaches over a wide range of coverage thresholds.” foriin{CS_CT_1_1,CS_CT_2_1,CS_CT_3_1,ABA1h_1_1,ABA1h_2_1,ABA1h_3_1,ABA12h_1_1,ABA12h_2_1,ABA12h_3_1,ABA24h_1_1,ABA24h_2_1,ABA24h_3_1};doscallop-i${i}.filtered.sorted.bam-o${i}.gtf;done 上述命令运行完之后会产生12个gtf文件。下面要做的就是合并这12个gtf文件中的转录本。这里使用 stringtie —merge命令。 4 合并转录本。其中iwgsc_refseqv1.0_HCandLC.gtf来自官方的注释文件。mergelist.txt包含上述12个gtf文件的名字,每行一个,共12行 。 stringtie--merge-p8-G/data/IWGSCv1.0/iwgsc_refseqv1.0_HCandLC.gtf-omeng_merged.gtf./mergelist.txt 5 与官方注释信息比较,找出新增的转录本或基因。 # 比较 gffcompare-ogffall-r/data/IWGSCv1.0/iwgsc_refseqv1.0_HCandLC.gtfall_merged.gtf # gffcompare命令来自https://ccb.jhu.edu/software/stringtie/gffcompare.shtml # 分离新转录本 gtfcuffpuniqgffall.all_merged.gtf.tmapall_merged.gtf/data/IWGSCv1.0_RefSeq_Annotations/iwgsc_refseqv1.0_HCandLC.gtfall_merged_unique.gtf # gtfcuff命令来自https://github.com/Kingsford-Group/rnaseqtools 6 获取新增转录本的序列。 gffreadall_merged_unique.gtf-gdata/IWGSCv1.0/genome.fasta-wall_merged_unique.fasta # gffread命令来自http://ccb.jhu.edu/software/stringtie/gff.shtml 7 新转录本和中国春参考转录本合并。 catdata/IWGSCv1.0/iwgsc_refseqv1.0_HCandLC.fastaall_merged_unique.fastaall_merged.fasta 至此新转录本获取完毕。下面选取几个与参考转录本比较下 。 上图显示了与参考基因组不同的转录本 新基因,这里也有TGAC的转录本支持 第二部分 基因定量 基因的定量使用salmon这个软件。使用的转录本就是上述我们合并而成的。 # index salmonindex-p4-tall_merged.fasta-iall_merged_salmon_index # 定量 foriin{CS_CT_1_1,CS_CT_2_1,CS_CT_3_1,ABA1h_1_1,ABA1h_2_1,ABA1h_3_1,ABA12h_1_1,ABA12h_2_1,ABA12h_3_1,ABA24h_1_1,ABA24h_2_1,ABA24h_3_1};dosalmonquant-iUall_merged_salmon_index-lA-1../clean/${i}_1_clean.fq.gz-2../clean/${i}_2_clean.fq.gz-p8--numBootstraps100-o${i}_quant;done # 参数--numBootstraps100一定要放上 # 将生成的*_quant文件夹统一放到salmon_result文件夹下面 mkdirsalmon_result mv*_quantsalmon_result/ 至此,定量部分完成 第三部分 差异表达分析 这里使用sleuth。sleuth本来是为kallisto量身定制的,如果salmon想使用sleuth进行差异表达分析,则需要一个R包(wasabi)进行转换。 1 安装wasabi #地址https://github.com/COMBINE-lab/wasabi source ( http://bioconductor.org/biocLite.R ) biocLite( devtools ) #onlyifdevtoolsnotyetinstalled biocLite( COMBINE-lab/wasabi ) 或者使用 conda install r-wasabi 安装 2 结果转换 library (wasabi) sfdirs-file.path( salmon_result ,c( CS_CT_1_quant , CS_CT_2_quant , CS_CT_3_quant , ABA1h_1_quant , ABA1h_2_quant , ABA1h_3_quant , ABA12h_1_quant , ABA12h_2_quant , ABA12h_3_quant , ABA24h_1_quant , ABA24h_2_quant , ABA24h_3_quant )) prepare_fish_for_sleuth(sfdirs) 3 使用sleuth进行差异表达分析 # 这里需要一个分组信息文件“sample_infor.txt”,如下格式,两列。注意第一列的顺序要按字母顺序排列 samplecondition ABA1h_1ABA1h ABA1h_2ABA1h ABA1h_3ABA1h ABA12h_1ABA12h ABA12h_2ABA12h ABA12h_3ABA12h ABA24h_1ABA24h ABA24h_2ABA24h ABA24h_3ABA24h CS_CT_1CS_CT CS_CT_2CS_CT CS_CT_3CS_CT # 为了获取基因水平的差异,需要一个转录本和基因对应的文件“transcript_gene_relation.txt”。文件包括两列,第一列是转录本名字,第二列是基因名字。 transcript_idgene_id TraesCS1A01G425600.1TraesCS1A01G425600 TraesCS1A01G425700.1TraesCS1A01G425700 TraesCS1A01G425800.1TraesCS1A01G425800 TraesCS1A01G602400LC.1TraesCS1A01G602400LC TraesCS1A01G602500LC.1TraesCS1A01G602500LC 我们这里是按时间点取样,可以按照时序分析,不必进行两两比较。 library (sleuth) #加载包 library (splines) #加载包 sample_id-dir(file.path( . , salmon_result )) #加载salmon_result下的文件夹 sample_id #显示有多少样品 kal_dirs-file.path( . , salmon_result ,sample_id) kal_dirs s2c-read.table(file.path( . , sample_infor.txt ),header= TRUE ,stringsAsFactors= FALSE ) s2c-dplyr::select(s2c,sample=sample,condition) s2c-dplyr::mutate(s2c,path=kal_dirs) s2c #注意查看是否一一对应,这个地方一不小心会出现对应错误。也即为啥要求sample_infor.txt里要按第一列排序的原因。 design-model.matrix(~- 1 +factor(c( 1 , 1 , 1 , 2 , 2 , 2 , 3 , 3 , 3 , 4 , 4 , 4 ))) #此处的design我不是十分确定是否准确? colnames(design)-c( CS_CT , ABA1h , ABA12h , ABA24h ) design t2g-read.table(file.path( . , transcript_gene_relation.txt ),header= TRUE ) t2g-dplyr::rename(t2g,target_id=transcript_id,gene_id=gene_id) so-sleuth_prep(s2c,full_model=design,num_cores= 1 ,target_mapping=t2g,aggregation_column= 'gene_id' ,extra_bootstrap_summary= TRUE ,read_bootstrap_tpm= TRUE ,gene_mode= TRUE ) #参数num_cores=1一定要设为1,不然会报错。 #如果读取出现错误,可能是因为R包rhdf5的问题,即wasabi和sleuth依赖的rhdf5不同。我这里采取的策略就是分别安装在不同环境里了。或使用condainstall--channelbiocondar-sleuth。将wasabi安装在wasabi环境里,condacreate-nwasabir-wasabi。这个环境与sleuth的环境不同 so-sleuth_fit(so) so-sleuth_fit(so,formula=~ 1 ,fit_name= reduced ) so_lrt-sleuth_lrt(so, reduced , full ) models(so_lrt) sleuth_table-sleuth_results(so_lrt, 'reduced:full' , 'lrt' ,show_all= FALSE ) sleuth_significant-dplyr::filter(sleuth_table,qval= 0.05 ) head(sleuth_significant) write.csv(sleuth_table, CS_ABA_sleuth_gene_level.csv ,row.names= TRUE ,quote= TRUE ) write.csv(sleuth_significant, CS_ABA_sleuth_significant_gene_level.csv ,row.names= TRUE ,quote= TRUE ) sleuth_matrix-sleuth_to_matrix(so_lrt, 'obs_norm' , 'scaled_reads_per_base' ) head(sleuth_matrix) write.csv(sleuth_matrix, CS_ABA_sleuth_tpm_norm_gene_level.csv ,row.names= TRUE ,quote= TRUE ) 我们也可以进行两两比较 #首先要明确的是,是那些样本之间进行两两比较。此处是:CS_CTvsABA1h,CS_CTvsABA12h,CS_CTvsABA24h,ABA1hvsABA12h,ABA1hvsABA24h,ABA12hvsABA24h。共六组 library (sleuth) #加载包 library (stringr) #加载包 sample_id-dir(file.path( . , salmon_result )) #加载salmon_result下的文件夹 kal_dirs-file.path( . , salmon_result ,sample_id) s2c-read.table(file.path( . , sample_infor.txt ),header= TRUE ,stringsAsFactors= FALSE ) s2c-dplyr::select(s2c,sample=sample,condition) s2c-dplyr::mutate(s2c,path=kal_dirs) s2c #注意查看是否一一对应,这个地方一不小心会出现对应错误。也即为啥要求sample_infor.txt里要按第一列排序的原因。 t2g-read.table(file.path( . , transcript_gene_relation.txt ),header= TRUE ) t2g-dplyr::rename(t2g,target_id=transcript_id,gene_id=gene_id) #下面的语句进入两两比较 a-list(c( CS_CT , ABA1h ),c( CS_CT , ABA12h ),c( CS_CT , ABA24h ),c( ABA1h , ABA12h ),c( ABA1h , ABA24h ),c( ABA12h , ABA24h )) for (xxx in a){ s2b-dplyr::filter(s2c,condition==xxx |condition==xxx ) so-sleuth_prep(s2b,~condition,num_cores= 1 ,target_mapping=t2g,aggregation_column= 'gene_id' ,extra_bootstrap_summary= TRUE ,read_bootstrap_tpm= TRUE ,gene_mode= TRUE ) so-sleuth_fit(so) so-sleuth_fit(so,formula=~ 1 ,fit_name= reduced ) so_lrt-sleuth_lrt(so, reduced , full ) models(so_lrt) sleuth_table-sleuth_results(so_lrt, 'reduced:full' , 'lrt' ,show_all= FALSE ) sleuth_significant-dplyr::filter(sleuth_table,qval= 0.05 ) head(sleuth_significant) write.csv(sleuth_table,str_c(xxx , vs ,xxx , _sleuth_gene_level.csv ),row.names= TRUE ,quote= TRUE ) write.csv(sleuth_significant,str_c(xxx , vs ,xxx , _sleuth_significant_gene_level.csv ),row.names= TRUE ,quote= TRUE ) sleuth_matrix-sleuth_to_matrix(so_lrt, 'obs_norm' , 'tpm' ) head(sleuth_matrix) write.csv(sleuth_matrix,str_c(xxx , vs ,xxx , _sleuth_tpm_norm_gene_level.csv ),row.names= TRUE ,quote= TRUE ) } sleuth还提供了一些画图函数,有兴趣的可以自行尝试。 PCA samples_density sleuth结果里只提供了q value 来筛选差异表达基因,没有倍数变化的结果。这里可以使用excel自行进行计算。 计算 Fold change(倍数变化),十分简单粗暴的方法,计算方法如下: E = mean (group1) B=mean (group2) FC= (E-B) / min (E, B) 基因 A 和基因 B 的平均值之差与两者中较小的比值。选择 2-3 倍的基因作为差异表达基因即可。可以根据具体数据,斟酌使用。 提供一个小麦里的文献作为参考吧。今年Cristobal Uauy在BMC Plant Biology上以通讯作者发表的文章,题目是“Ubiquitin-related genes are differentially expressed in isogenic lines contrasting for pericarp cell size and grain weight in hexaploid wheat”。 BMC Plant Biology
5843 次阅读|0 个评论
统计序列中的gap位置和大小
mashengwei 2018-8-3 15:34
支持python3,可用来统计基因组上的gap位置,gap大小。输出格式是gff3。当然根据需要修改print那一行可以输出bed等格式 使用格式如下: python3 getgaps.py genome.fasta gaps.gff3 #!/usr/bin/envpython3 #thiscodewaschangedbasedonbiostarhttps://www.biostars.org/p/152592/ #Importnecessarypackages import argparse import re from Bio import SeqIO #Parsecommand-linearguments parser=argparse.ArgumentParser() parser.add_argument( fasta ) args=parser.parse_args() #OpenFASTA,searchformaskedregions,printinGFF3format with open(args.fasta) as handle: i= 0 for record in SeqIO.parse(handle, fasta ): for match in re.finditer( 'N+' ,str(record.seq)): i=i+ 1 print (record.id, . , gap ,match.start()+ 1 ,match.end(), . , . , . , Name=gap +str(i)+ ;size= +str(match.end()-match.start()),sep= '\\t' ) #usethefollowingatCMD:FILENAME.pyFILENAME.fastaFILENAME.gff3here
8407 次阅读|0 个评论
获取目标染色体区间内的基因和候选基因的筛选策略
mashengwei 2018-7-30 09:31
现在小麦做正向遗传要方便很多了。标记开发不是问题,反而表型是关键。 将基因定位到某一区间后,除了开发标记往往还需要先看一看目标区间里的基因有没有疑似的候选基因。 那么如何快速获取候选区间内的基因呢? 今天我们介绍两种方法。以我们上周介绍的 TaHdm605 的介绍为例( 普通小麦花期调控基因TaHdm605的精细定位 )。该基因的旁侧标记是M27 和M310,序列如下。 M310 GCAATGGTTATCTACATTGGAATACAGGTGAGAAAAACGACA M27 ATTACCATCAATTGCGTTATGTGCGGAAGTGTTATCAGAATA 以上述两个标记为查询序列blastn中国春1.0基因组(http://202.194.139.32/blast/viroblast.php)。根据两个标记所在物理位置确定候选区间chr3D:507019954..508810210。也即候选区间大概是1.79Mb。 知道了染色体区间,我们有两种方法获取区间内的候选基因。先说第一种,基于JBrowse,网址如下。 http://202.194.139.32/jbrowse/?data=Chinese_Springloc=chr3D%3A507020681..508810937tracks=IWGSCv1.0_HighConf_LowConf_genehighlight= 打开上述地址,即可看到区间内的所有基因。复制区间chr3D:507019954..508810210,按照下图所示操作即可。 复制之后粘贴到excel里,按照第三列排序,选择mRNA所在的行,继续整理之后即可获取区间内的基因,最终格式如下图所示。注意此方法同时也获取了基因的功能注释信息。 第二种方法需要在下面的地址里下载三个文件。 https://urgi.versailles.inra.fr/download/iwgsc/IWGSC_RefSeq_Annotations/v1.0/ 这里面的所有文件建议都下下下来,好好看。 本次需要下载的文件是 iwgsc_refseqv1.0_HighConf_2017Mar13.gff3.zip,iwgsc_refseqv1.0_LowConf_2017Mar13.gff3.zip 这俩文件记录了基因的信息,包括这次用到的位置信息。 这个文件里放置的是基因功能注释信息。iwgsc_refseqv1.0_FunctionalAnnotation_v1.zip 到此本文的主要任务完成。类似的操作也可以获取目标区间里的其他类型的数据。写完这一部分我才发现去年10月份我们已经介绍过了《 如何根据标记框定的区间查询区间内的基因 》。不过时至今日,还是有些变化,大家灵活掌握吧。 下面我们简略的谈一谈如何进一步缩小区间内的候选基因数量。 首先看区间的基因,是否包括功能已知的基因,可以看在水稻、拟南芥等植物中的同源基因是否被报道过。我们以前介绍过Rht24的例子,就可以锁定基因。 plant journal上看到一篇小麦株高关联分析的文章 , 小麦矮杆基因Rht18不完全解读 。 再次可以根据区间的基因变异信息进行锁定,比较亲本之间,或者自然群体里的变异。jbrowse上面有很多材料的变异信息可以利用。 还可以继续结合基因的表达信息进一步确定。关于如何获取基因的表达,前面我们也已经介绍过了。基因表达不只是组织表达,根据突变体对环境响应的特点,可以看看在不同处理下候选基因的表达变化情况等。 本次的 TaHdm605 ,作者首先确认目标区间没有已知与抽穗开花有关的基因,然后结合表达信息仍然没有锁定候选基因。 不能锁定在某一些方面来说也是好事,下一步的工作就是看目前区间内突变体和野生型之间的基因或序列差异在什么地方。 除了这些我们还可以使用共表达的方法继续筛选候选基因,如果目标区间内的基因与开花抽穗有关的基因共表达,那么这个基因很可能也与抽穗开花时间有关,进一步通过测序比较突变体野生型之间的序列,进而锁定可能的候选基因。 本例开花抽穗基因中,有些已知基因是转录因子,那么我们就可以预测下目标区间里是否有其靶基因。 现在小麦里有突变体库( 小麦反向遗传学资源库---EMS突变体 ),而且这些突变体已经使用外显子组测序,这个也可以拿来进行候选基因的筛选和功能验证。 另外普通小麦是异源六倍体,一个基因往往有3个拷贝,那么我们也可以比较3个拷贝之间基因序列和基因表达方面的差异情况。 使用“十八般武艺”确定可能的候选基因后,下面就进入了小心求证阶段了。 做类似上面的分析时,也要时刻给自己提个醒,毕竟没有走正儿八经的图位克隆之路,参考基因组与自己使用的材料序列变异较大,参考基因组在目标区间组装出现错误等等因素。如果通过分析不能确定,那就按部就班的走图位克隆的流程。
13809 次阅读|0 个评论
小麦jbrowse数据更新
mashengwei 2018-7-23 23:40
正式开始之前,说一点最近刷屏的假疫苗事件。2016年4月份济南发生疫苗质量安全事件,当时我们的总理做过批示,要严肃彻查处理,绝不姑息。这次又看到总理对疫苗事件的批示还是绝不姑息。也许这次在老大的加持下不会凉凉啦。这次疫苗事件最大的受益者应该是那些进口疫苗吧。难道国外就没有黑心资本家?我想不能没有,只是那些不合格的会被挡在国门之外。现在我们很多物品会出口到美国等发达国家,都是同样的厂子生产的,为啥出口到国外的质量相对就好,而留在国内的质量不过关呢?医药行业应该要严加监管才是,也许是利润最够高,高到可以摆平监管之人吧。也许正应了马克思《资本论》中的一段话, 资本会逃避动乱和纷争,是胆怯的。这淡然是真的,却不是全面的真理。像自然据说惧怕真空一样,资本惧怕没有利润或利润过于微小的情况。一有适当的利润,资本就会非常胆壮起来。只要有10%的利润,它就会到处被人使用;有20%的利润,就会活跃起来;有50%的利润,就会引起积极的冒险;有100%的利润,就会使人不顾一切法律;有300%,就会使人不怕犯罪,甚至不怕绞首的危险。如果动乱和纷争会带来利润,它就会鼓励它们。 我们常常讲一分钱一分货,如果真的这样卖,厂家会倒闭,利润太低没有人会铺你的货。同样的产品不同的品牌,超市一定选择利润高的卖,没什么利润的品牌根本就进不来,久而久之这些有良心品牌就消失了,而那些一分货卖十分钱的品牌却越活越滋润。 马克思的这段话也适用于科研界,为啥大家要不断发论文?难道真有那么多的新发现要迫不及待的告诉大家?如果现在有一套合理的指标能够评价教学能力和成果,并且设定教学的收益要大于论文的收益,那么是不是热衷发论文的人会减少而热衷教学的人会增加?如果研究人员月入10万,还有多少人会夜以继日的发论文?也许穷就是一种病。这种病会让人丢掉理想,失去底线。毕业10年和刚毕业相比,我们失去的是什么?得到的是什么? 现在IWGSC的数据已经公开了(https://urgi.versailles.inra.fr/download/iwgsc/),大家可以下载数据了。 很多数据我们也已经放到我们网站上了,今天我们就说一说本次更新的东西。 1基因注释版本更新到1.1版本 以前的名字是 TraesCS1A 01 G423200 ,现在的名字是*TraesCS1A 02 G423200。名字里加粗的部分就是变化的地方,01表示第一个版本,02表示第二个版本。也即现在的基因注释版本更新到第二个版本了。我们网站的blast数据库和序列调取部分已经进行了更新,同时在jbrowse里也更新了。因此,可以在网站上进行blast,调取基因序列和蛋白序列等操作。 2 基因表达数据更新 随着1.1版本的基因注释信息公开的还有基于这个版本的基因表达数据。也就是expVIP网站(http://www.wheat-expression.com/) 上的所有表达数据可以下载下来了。我们也已经下载下来了,本来想等到放到我们网站后再告诉大家,奈何数据太多,暂时没想到很好的呈现方式,所以这个事情要先缓一缓。不过大家也可以自己下载了使用和分析,下载地址是 \0 iwgsc_refseqv1.1_rnaseq_mapping_2017July20.zip \0 这个数据很重要,如果你的实验已经涉及到基因,就免不了查看基因的表达。这个表达数据的公开实在很良心,让我们更省心。不要再去使用之前那两个旧的小麦表达网站了。 3 品种变异数据更新 本次还有一个比较良心的公开是品种材料的变异数据更新。这个数据我们已经放到jbrowse上了,如下图。 \0 或者输入下面的地址也可以看到, \0 http://202.194.139.32/jbrowse/?data=Chinese_Spring \0 除了这些数据,我们还放了很多其他的变异数据,比如90k的标记,660k的标记,820k的标记等。 \0 今天,我们就着重介绍下我们网站上的jbrowse,也即我们今天的第二部分。jbrowse的入口如下。 1 搜索 jbrowse里可以搜索基因的名字,标记的名字。这包括,普通SSR标记的名字,SNP标记的名字(90k,660k,820k)等,est的登录号,1.1版本的名字,TGACv1版本的基因名字,水稻和拟南芥基因的名字等等。这样,我们只要知道基因的名字就能快速获取其在基因组上的相关信息,省去了blast的时间。碰到没搜到的情况可能是因为数据不全,或者不能比对到基因组上,此时可以自行进行blast判断。 这里也可以输入区间跳转到指定的位置,如chr1B:86774801..86819500。 2 SSR IWGSC1.0上的SSR类型我们已经注释出来了,这样就可以快速根据重复的次数等筛选区间内的SSR,然后获取SSR旁侧的序列在我们的引物设计平台上进行引物设计。这个过程是可以批量进行的,即一次筛选多个SSR和引物设计。 如我们想要获取chr1B:86774801..86819500区间里的SSR并设计引物。 此时,按照下图的操作获取区间内的SSR信息,然后拷贝至excel进行筛选。 \0 筛选之后,记录SSR的染色体,起始位置,SSR的长度,格式如下图。按照此格式粘贴到http://202.194.139.32/PrimerServer/即可设计引物。 \0 至于引物设计我们前面已经说过了,请参考文末链接。 3 群体变异信息 我们收集了普通PCR标记,SNP芯片标记等等,有些标记有群体的分型信息。 下面这张图主要展示了SNP在某基因附近的变异信息,这里以820k芯片为例。我们可以看到不同的SNP所显示的颜色不一样。颜色可以反映变异相对基因所在的位置和变异引起的蛋白序列改变,蓝色表示变异不在基因编码区,绿色表示变异在外显子上但编码的氨基酸为改变,而酒红色则表示引起了氨基酸的改变。还有一种提前终止等变化剧烈的SNP以红色显示,这里图上并没有。 点击SNP即可显示SNP的信息。具体显示的详细信息,见下图。 这里要提醒一点,基于SNP芯片的分型,这里只是根据参考基因组进行了order,由于小麦一个基因往往有3个拷贝,所以有时候显示A的SNP实际上可能在B或D上,这一点要要注意。SNP类的分型方法一般建议使用遗传图谱,而对于后面出现的rna-seq,外显子测序等以测序方法分型的数据,基本可以使用物理图谱的位置进行下一步的关联分型等。 其中“whealbi.minocc10”来自于URGI这次的更新,这个里面共包括487个材料的分型信息。详细信息如下图所示,我想说一下“DP”所表示的意思,DP表示某个位点上所有的reads总数,数值越高,可信度越大。如果此处数字缺失或以“.”表示,则表示此处没有reads支持,则某个材料的分型信息就缺失。 以上就是今天要说的内容,但这些内容往往点到为止,还需要大家自行在网站上探索,遇到问题可以在群里提问。加“wheatgenome”为好友可以入群。 小麦研究联盟倾情打造小麦族多组学数据网站 小麦族多组学数据网站——序列获取 小麦族多组学数据网站——设计基因组特异引物 小麦族多组学数据网站——再说设计引物 在线使用乌尔图基因组 IWGSCv1.0准确性如何? 春化基因VRN1 小麦苗期叶片组蛋白修饰文章导读和应用 基于SNP的PCR标记技术3-高通量dCAPS标记
1360 次阅读|0 个评论
2018年第25周小麦文献汇总(6.24)
mashengwei 2018-6-23 11:47
2018年第25周小麦文献汇总(6.24) 1 Rht8 gene as an alternate dwarfing gene in elite Indian spring wheat cultivars. PLoS One. 2018 Jun 21;13(6):e0199330. doi: 10.1371/journal.pone.0199330. eCollection 2018. PMID:29927977 Author : Grover, Gomti; Sharma, Achla; Gill, Harsimar S; Srivastava, Puja; Bains, N S; 2 Promoter of the TmHKT1;4-A1 gene of Triticum monococcum directs stress inducible, developmental regulated and organ specific gene expression in transgenic Arbidopsis thaliana. World J Microbiol Biotechnol. 2018 Jun 20;34(7):99. doi: 10.1007/s11274-018-2485-9. PMID:29926196 Author : Tounsi, Sana; Feki, Kaouthar; Saidi, Mohamed Najib; Maghrebi, Sahar; Brini, Faical; Masmoudi, Khaled; 3 Phosphorus Acquisition Efficiency Related to Root Traits: Is Mycorrhizal Symbiosis a Key Factor to Wheat and Barley Cropping? Front Plant Sci. 2018 Jun 5;9:752. doi: 10.3389/fpls.2018.00752. eCollection 2018. PMID:29922321 Author : Campos, Pedro; Borie, Fernando; Cornejo, Pablo; Lopez-Raez, Juan A; Lopez-Garcia, Alvaro; Seguel, Alex; 4 Global QTL Analysis Identifies Genomic Regions on Chromosomes 4A and 4B Harboring Stable Loci for Yield-Related Traits Across Different Environments in Wheat (Triticum aestivum L.). Front Plant Sci. 2018 Apr 25;9:529. doi: 10.3389/fpls.2018.00529. eCollection 2018. PMID:29922302 Author : Guan, Panfeng; Lu, Lahu; Jia, Lijia; Kabir, Muhammad Rezaul; Zhang, Jinbo; Lan, Tianyu; Zhao, Yue; Xin, Mingming; Hu, Zhaorong; Yao, Yingyin; Ni, Zhongfu; Sun, Qixin; Peng, Huiru; 5 Annotation and profiling of barley GLYCOGEN SYNTHASE3/Shaggy-like genes indicated shift in organ-preferential expression. PLoS One. 2018 Jun 19;13(6):e0199364. doi: 10.1371/journal.pone.0199364. eCollection 2018. PMID:29920545 Author : Groszyk, Jolanta; Yanushevska, Yuliya; Zielezinski, Andrzej; Nadolska-Orczyk, Anna; Karlowski, Wojciech M; Orczyk, Waclaw; 6 A Sodium Transporter HvHKT1;1 Confers Salt Tolerance in Barley via Regulating Tissue and Cell Ion Homeostasis. Plant Cell Physiol. 2018 Jun 15. pii: 5038889. doi: 10.1093/pcp/pcy116. PMID:29917153 Author : Han, Yong; Yin, Shuya; Huang, Lu; Wu, Xuelong; Zeng, Jianbin; Liu, Xiaohui; Qiu, Long; Munns, Rana; Chen, Zhong-Hua; Zhang, Guoping; 7 Meiotic chromosome stability of a newly formed allohexaploid wheat is facilitated by selection under abiotic stress as a spandrel. New Phytol. 2018 Jun 19. doi: 10.1111/nph.15267. PMID:29916206 Author : Bian, Yao; Yang, Chunwu; Ou, Xiufang; Zhang, Zhibin; Wang, Bin; Ma, Weiwei; Gong, Lei; Zhang, Huakun; Liu, Bao; 8 Detection of CRISPR/Cas9-Induced Genomic Fragment Deletions in Barley and Generation of Homozygous Edited Lines via Embryogenic Pollen Culture. Methods Mol Biol. 2018;1789:9-20. doi: 10.1007/978-1-4939-7856-4_2. PMID:29916068 Author : Kapusi, Eszter; Stoger, Eva; 9 Evidence of cyclical light/dark-regulated expression of freezing tolerance in young winter wheat plants. PLoS One. 2018 Jun 18;13(6):e0198042. doi: 10.1371/journal.pone.0198042. eCollection 2018. PMID:29912979 Author : Skinner, Daniel Z; Bellinger, Brian; Hiscox, William; Helms, Gregory L; 10 Comparative genome-wide mapping versus extreme pool-genotyping and development of diagnostic SNP markers linked to QTL for adult plant resistance to stripe rust in common wheat. Theor Appl Genet. 2018 Jun 16. pii: 10.1007/s00122-018-3113-7. doi: 10.1007/s00122-018-3113-7. PMID:29909527 Author : Wu, Jianhui; Huang, Shuo; Zeng, Qingdong; Liu, Shengjie; Wang, Qilin; Mu, Jingmei; Yu, Shizhou; Han, Dejun; Kang, Zhensheng; 11 Molecular cloning of TaMATE2 homoeologues potentially related to aluminium tolerance in bread wheat (Triticum aestivum L.). Plant Biol (Stuttg). 2018 Jun 15. doi: 10.1111/plb.12864. PMID:29908003 Author : Garcia-Oliveira, Ana Luisa; Benito, Cesar; Guedes-Pinto, Henrique; Martins-Lopes, Paula; 12 Genetic dissection of pre-anthesis sub-phase durations during the reproductive spike development of wheat. Plant J. 2018 Jun 15. doi: 10.1111/tpj.13998. PMID:29906301 Author : Guo, Zifeng; Chen, Dijun; Roeder, Marion; Ganal, Martin; Schnurbusch, Thorsten; 13 Differential response of wheat cultivars to Pseudomonas brassicacearum and take-all decline soil. Phytopathology. 2018 Jun 15. doi: 10.1094/PHYTO-01-18-0024-R. PMID:29905506 Author : Yang, Mingming; Mavrodi, Dmitri; Thomashow, Linda S; Weller, David M; 14 Drought Tolerance during Reproductive Development is Important for Increasing wheat yield Potential under Climate change in Europe. J Exp Bot. 2018 Jun 12. pii: 5036557. doi: 10.1093/jxb/ery226. PMID:29901813 Author : Senapati, Nimai; Stratonovitch, Pierre; Paul, Matthew J; Semenov, Mikhail A; 14 Overexpression of TaCML20, a calmodulin-like gene, enhances water soluble carbohydrate accumulation and yield in wheat. Physiol Plant. 2018 Jun 14. doi: 10.1111/ppl.12786. PMID:29900558 Author : Kalaipandian, Sundaravelpandian; Xue, Gang-Ping; Rae, Anne L; Glassop, Donna; Bonnett, Graham D; McIntyre, Lynne C; ​ \0 \0
2970 次阅读|0 个评论
2018年第24周小麦文献汇总(6.15)
mashengwei 2018-6-16 21:18
2018年第24周小麦文献汇总(6.15) 1 Rotary tillage in rotation with plowing tillage improves soil properties and crop yield in a wheat-maize cropping system. PLoS One. 2018 Jun 14;13(6):e0198193. doi: 10.1371/journal.pone.0198193. eCollection 2018. PMID:29902193 Author : Zhang, Li; Wang, Jing; Fu, Guozhan; Zhao, Yonggan; 2 Drought Tolerance during Reproductive Development is Important for Increasing wheat yield Potential under Climate change in Europe. J Exp Bot. 2018 Jun 12. pii: 5036557. doi: 10.1093/jxb/ery226. PMID:29901813 Author : Senapati, Nimai; Stratonovitch, Pierre; Paul, Matthew J; Semenov, Mikhail A; 3 Overexpression of TaCML20, a calmodulin-like gene, enhances water soluble carbohydrate accumulation and yield in wheat. Physiol Plant. 2018 Jun 14. doi: 10.1111/ppl.12786. PMID:29900558 Author : Kalaipandian, Sundaravelpandian; Xue, Gang-Ping; Rae, Anne L; Glassop, Donna; Bonnett, Graham D; McIntyre, Lynne C; 4 Comparative physiological and metabolomics analysis of wheat (Triticum aestivum L.) following post-anthesis heat stress. PLoS One. 2018 Jun 13;13(6):e0197919. doi: 10.1371/journal.pone.0197919. eCollection 2018. PMID:29897945 Author : Thomason, Kayla; Babar, Md Ali; Erickson, John E; Mulvaney, Michael; Beecher, Chris; MacDonald, Greg; 5 Na+ extrusion from the cytosol and tissue-specific Na+ sequestration in roots confer differential salt stress tolerance between durum and bread wheat. J Exp Bot. 2018 Jun 11. pii: 5035931. doi: 10.1093/jxb/ery194. PMID:29897491 Author : Wu, Honghong; Shabala, Lana; Azzarello, Elisa; Huang, Yuqing; Pandolfi, Camilla; Su, Nana; Wu, Qi; Cai, Shengguan; Bazihizina, Nadia; Wang, Lu; Zhou, Meixue; Mancuso, Stefano; Chen, Zhonghua; Shabala, Sergey; 6 Tapetal-Delayed Programmed Cell Death (PCD) and Oxidative Stress-Induced Male Sterility of Aegilops uniaristata Cytoplasm in Wheat. Int J Mol Sci. 2018 Jun 8;19(6). pii: ijms19061708. doi: 10.3390/ijms19061708. PMID:29890696 Author : Liu, Zihan; Shi, Xiaoyi; Li, Sha; Hu, Gan; Zhang, Lingli; Song, Xiyue; 7 Molecular cytogenetic and morphological characterization of two wheat-barley translocation lines. PLoS One. 2018 Jun 11;13(6):e0198758. doi: 10.1371/journal.pone.0198758. eCollection 2018. PMID:29889875 Author : Ivanizs, Laszlo; Farkas, Andras; Linc, Gabriella; Molnar-Lang, Marta; Molnar, Istvan; 8 Wheat Intercropping Enhances the Resistance of Watermelon to Fusarium Wilt. Front Plant Sci. 2018 May 25;9:696. doi: 10.3389/fpls.2018.00696. eCollection 2018. PMID:29887873 Author : Lv, Huifang; Cao, Haishun; Nawaz, Muhammad A; Sohail, Hamza; Huang, Yuan; Cheng, Fei; Kong, Qiusheng; Bie, Zhilong; 9 Optical Sensing for Evaluating the Severity of Disease Caused by Cladosporium sp. in Barley under Warmer Conditions. Plant Pathol J. 2018 Jun;34(3):236-240. doi: 10.5423/PPJ.NT.11.2017.0247. Epub 2018 Jun 1. PMID:29887779 Author : Oh, Dohyeok; Ryu, Jae-Hyun; Oh, Sehee; Jeong, Hoejeong; Park, Jisung; Jeong, Rae-Dong; Kim, Wonsik; Cho, Jaeil; 10 Identification of nicotianamine synthase genes in Triticum monococcum and their expression under different Fe and Zn concentrations. Gene. 2018 Jun 6. pii: S0378-1119(18)30667-X. doi: 10.1016/j.gene.2018.06.015. PMID:29885462 Author : Du, Xuye; Wang, Huinan; He, Jiefang; Zhu, Bin; Guo, Juan; Hou, Wenqian; Weng, Qingbei; Zhang, Xiaocun; 11 A PSTOL-like gene, TaPSTOL, controls a number of agronomically important traits in wheat. BMC Plant Biol. 2018 Jun 8;18(1):115. doi: 10.1186/s12870-018-1331-4. PMID:29884124 Author : Milner, Matthew J; Howells, Rhian M; Craze, Melanie; Bowden, Sarah; Graham, Neil; Wallington, Emma J; 12 Rational Application of Fertilizer Nitrogen to Soil in Combination With Foliar Zn Spraying Improved Zn Nutritional Quality of Wheat Grains. Front Plant Sci. 2018 May 24;9:677. doi: 10.3389/fpls.2018.00677. eCollection 2018. PMID:29881394 Author : Xia, Haiyong; Xue, Yanfang; Liu, Dunyi; Kong, Weilin; Xue, Yanhui; Tang, Yanyan; Li, Jin; Li, Dong; Mei, Peipei; 13 Analysis of Different Hyperspectral Variables for Diagnosing Leaf Nitrogen Accumulation in Wheat. Front Plant Sci. 2018 May 23;9:674. doi: 10.3389/fpls.2018.00674. eCollection 2018. PMID:29881393 Author : Tan, Changwei; Du, Ying; Zhou, Jian; Wang, Dunliang; Luo, Ming; Zhang, Yongjian; Guo, Wenshan; 14 A newly formed hexaploid wheat exhibits immediate higher tolerance to nitrogen-deficiency than its parental lines. BMC Plant Biol. 2018 Jun 7;18(1):113. doi: 10.1186/s12870-018-1334-1. PMID:29879900 Author : Yang, Chunwu; Yang, Zongze; Zhao, Long; Sun, Fasheng; Liu, Bao; \0 \0
2600 次阅读|0 个评论
小麦叶枯病原菌无毒基因引发了寄主呈现数量遗传的抗性
mashengwei 2018-5-11 09:44
作者:麦夕 今天小编接上回书继续说- 小麦叶枯病原菌在致病力上呈现数量遗传性状 ,最近发表在 New Phytologist 上题为“ A fungal avirulence factor encoded in a highly plastic genomic region triggers partial resistance to septoria tritici blotch ”(在小麦叶枯病原菌基因组可塑区 域中编码的无毒基因触发了寄主对其产生的部分抗性)文章的作者之一Bruce A. McDonald,在病原菌群体遗传学研究领域是大名鼎鼎的人物。  前文介绍说,作者利用3D1×3D7群体通过QTL分析在7号染色体上定位了一个主效QTL,与病原菌的致病力有关。作者利用新的连锁图和菌株3D7完整的基因组将该QTL区间缩小到75Kb,该区间内首先鉴定出4个可能编码外泌蛋白的候选基因。 1)根据转录组数据发现 Zt09_7_00581 和 QTL7_5 是高表达的, 因此首先认定这两个作为最优候选基因做下一步验证,如下图一。 图一   2)通过基因敲除策略验证候选基因真伪。 将候选基因QTL7_5敲除后(分别为3D7∆qtl7_5和3D1∆qtl7_5)发现其在双亲中的致病力都没有变化(见图二);相反, Zt09_7_00581 在菌株3D1中被敲除后表型发生了明显的变化(3D1∆avr3D1),而在菌株3D7中被敲除表型几乎与野生型无异(3D7∆avr3D1),因此判断 Zt09_7_00581 是真正的候选基因(见图三)。 Zt09_7_00581 影响菌株3D1的致病力但不影响菌株3D7,而且该基因缺失后不会影响菌株自身的生长,因此作者认为将该基因属无毒基因,命名为 Avr3D1。 虽然 Avr3D1 能够被寄主识别,但是3D1菌株一反我们所熟知的常态( 正常情况下如果病菌的无毒基因被寄主的R基因识别,会产生较为极端的过敏性坏死反应,导致病菌无法再次侵染寄主 ),依然能够在寄主上成功侵染且产生部分孢子,因此作者认为 Avr3D1 引发了一种数量性状控制的抗病反应。 图二 图三   3)探讨无毒基因 Avr3D1 对应的抗病基因。 作者将3D1野生型菌株和 Avr3D1 缺失的菌株3D1∆avr3D1分别接种到16个小麦品种中,以用来评估Avr3D13D1能否介导专化抗性。如下图四,其中三个品种Estanzuela Federal, Kavkaz-K4500 L.6.A.4 and TE-9111能够引起对Avr3D13D1的专化抗性,其中这三个材料不仅都含有抗病基因 Stb7 ,还可能携带 Stb12 ,由此作者推想 Stb7 和 Stb12 编码的蛋白都可能是识别Avr3D13D1的候选蛋白。 图四  4)无毒基因(效应子) Avr3D1 存在于基因组中一个高度变异的区域。 作者首先通过比较不同的菌株(IPO323、3D7、3D1、1E4和1A5)在该QTL区域的序列发现,该效应子存在于一个布满转座子插入(TE)的区域里。见下图五。 图五 紧接着又在128个菌株中评估了原四个候选基因(Avr3D1、QTL7_5、SSP_3和SSP_4)的单倍型。通过这些菌株中是否含有这四个候选基因的多样性发现,该区域在基因组中具有动态变化的特性。见图六。 图六   5)基因内部哪些碱基的变化能够引起 Avr3D1 规避识别。 作者首先对 Avr3D1 基因进行了进化树分析(图七a),然后又分析了基因的内部结构及上下游500bp范围的序列,发现某些区域是高度保守的,而某些区域又是变异极为明显的,且这是这些变异区域引起了 Avr3D1 丰富的多样性,从而成功规避寄主R基因的识别,正所谓“道高一尺魔高一丈”!   好了,这篇文章就简单说到这里,其实后续还有很多有意思的工作开展,比如从蛋白质水平上就可以继续研究,也可以从互作的角度继续探讨。文章虽然做病菌,但是对于我们小麦来讲也有启发,尤其是基因的进化和单倍型多态性研究上。
2637 次阅读|0 个评论
the plant journal:一个新的与大麦耐旱相关的microRNA
mashengwei 2018-5-2 08:50
小麦族多组学数据网站——序列获取 5/2 本期作者 Neal 眨眼五一假期已过,其实很大一部分做小麦的往往没有五一假期。今天我们想要说一说与microRNA的话题。前面我们谈过一些microRNA的话题,我整理了一下列在下面,感兴趣的可以去看看,也欢迎大家就small RNA方面的内容与我们交流。 今天要谈的这篇文章前几天刚刚在plant journal在线。文章的题目是“ Identification and characterisation of a previously unknown drought tolerance—associated microRNA in barley ”。作者系澳大利亚常春藤名校联盟“八大名校”之一的阿德莱德大学(The University of Adelaide )。通讯作者是 Shi Bujun , 第一作者是 Zhou Hui 。文章的DOI是 10.1111/tpj.13938 ,输入DOI可在网站sci-hub.tw上下载。 本文是一个反向遗传的例子,不像图位克隆这样正向遗传的文章,一换扣一环,逻辑方面较简单,文章阅读起来也相对容易,貌似小麦里图位克隆也比较简单,文章所呈现出来的内容也是行云流水。实际上在小麦做图位克隆并不简单,图位克隆过程中很多的曲折实际上很少会在文章中有所呈现。而反向遗传学方面,也即基因功能和机制的方面研究,很大程度上需要转基因技术和基因编辑技术,这才是反向遗传学的硬通货。除此之外,一些必要的点缀也是需要的,毕竟红花还得绿叶配。从一个简单的idea到最终论文里呈现的完美故事,统领整个研究的是逻辑思维能力,这才是一篇论文研究的灵魂所在。反向遗传学对逻辑方面的能力要求要比正向遗传学高。今天我们就以这一篇文章为例谈一谈。 首先先从文章的干货开始谈起。过表达hvu-miRX的大麦植株耐旱性与对照相比得到提高,表型见下图,文中也对一些耐旱性的指标进行了评价,结果也是阳性的。可能只是先在线的原因,图片里的文字看不清楚。 现在我们知道miRNA是通过剪切靶基因的转录本而行使生物学功能的,在表达水平上往往成相反的趋势,也即当miRNA的表达量升高时,靶基因的表达量就降低,反之亦然。这里为了行文的方便,miRNA和靶基因之间的关系做了简单化处理。在这里hvu-miRX的靶基因之一是编码NAD(P)-binding domain的基因,该基因的表达水平在过表达hvu-miRX的大麦里与对照相比降低了,这符合我们的预期。但是该基因不受干旱诱导。文中没有对此作出解释,其实我们可以做这样一个假设,含有NAD(P)-binding domain的基因负调控大麦的抗旱性。大家认为这个假设对不对呢?同时文中回避了过表达hvu-miRX的大麦在干旱处理过后,该靶基因的表达水平。所以hvu-miRX是否真的通过这个靶基因来提高大麦对干旱的耐受性还没有一锤定音,也即不能排除其他未知的途径。大家可以进一步思考下,如果要验证这个假设需要安排哪些实验呢?其实我认为这才是文章的亮点所在,然而本文并没有更进一步。 说完了转基因,我们再谈一谈这个研究的来龙去脉。这就不得不提2011年的两篇研究,一篇是在组学水平上鉴定大麦的miRNA( Discovery of barley miRNAs through deep sequencing of short reads ),另外一篇发现在过表达TaDREB3的大麦里有一个miRNA与对照相比上调表达( Improvement of stress tolerance of wheat and barley by modulation of expression of DREB/CBF factors ),同时过表达TaDREB3的大麦对干旱的耐受性增加。这是为啥本篇为啥要研究miRX。我们前面提到也有过表达miRX的大麦,但文中作者没有提到是否DREB3的表达是否受miRX调控,也许因为DREB3并不是miRX的靶基因吧。这其实也是一种常见的研究思路,先广撒网,再从捞到的鱼里挑挑拣拣,选择一条上好的鱼苗子养大。我们以前常说生信就是指路的也是这样一个道理,数据越多,方向也就更坚定,脚下的路也就越平坦。 接下来是对miRX的研究,希望说明miRX确实是一个miRNA,并且也确实收到干旱的诱导。除了这些,本文还发现pri-miRX的正向上有8个ORF,其中最长的一个编码65个氨基酸。前面已经有研究表明pri-miRNA是可以编码一些小肽的,本文没有再进一步去验证。获得的15个cDNA(pri-miRX)克隆中,有2个存在单碱基变异,作者认为很可能是反转录过程中引起的错误。是不是反转录引起的错误,多重复几次反转录是不是就可以验证了?另外有没有可能是RNA编辑? 这一部分在讨论里还提到pri-miRX的5'末端多了四个碱基GAAA。我们知道mRNA会在5'末端加帽,即加1个G,而这里却加了4个碱基?作者表示还需要更多的时间来研究GAAA可能的生物学作用。看到此处,我首先想到的有没有可能是接头序列?我查了下材料方法,本文使用的反转录试剂盒是GeneRacer,在附件一里看到其接头引物的3'末端就是GAAA,如下图。所以我不太清楚作者是否排除了加上的这四个碱基?有兴趣的小伙伴可以仔细研究下,看看这个GAAA是不是真的? 接下来作者继续分析了这个miRX的启动子序列。这里先卖个关子,大家想一下为啥要花很多精力分析和研究启动子呢? 作者在分析了一些启动子的基本元件后将启动子截成4段启动GUS,用来寻找核心启动子。通过数GUS的细胞数目的来衡量启动子效率的高低。由于我没做过这种实验和文中材料方法部分介绍也比较少,不了解这个实验的可靠性。有懂的小伙伴可以评价下。下图是结果的柱状图,因为文中没有交代该实验重复了几次,这个实验误差有点大,所以对文中所下的结论还是有点疑问的? 这里要交代为啥要研究miRX的启动子。因为在转TaDREB3的材料里,miRX上调表达,考虑到DREB3是一个转录因子,所以就假设DREB3通过结合其启动子区基序来调控miRX的表达。但是仅从启动子序列上来来看,没有迹象表明受DREB3调控,后续的共表达实验也没有证明DREB3直接调控miRX。 下面说一说miRNA的靶基因。预测得到15个靶基因,降解组支持的有3个。然而文中并没有交代支持靶基因的降解组read是多少,也没有具体交代使用了哪个组织的降解组文库,以及原始的降解组数据是否已提交至公共数据库。 有降解组支持的3个靶基因,选择了那个编码NAD(P)-binding domain的基因进行了验证(The target gene encoding the NAD(P)-binding domain-containing protein was further verified using gene specific 5′ RACE)。这里列出了文中的原话。按照我的理解如果要验证miRNA的靶基因,一般使用的是3' PPM-RACE和5' RLM-RACE。而这里作者所讲的5′ RACE是不是5' RLM-RACE我就不太确定了。在材料方法和附件里也没有对这一实验的描述。下图中3个黑色箭头上方的数字表示一共验证了8个克隆,其中有6个克隆支持在经典的10-11位之间剪切靶基因,当然这是按照我的理解,至于是降解组的read还是克隆,得向作者确认。这个地方最好再放上测序的峰图。 然而,定量PCR结果表明NAD(P)-binding domain-containing 的基因的表达没有发生变化。 除了以上内容,本文还分析了miRX在大麦基因组的拷贝数和位置,以及miRX在植物里的保守性。 以上就是本文的全部内容。建议大家有时间的话读读原文,结合本次的解读,希望能够有自己的思考。本文的亮点有两条,第一证明miRX受DREB3调控,第二证明过表达miRX的大麦对干旱的耐受性是通过哪个靶基因起作用。然而,本文在这两方面得到的都是阴性结果。本文对大部分实验结果的描述和分析很到位,这点是我要学习地方,写文章的时候几句话就把结果交代完了,在往下就没东西写了。而对实验方法部分的描述却很不到位,一些关键信息缺失。
2904 次阅读|0 个评论
从染色体到餐桌
mashengwei 2018-4-2 08:29
从染色体到餐桌 王宏晋 很高兴能够邀请到王宏晋博士来说一说他们关于簇毛麦方面的研究内容,王博士本科毕业于西北农林科技大学。 前一周,对Pm21基因解析的2篇高水平文章论文的发表,令我国小麦远缘杂交与染色体工程育种工作者欢欣鼓舞,簇毛麦优异基因导入小麦的理论和应用研究达到了又一顶峰。将对从事黑麦、偃麦草、冰草、新麦草等等物种导入小麦的遗传研究起到指导作用。小编让我们写发表论文的介绍,由于我们的研究只是材料鉴定,未有深入的结果,但对于普及分子细胞遗传学方面相关知识,期望有一定的帮助。 1、研究材料 簇毛麦属(Dasypyrum原作Haynaldia)植物主要分布于地中海沿岸和近东的外高加索地区,包括二倍体一年生簇毛麦(D. villosum,就是Pm21的供体物种)、二倍体和四倍体多年生簇毛麦(D. breviaristatum)等物种,是小麦族中最小的属之一。四川农业大学蒋华仁研究员在1992年报道,率先在国内外合成四倍体多年生簇毛麦与小麦的双二倍体。杨老师告诉我们,由于多年生簇毛麦在四川不是每一年能开花,蒋华仁老师在当时条件有限的情况下,他将多年生簇毛麦的盆栽植株搬到距离成都近300公里的马尔康县,赶车时多次遇到塌方,最终利用多年生簇毛麦的开花习性,通过多次杂交获得杂种,秋水仙碱加倍成为双二倍体的,特别向老一辈的敬业精神表示由衷的敬佩和感谢。多年生簇毛麦为四倍体,与六倍体的中国春小麦合成的双二倍体,染色体数目是2n=70,在自交后代中,染色体数目迅速减少,杨老师后来经过荧光基因组原位杂交(FISH)和分子标记鉴定,发现该材料已经成为六倍体的部分双二倍体TDH-2,染色体组成为AABBVbVb,原先双二倍体中的小麦的D染色体组和另一组簇毛麦染色体在传递中丢失了(Yang et al. Hereditas 2006)。本研究开展了利用四川小麦与TDH-2杂交,获得了一批小麦-多年生簇毛麦衍生系,开展多年生簇毛麦优异基因导入小麦的研究工作。 2、多年生簇毛麦染色体FISH核型分析 多年生簇毛麦的染色体组较二倍体一年生簇毛麦的染色体核型相差很大。从对比导入小麦中的2类簇毛麦染色体核型比较(图1)就可以看出所示,它们的染色体重复序列分布有明显的差异(图1A和1B),而且pHv62重复序列只存在于二倍体一年生簇毛麦(图1C)中多年生簇毛麦染色体不存在pHv62杂交信号。目前基于合成寡核苷酸探针的ND-FISH的技术(Tang et al. 2014, J Appl Genet),高通量、低成本开展小麦与近缘物种的染色体鉴定工作,搭建了染色体鉴定与田间大规模筛选的桥梁。 图1. 一年生二倍体簇毛麦Dv与多年生簇毛麦Dv的FISH核型差异。 在A,B中左边染色体为Oligo-pSc119.2(绿) + Oligo-pTa535(红) 右边染色体为Oligo-(GAA)7(红),C图为Oligo-pHv62-3。 3、小麦-多年生簇毛麦衍生系材料的种子蛋白电泳分析 对小麦-多年生簇毛麦衍生系材料D2176、D2186和D2533进行了种子贮藏蛋白的SDS-PAGE分析(图2),在部分双二倍体TDH-2材料中发现了一条很明显的谷蛋白亚基条带,位于HMW-GS和LMW-GS之间。同样的条带出现在D2176、D2186和D2533中。初步认为该亚基源于多年生簇毛麦,为多年生簇毛麦特异的Glu-1谷蛋白亚基,并转入衍生系背景中。 图2. 小麦-多年生簇毛麦1Vb衍生材料的高分子量谷蛋白亚基的SDS-PAGE分析 箭头示多年生簇毛麦特异的谷蛋白亚基 4、小麦-多年生簇毛麦衍生系材料的染色体鉴定 通过利用簇毛麦特异的LTR探针pDb12H准确地鉴定出衍生系D2176(2n=42)包含1对多年生簇毛麦染色体(图3),用重复序列探针pSc119.2(绿色)和pTa535(红色)的荧光原位杂交(FISH)能够准确地识别小麦的A、B、D染色体,包括前述的多年生簇毛麦染色体。发现D2176和D2186均为1Vb(1A)代换系。D2533(2n=44)为1对多年生簇毛麦重排染色体1VbL.5VbL附加系材料,因此结合前述SDS-PAGe结果,将多年生簇毛麦特异的谷蛋白亚基定位在1VbL上。 图3. 小麦-多年生簇毛麦1Vb衍生材料D2176(A,B),D2186(C)和 D2533(D) 的FISH鉴定。 A.FISH探针为簇毛麦特异LTR重复序列pDb12H,B-D的FISH探针为Oligo-pSc119.2(绿) + Oligo-pTa535(红) 同时FISH发现,D2186的5B染色体在短臂靠端部区域出现了缺失(图4A),D2176出现了5B-7B非罗伯逊易位系(图4B)。较早的研究也发现,小麦-多年生簇毛麦7Vb附加系中小麦染色体1B、2B、7A、1D和3D出现了稳定的结构变异。因此本研究鉴定的D2186和D2176中小麦染色体核型变异,可能由于多年生簇毛麦染色体的导入小麦而诱导产生。 图4. 小麦-多年生簇毛麦衍生系的小麦染色体核型变异。 A为FISH核型分析, B为模式图,箭头显示可能的断裂位点 5、多年生簇毛麦高分子量谷蛋白基因测序 利用Glu-1保守引物对多年生簇毛麦进行扩增克隆测序,得到了10个含有典型Glu-1特征的完整序列,编码307-579个氨基酸残基含5-9个半胱氨酸残基。结合先前研究的6条二倍体一年生簇毛麦HMW-GS序列,以及在小麦-多年生簇毛麦衍生系中克隆的簇毛麦特异Glu-序列,发现导入小麦背景中的谷蛋白亚基为y-型高分子量谷蛋白亚基,其分子量远小于小麦的Glu-1基因,说明小麦族物种进化过程中可能保存大量冗余的中等长度的谷蛋白基因,可以用于小麦种子改良和基因组进化研究。 6、小麦-多年生簇毛麦衍生系农艺性状调查与品质测试 对育成小麦-多年生簇毛麦衍生系材料的农艺性状观测发现,1VbL导入小麦背景,能降低株高和显著增加分蘖数。与小麦亲本相比,衍生系D2176和D2186拥有较高的籽粒蛋白质含量、湿面筋含量和较高的ZEL沉降值。面粉SRC值测定也表明衍生系材料面筋性能指数(GPI)明显提高。小麦-多年生簇毛麦衍生系展示出较好的面粉性状,可以用于改善小麦品。当然需要进一步进行小片段易位系诱导,开展小麦遗传背景互作的遗传分析,对多年生簇毛麦优异Glu-1位点导入对小麦品质育种效应的准确评估。 因此,远缘杂交育种和其他小麦育种一样,其实就是一个坚守。我们期待着应用于小麦远缘杂交的相的物种,基因组序列得到完善,对创制的导入外源的染色质的新材料,特别外源诱导产生的大量遗传与表观遗传学变异的材料的深度解析,必将将对拓宽小麦基因资源,为抗病、抗逆、品质等继续发挥更大的作用。 欢迎关注 “ 小麦研究联盟 ”, 了解小麦新进展 投稿、转载、合作以及信息分布等请联系: wheatgenome
3025 次阅读|0 个评论
2018年第13周小麦文献推荐(4.1)
mashengwei 2018-3-31 15:45
2018年第13周小麦文献推荐(4.1) 今天是4.1号,大家要小心呢。还有别忘了我们的线上摄影展( 第一届“小麦研究联盟”线上摄影展 ),现在就可以发给我们了。 听说最近天气变化剧烈,特地查了下天气预报。下面播报下天气预报 。下周一,北方大部气温将抬升近期最高点,河北南部、山东西北部、河南北部、陕西关中等地,将再次向30℃以上发起冲击,局地或将有高温现身。省会级城市中,郑州、济南、银川、兰州有望创下今年气温新高,其中郑州、济南将超30℃。南方大部最高气温也多在25-30℃左右。不过,北方温暖的春意还不能完全站稳脚跟。下周前期,较强冷空气来袭,各地气温将迅速下降。明天,冷空气的先头部队就率先在新疆发动攻势,乌鲁木齐最高气温将从今天的26℃降到明天的8℃,随后还将逐步跌落至仅有6℃,寒冷如冬。4月3-6日,冷空气东移南下,逐渐影响全国大部,北方大部地区的气温将转为偏低,华北地区最高气温纷纷降到15℃左右,而东北则降至个位数,最低气温将再度跌破冰点。其中,降温最猛烈的河南、山东一带,累积降幅可达到20℃上下,例如济南、郑州最高气温将由2日的30℃出头降至10℃左右。我们的麦S特别提醒大家注意倒春寒( 低温、高温对起身拔节期小麦的影响 )。 说完了天气,我们开始说一说我们这一周的文献更新。 1 Genome-wide identification of wheat (Triticum aestivum) expansins and expansin expression analysis in cold-tolerant and cold-sensitive wheat cultivars. PMID:29596529 DOI:10.1371/journal.pone.0195138 2 Coupled ultradian growth and curvature oscillations during gravitropic movement in disturbed wheat coleoptiles PMID: 29596500 DOI: 10.1371/journal.pone.0194893 3 Quantitative trait loci associated with soft wheat quality in a cross of good by moderate quality parents. PMID: 29593939 PMCID: PMC5868479 DOI: 10.7717/peerj.4498 4 Genetic Diversity and Population Structure of F3:6 Nebraska Winter Wheat Genotypes Using Genotyping-By-Sequencing PMID: 29593779 PMCID: PMC5857551 DOI: 10.3389/fgene.2018.00076 5 The Role of Hydrogen Peroxide in Mediating the Mechanical Wounding-Induced Freezing Tolerance in Wheat PMID: 29593774 PMCID: PMC5861560 DOI: 10.3389/fpls.2018.00327 6 Zinc and Iron Concentration as Affected by Nitrogen Fertilization and Their Localization in WheatGrain. PMID: 29593765 PMCID: PMC5855893 DOI: 10.3389/fpls.2018.00307 7 Genetic Dissection of End-Use Quality Traits in Adapted Soft White Winter Wheat PMID: 29593752 PMCID: PMC5861628 DOI: 10.3389/fpls.2018.00271 8 Identification and Characterization of Wheat Yellow Striate Virus, a Novel Leafhopper-Transmitted Nucleorhabdovirus Infecting Wheat PMID: 29593700 PMCID: PMC5861215 DOI: 10.3389/fmicb.2018.00468 9 Genome-wide association mapping for resistance to leaf rust, stripe rust and tan spot in wheatreveals potential candidate genes PMID: 29589041 DOI: 10.1007/s00122-018-3086-6 10 Efficient anchoring of alien chromosome segments introgressed into bread wheat by new Leymus racemosus genome-based markers PMID: 29587653 DOI: 10.1186/s12863-018-0603-1 11 Expression of Pinellia pedatisecta Lectin Gene in Transgenic Wheat Enhances Resistance to Wheat Aphids PMID: 29587341 DOI: 10.3390/molecules23040748 12 Wheat starch with low retrogradation properties produced by modification of the GtfB enzyme 4,6-α-glucanotransferase from Streptococcus thermophilus PMID: 29582651 DOI: 10.1021/acs.jafc.8b00550 13 TaEDS1 genes positively regulate resistance to powdery mildew in wheat PMID: 29582247 DOI: 10.1007/s11103-018-0718-9 14 Identification of Wheat Inflorescence Development-Related Genes Using a Comparative Transcriptomics Approach PMID: 29581960 PMCID: PMC5822904 DOI: 10.1155/2018/6897032 15 Dynamic Evolution of α-Gliadin Prolamin Gene Family in Homeologous Genomes of Hexaploid Wheat PMID: 29581476 DOI: 10.1038/s41598-018-23570-5 16 Contrasting plant height can improve the control of rain-borne diseases in wheat cultivar mixture: modelling splash dispersal in 3-D canopies PMID: 29579151 DOI: 10.1093/aob/mcy024 17 Transgenic expression of plastidic glutamine synthetase increases nitrogen uptake and yield in wheat PMID: 29577547 DOI: 10.1111/pbi.12921 18 Wheat expansin gene TaEXPA2 is involved in conferring plant tolerance to Cd toxicity PMID: 29576078 DOI: 10.1016/j.plantsci.2018.02.022 19 Molecular Diversity and Landscape Genomics of the Crop Wild Relative Triticum urartu Across the Fertile Crescent PMID: 29573496 DOI: 10.1111/tpj.13888 20 Responses of seminal wheat seedling roots to soil water deficits PMID: 29567416 DOI: 10.1016/j.jplph.2018.03.002 最后,告诉大家一个小技巧,在PubMed数据库里按照如下格式搜索,可以搜索关键词wheat在2018年3月24日至2018年3月30日的文献更新。 ( (wheat ) AND 2018/03/24 15.00 :2018/03/30 15.00 ) 欢迎关注 “ 小麦研究联盟 ”, 了解小麦新进展
2775 次阅读|0 个评论
小麦穗粒数转录组分析(三)-----Fst的计算
mashengwei 2018-3-20 23:20
小麦穗粒数转录组分析(三)-----Fst的计算 本期作者:Neal Hi,大家好!今天非常惊喜的看到两篇Pm21的文章以背靠背的形式发表在 Molecular Plant 上,去年的时候这两篇文章都在预印本biorxiv网站上在线了,当时我们也推送了两篇有关的内容, Pm21,掀起你的盖头来 , Pm21的“盖头”被完全掀开——有着一张熟面孔 。这种背靠背的形式发表文章一来大家互相验证,二来影响力要远远高于单独发表。我们在2017年的总结中也提到了Pm21的克隆, 年度盘点:2017年小麦研究领域的重大事件 。 再次对这两个团队表示祝贺 。那些做图位克隆的小伙伴也要加油哈! 好了,我们言归正传。这是本系列的第三集。这是前面的两集, 小麦穗粒数转录组分析(一) , 小麦穗粒数转录组分析(二)——SNP的筛选 。忘了的同学可以回顾一下。 我都不知道该如何开始这个话题。 Fst 是用来描述种群内和种群间差异的一种衡量指标, 表示一个种群内两个亚群等位基因频率差异的某种标准化,是差异性的一种代表。当 Fst较小时,表示两个群体间差异较小,反之亦然。基于Fst可以进行选择性消除分析。比方说,我们已知有两个小麦群体,一个是育成品种群体,它们的农艺性状普遍较好,也即是人工选择的结果;另外一个是地方品种群体,它们更多的是长期自然选择的结果。说到人工选择,不同时期人们的偏好会不一样,有一段时期会追求某一方面的性状,而过一段时期又会追求另外的性状。当我们收集了不同群体的基因型之后,我们就可以做一些群体进化方面的分析。比如,我想知道河南省最近10年推广的品种中哪些基因组区段受到了选择。再比如,我收集了100份千粒重很高的品种和100份千粒重比较低的材料,我们就可以比较这个群体里在某些区段等位基因频率的差异,那些等位基因频率差异很大的区域就是受到选择的区域。 大家可以参见徐洲更同学写的这一篇 会算Fst还不够,还得知道它的用途 ,也可以参见这一篇文章, 群体遗传进化必备小知识 ,我就不再搬砖了。 回到我们的话题。前面我们提到这90份微核心种质,包括两个群体,一个是包含16份育成品种群体,剩下的是地方品种群体。这一群体的信息,可以查阅文章“ Transcriptome Association Identifies Regulators of Wheat Spike Architecture ”。现在我们可以试着计算这两个群体之间的 Fst 。 使用的工具是vcftools, 这实在是一个犀利的工具,今天我们只谈一谈如何使用vcftools计算 Fst 。命令如下, vcftools--vcf90_mini_core_UG_first_third_filter_eff.vcf--weir-fst-popEV_population.txt--weir-fst-popL_population.txt--outpop1_vs_pop2--fst-window-size500000--fst-window-step50000 #90_mini_core_UG_first_third_filter_eff.vcf是我们前面得到的vcf文件; #EV_population.txt是一个包含品种名字的文件,每行一个品种。这里的品种名字要和vcf的名字对应 #L_population.txt是另外一个包含品种名字的文件,即地方品种群体。 #计算的窗口是500kb,而步长是50kb。我们也可以只计算每个点的Fst,去掉参数(--fst-window-size500000--fst-window-step50000)即可。 输出结果如下面的格式: CHROM BIN_START BIN_END N_VARIANTS WEIGHTED_FST MEAN_FST chr1A 700001 1200000 1 0.2429 0.2429 chr1A 750001 1250000 3 0.310295 0.300006 chr1A 800001 1300000 3 0.310295 0.300006 chr1A 850001 1350000 10 0.311409 0.306106 chr1A 900001 1400000 10 0.311409 0.306106 chr1A 950001 1450000 10 0.311409 0.306106 chr1A 1000001 1500000 10 0.311409 0.306106 chr1A 1050001 1550000 10 0.311409 0.306106 chr1A 1100001 1600000 10 0.311409 0.306106 根据上述表格我们就可以画图,或者查看我们关心的区域。 \0dirpath=(/Users/Desktop/scripts/snpEff_latest_core/snpEff) setwd(dirpath) library(ggplot2) data-read.table(./pop1_vs_pop2_repeat.weir.fst,header=T) chr6B=subset(data,CHROM==chr6B) #这里只选择了6B这条染色体来看。 p-ggplot(chr6B,aes(x=POS/1000000,y=WEIR_AND_COCKERHAM_FST))+geom_point(size=0.5,colour=blue)+xlab(Physicaldistance(Mb))+ylab(Fst)+ylim(-1,1) p+theme_bw()\0 今天就到这里了,Fst结果的筛选和生物意义挖掘,大家可以参加这方面的文章。这方面我也是第一次做,没啥经验,大家有想法的话可以交流,加“wheatgenome”即可。 欢迎关注 “ 小麦研究联盟 ”, 了解小麦新进展 投稿、转载、合作以及信息分布等请联系: wheatgenome
10349 次阅读|0 个评论
春节巨献: 揭开小麦Ph1的面纱-正史篇
mashengwei 2018-2-17 22:07
2 13 本期作者:Hao Li 编者按: 小编在1月30日推送的、关于 Ph1 解读的 “我要上PC”—小麦领域Plant Cell上论文合辑(九) ,得到了很多小伙伴的反馈和讨论。这里,我们邀请到美国UC Davis 的博后,Hao Li博士为我们继续解读 Ph1 ,以飨读者。Hao Li博士目前正在从事 Ph1 的相关研究,他所在的实验室从上个世纪七十年代就开始研究 Ph1 ,所以很荣幸可以邀请到他,为我们带来关于 Ph1 的春节钜献。 前不久看到公众号上小编Meng Wang的 “我要上PC” —小麦领域Plant Cell上论文合辑(九),讲解的是 Ph1 的故事,看到后大呼过瘾。然而呼喊到文章结尾,发现故事戛然而止到2012年,心中有些意兴阑珊,于是乎联系小编,进行了一番讨论。叹道2012年之后的 Ph1 故事更加精彩,而且都是离其真实面目越来越近的报道,与小编一致认为 Ph1 的故事应该有续集,遂把这些2012年之后的报道推向大家。鉴于本人BOSS(老先生毕生致力于小麦基因组的遗传和进化以及D基因组供体的研究)一直对 Ph1 颇有兴趣,本人也有幸从事了一些 Ph1 相关的工作,于是受托着手 Ph1 的故事之二。受此重托,本人也倾尽脑汁,可能会带有部分偏见,如有不到之处,还请海涵,也欢迎留言讨论。 常听老先生把 “ The most important gene in wheat is Ph1 ” 放在嘴边,足见 Ph1 在小麦基因组中的份量。言归正传,2012年至今, Ph1 的研究主要也是由Prof. Graham Moore (John Innes Centre)和Prof. Kulvinder Gill (Washington State University) 报道的。2014年之前的工作,大家感兴趣的话可以去Graham Moore实验室网站( https://www.jic.ac.uk/staff/graham-moore/ )找到一个 “Presentation: A summary of the Ph1 story so far.” 的PPT文件进行了解。 2014年8月,Graham Moore组在Nature Communications发文(见下图),重新提出了 Ph1 的功能是 促进同源染色体间的配对而不是抑制部分同源染色体间的配对 ,但是会阻止已经发生配对的部分同源染色体中的 MLH1 位点向crossover的转变(MLH1是错配修复蛋白,同源染色体间的配对和重组只会在MLH1结合的位点发生,因而MLH1会指示即将发生crossover的位点)。 同是2014年8月,Kulvinder Gill组在PNAS上发文 号称找到了 Ph1 的候选基因,命名为 C-Ph1 (见下图)。基于Gill et al . (1993) 和Griffiths et al . (2006) 利用5B染色体缺失材料将 Ph1 缩小到一个2.5 MB区域,Kulvinder Gill组比较基因组学将此区域同步到水稻基因组450kb的区域,首先利用生物信息学分析将该区域的91个基因过滤到26个基因,然后VIGS验证分析鉴定出一个候选基因 ( C-Ph1 ; LOC_Os9g30320 , wheat expressed sequence tag(EST) homolog BE498862),并进行后续的功能验证证明其是 Ph1 的候选基因。 C-Ph1 的文章一经发表,引起了不少轰动,但是也有不少大咖表示质疑。加上此前Graham Moore组提出的 CDK2-like 基因簇理论,各种争论接踵而来。在2016年PAG会上,私底下跟Graham Moore教授交流的时候,他非常肯定的说 C-Ph1 不是 Ph1 。果然,在沉寂了3年之后,各种争论徐徐到来。 2017年4月,Graham Moore组在Chromosoma上发文 进一步阐释 Ph1 在染色体联会和交叉重组的机理 (见下图)。基于他们2014年的研究, Ph1 的功能是促进减数分裂早期同源染色体间的联会,也会阻止已经发生联会的部分同源染色体中的 MLH1 位点向crossover的转变 (Martín et al . 2014)。首先,他们本文发现不论 Ph1 是否存在,部分同源染色体间的联会是不能在端粒花束期发生的,而只有同源染色体间的联会会在这个时期发生。在没有 Ph1 时,联会的进程明显晚于端粒花束期,大部分的部分同源染色体间的联会发生于花束期以后。其次,在没有 Ph1 时, MLH1 位点向crossover的转变是能够被环境条件操纵的,比如高营养水平的土壤和较低温的处理均能增加同源染色体间和部分同源染色体间crossover的比例。而 这些结果对于在育种中应用 Ph1 突变体提供了更多的可能 。 Graham Moore组本文中提出 Ph1 位点已经被锚定在这个含有 CDK2-like 基因和甲基化转移酶(SAM-MTases)基因的基因簇,这个区域包含了一个来自3B染色体的片段,该片段中带有一个之前命名为 hypothetical 3 ( Hyp3 ) 的基因(Griffiths et al. 2006; Al-Kaff et al. 2008),现在重新命名为 ZIP4 (UniProtKB-Q2L3T5)。而 Ph1 对于crossover形成的影响很可能就是这个 ZIP4 基因的作用 。 紧接着,2017年7月,Graham Moore组在Mol. Breeding发表文章(见下图),借阐释 Ph1 区域 Tazip4-B2 基因突变体的机会,进一步捍卫了他们的理论 “ Ph1 位点是一个复杂的基因簇,包含了 CDK2-like 基因和甲基化转移酶( ZIP4 的旁系同源基因)也在内”(原话是 Ph1 locus is a complex cluster of CDK2-like and methyl transferase genescontaining a ZIP4 paralogue)。 其在文中犀利指出 C-Ph1 在水稻中的同源基因 Os9g30320 实际上是一个绒毡层细胞基因(Jeon et al .1999)。而且小麦中的 C-Ph1 的旁系同源基因,名为 Raftin1 ,也被认定为是绒毡层细胞基因 (Wang et al .2003)。绒毡层细胞基因的表达呈现高峰会因为绒毡层细胞完全附着在减数第一次分裂中期花粉母细胞而发生。此类基因的紊乱会导致花粉母细胞受到胁迫,染色体聚集到一起和雄性不育,因而 利用此类基因可以诱导产生雄性不育系 ,两个专利也已经被授权(Patents WO2000026389A3 和US20040060084)。这点也得到了公众号小编倪飞博士(太谷核不育基因 Ms2 克隆的主要参与者)的确认。并且之前Al-Kaff et al. (2008)报道的2.5 MB区域内的缺失材料中也缺失了 C-Ph1 基因,却没有表现出 Ph1 突变体的表型,他们推测Bhullar et al. (2014)报道的缺失材料的表型可能被错误鉴定,或者VIGS鉴定的表型是由脱靶效应造成的。仔细比较会发现其报道的VIGS鉴定的表型比整个5B染色体的缺失还剧烈。 因而, C-Ph1 应该不是Ph1 !!! Graham Moore组再次强调利用缺失系的分析已经把 Ph1 位点锚定在这个2.5MB区域,这个区域包含了一个来自3B染色体的带有异染色质和 TaZIP4-B2 基因 (原名为 Hyp3 , UniProtKBQ2L3T5)的复制片段,此片段插入到了 CDK2-like 基因簇(穿插了甲基化转移酶基因,原名为 SpG , UniProtKB-Q2L3W3) (Griffiths et al . 2006; Al-Kaff et al . 2008; Martín et al . 2017)。但是这些基因对 Ph1 表型的贡献还是未知的。鉴于 ph1b 突变体带有太多的部分同源染色体交叉重组导致的染色体异构,而且严重影响育性(Sánchez-Morán et al . 2001),他们本文 成功地分离出小麦中能够带有较小影响的 TaZIP4-B2 基因突变体Cadenza1691和Cadenza0348,进而可以推广应用 。 这还没完,Kulvinder Gill组在2018年PAG大会上提交了3个 C-Ph1 相关abstract和poster ( https://pag.confex.com/pag/xxvi/meetingapp.cgi/Person/50501 )。文中声称 利用 C-Ph1 对 ph1b 突变体进行互补功能验证 ,发现转基因植株与黑麦染色体的配对能力比对照明显下降,因而 C-Ph1 能够恢复 ph1b 正常的染色体配对功能。此外,与二倍体相比, C-Ph1-5B 拷贝通过一些进化的改变而具有了新的功能,具体是i) 29bp 缺失;ii) 60bp插入导致获得了新的motif;iii) 可变剪切;iv) 减数第一次分裂前期-中期的过早表达。 可是,同在2018年PAG大会上,来自National Research Council (Canada)的Sateesh Kagale也有一篇abstract是关于 Ph1 的( https://pag.confex.com/pag/xxvi/meetingapp.cgi/Paper/31148 ),该文利用CS 和Cs- Ph1b 突变体的RNA sequence数据和小麦基因组数据进行分析, 获得了 Ph1 区域的完整基因序目。这些基因进行综合结构和表达分析表明 Ph1 是一个带有多重候选基因并带有冗余功能的复杂位点 。 综合以上研究报道,可以将其汇总到一张图上(见下图),Graham Moore组认为 Ph1 是一个复杂的基因簇,包括了 Cdk-like genes和 TaZIP4-B2 ;而后Sateesh Kagale对 ph1b 突变体的生物信息分析也得出了 Ph1 是复杂基因复合体的相似结论;然而Kulvinder Gill组还是坚持 C-Ph1 是候选基因的理论,并声称1个 C-Ph1 就恢复了 ph1b 突变体的正常配对功能,但是包括本文作者在内的一些研究人员对此结果持怀疑态度。(图中显示 C-Ph1 的确在之前Graham Moore组创制的缺失系中发生缺失,但是没有表现出 ph1b 的表型)。 看了这么些令人血脉喷张的研究以及争论,关于正史的报道到这里算是告一段落,相信随着关于 Ph1 基因各种研究的跟进, Ph1 的故事也会越来越耐人寻味,我们离揭开 Ph1 的面纱也越发的接近。 本文用到的文献: Al-Kaff,N., Knight, E., Bertin, I., Foote, T., Hart, N., Griffiths, S., and Moore, G.(2008). Detailed dissection of the chromosomal region containing the Ph1 locus in wheat Triticum aestivum : withdeletion mutants and expression profiling. AnnBot 101 , 863-872. Bhullar, R.,Nagarajan, R., Bennypaul, H., Sidhu, G.K., Sidhu, G., Rustgi, S., VonWettstein, D., and Gill, K.S. (2014). Silencing of a metaphase I-specific generesults in a phenotype similar to that of the Pairing homeologous 1 ( Ph1 ) gene mutations. Proc Natl Acad Sci U S A 111 , 14187-14192. Gill, K.S., Gill, B.S., Endo, T.R., andMukai, Y. (1993). Fine physical mapping of Ph1, a chromosome pairing regulatorgene in polyploid wheat. Genetics 134, 1231-1236. Griffiths, S., Sharp,R., Foote, T.N., Bertin, I., Wanous, M., Reader, S., Colas, I., and Moore, G.(2006). Molecular characterization of Ph1 as a major chromosome pairing locus in polyploid wheat. Nature 439 , 749-752. Jeon, J.-S., Chung,Y.-Y., Lee, S., Yi, G.-H., Oh, B.-G., and An, G. (1999). Isolation andcharacterization of an anther-specific gene, RA8 , from rice (Oryza sativa L.). Plant molecular biology 39 , 35-44. Martín, A.C., Rey,M.-D., Shaw, P., and Moore, G. (2017). Dual effect of the wheat Ph1 locus on chromosome synapsis andcrossover. Chromosoma 126 , 669-680. Martin, A.C., Shaw,P., Phillips, D., Reader, S., and Moore, G. (2014). Licensing MLH1 sites for crossover during meiosis. Nat Commun 5 , 4580. Sanchez-Moran, E.,Benavente, E., and Orellana, J. (2001). Analysis of karyotypic stability ofhomoeologous-pairing ( ph ) mutants inallopolyploid wheats. Chromosoma 110 , 371-377. Wang, A., Xia, Q.,Xie, W., Datla, R., and Selvaraj, G. (2003). The classical Ubisch bodies carrya sporophytically produced structural protein ( RAFTIN ) that is essential for pollen development. Proceedings of the National Academy ofSciences 100 , 14487-14492.
5053 次阅读|0 个评论
2018年第二周小麦文献推荐(1.14)
mashengwei 2018-1-13 17:48
2018年第二周小麦文献推荐(1.14) 大家好!不知不觉今天是18年的第二周周末了。 昨天的推送收到很多反馈,胖丫让我感谢你们,她受益良多。有小伙伴问起Sentieon,昨天也没多说,今天多说两句,这个软件的功能和GATK功能类似,准确性上不输GATK,但是速度上要比它快N多倍。特别是当有大量样本需要做的时候,建议还是试一试Sentieon,毕竟时间就是金钱呢。这是一款商业软件,有兴趣的小伙伴可以邮件联系 support@sentieon.com ,可以获取试用版。也欢迎大家进群交流小麦方面的内容,可以加“wheatgenome”,老师或者博后也可以加“xiaoxuan8765”。 小麦组学研究在接来下2-3年一定是热点,除了中国春参考基因组,其它材料的基因组也会陆续发表。现在有各种组装技术加持,这些小麦族基因组不比参考基因组差,数据增多势必会促进我们的研究,但同时竞争也会更加激烈。作为传统的小麦研究者来讲,我们有材料,但是技术方面不成熟,而对于早期研究拟南芥、水稻等模式作物的研究者来讲,带着新技术新方法进入小麦也是顺其自然的过程。一个有技术,一个有材料或者数据,两者结合一定会有火花擦出来。回头看看最近2年的研究,这种合作方式越来越常见,最近黄三文小组和罗杰小组最近就联手在Cell上发表了一篇利用多组学数据研番茄果实的营养和风味的文章,这就是一个极好的合作共赢的例子。世界的发展也是这样的趋势,国家与国家之间联系越来越紧密,在这样一个信息和数据爆炸的时代,科研节奏会越来越快,专业的东西交给专业的人做,所以敞开胸怀合作一定不是坏选择。 又有点扯远了,下面让我们看看最近一周小麦方面又有哪些东西更新。 1 High throughput SNP discovery and genotyping in hexaploid wheat Because of their abundance and their amenability to high-throughput genotyping techniques, Single Nucleotide Polymorphisms (SNPs) are powerful tools for efficient genetics and genomics studies, including characterization of genetic resources, genome-wide association studies and genomic selection. In wheat, most of the previous SNP discovery initiatives targeted the coding fraction, leaving almost 98% of the wheat genome largely unexploited. Here we report on the use of whole-genome resequencing data from eight wheat lines to mine for SNPs in the genic, the repetitive and non-repetitive intergenic fractions of the wheat genome. Eventually, we identified 3.3 million SNPs, 49% being located on the B-genome, 41% on the A-genome and 10% on the D-genome. We also describe the development of the TaBW280K high-throughput genotyping array containing 280,226 SNPs. Performance of this chip was examined by genotyping a set of 96 wheat accessions representing the worldwide diversity. Sixty-nine percent of the SNPs can be efficiently scored, half of them showing a diploid-like clustering. The TaBW280K was proven to be a very efficient tool for diversity analyses, as well as for breeding as it can discriminate between closely related elite varieties. Finally, the TaBW280K array was used to genotype a population derived from a cross between Chinese Spring and Renan, leading to the construction a dense genetic map comprising 83,721 markers. The results described here will provide the wheat community with powerful tools for both basic and applied research 2 Mapping of quantitative trait loci for grain yield and its components in a US popular winter wheat TAM 111 using 90K SNPs Stable quantitative trait loci (QTL) are important for deployment in marker assisted selection in wheat (Triticum aestivum L.) and other crops. We reported QTL discovery in wheat using a population of 217 recombinant inbred lines and multiple statistical approach including multi-environment, multi-trait and epistatic interactions analysis. We detected nine consistent QTL linked to different traits on chromosomes 1A, 2A, 2B, 5A, 5B, 6A, 6B and 7A. Grain yield QTL were detected on chromosomes 2B.1 and 5B across three or four models of GenStat, MapQTL, and QTLNetwork while the QTL on chromosomes 5A.1, 6A.2, and 7A.1 were only significant with yield from one or two models. The phenotypic variation explained (PVE) by the QTL on 2B.1 ranged from 3.3-25.1% based on single and multi-environment models in GenStat and was pleiotropic or co-located with maturity (days to heading) and yield related traits (test weight, thousand kernel weight, harvest index). The QTL on 5B at 211 cM had PVE range of 1.8-9.3% and had no significant pleiotropic effects. Other consistent QTL detected in this study were linked to yield related traits and agronomic traits. The QTL on 1A was consistent for the number of spikes m-2 across environments and all the four analysis models with a PVE range of 5.8-8.6%. QTL for kernels spike-1 were found in chromosomes 1A, 2A.1, 2B.1, 6A.2, and 7A.1 with PVE ranged from 5.6-12.8% while QTL for thousand kernel weight were located on chromosomes 1A, 2B.1, 5A.1, 6A.2, 6B.1 and 7A.1 with PVEranged from 2.7-19.5%. Among the consistent QTL, five QTL had significant epistatic interactions (additive × additive) at least for one trait and none revealed significant additive × additive × environment interactions. Comparative analysis revealed that the region within the confidence interval of the QTL on 5B from 211.4-244.2 cM is also linked to genes for aspartate-semialdehyde dehydrogenase, splicing regulatory glutamine/lysine-rich protein 1 isoform X1, and UDP-glucose 6-dehydrogenase 1-like isoform X1. The stable QTL could be important for further validation, high throughput SNP development, and marker-assisted selection (MAS) in wheat. 3 Genotyping-by-Sequencing Derived High-Density Linkage Map and its Application to QTL Mapping of Flag Leaf Traits in Bread Wheat Winter wheat parents ‘Harry’ (drought tolerant) and ‘Wesley’ (drought susceptible) were used to develop a recombinant inbred population with future goals of identifying genomic regions associated with drought tolerance. To precisely map genomic regions, high-density linkage maps are a prerequisite. In this study genotyping-by- sequencing (GBS) was used to construct the high-density linkage map. The map contained 3,641 markers distributed on 21 chromosomes and spanned 1,959 cM with an average distance of 1.8 cM between markers. The constructed linkage map revealed strong collinearity in marker order across 21 chromosomes with POPSEQ-v2.0, which was based on a high-density linkage map. The reliability of the linkage map for QTL mapping was demonstrated by co-localizing the genes to previously mapped genomic regions for two highly heritable traits, chaff color, and leaf cuticular wax. Applicability of linkage map for QTL mapping of three quantitative traits, flag leaf length, width, and area, identified 21 QTLs in four environments, and QTL expression varied across the environments. Two major stable QTLs, one each for flag leaf length ( Qfll . hww-7A ) and flag leaf width ( Qflw . hww-5A ) were identified. The map constructed will facilitate QTL and fine mapping of quantitative traits, map-based cloning, comparative mapping, and in marker-assisted wheat breeding endeavors. 4 A genome-wide association study of wheat yield and quality-related traits in southwest China Wheat ( Triticum aestivum L.) is one of the most productive and important crops and its yield potential and quality characteristics are tightly linked with the global food security. In this study, genome-wide association study (GWAS) was conducted for yield and quality-related traits. Based on the high-density wheat 90K Illumina iSelect SNP Array, 192 bread wheat lines from southwest China, including 25 synthetic hexaploid wheat lines, 80 landraces, and 87 cultivars were analyzed. Association analysis results indicated that there were 57, 27, 30, and 34 SNPs associated with plant height (PH), grain protein content (GPC), thousand kernel weight (TKW), and SDS sedimentation volume (SSV) have been detected, respectively. Then, integrating RNA-Seq with bioinformatics analysis, 246 candidate genes (102 for GPC, 52 for TKW, and 92 for SSV) were found. Further analysis indicated that one up-regulated and two down-regulated expression genes affect GPC. Additionally, two haplotypes significantly affecting PH were detected in a 2.2-Mb genome region encompassing a gene which encoded an ubiquitin-specific protease, TaUBP24. The functional markers of TaUBP24 have been developed, which could be used for marker-assisted selection to improve wheat quality and yield. 5 Characterization of Novel Gene Yr79 and Four Additional QTL for All-stage and High-temperature Adult-plant Resistance to Stripe Rust in Spring Wheat PI 182103 Stripe rust, caused by Puccinia striiformis f. sp. tritici , is an important disease of wheat worldwide. Exploring new resistance genes is essential for breeding resistant wheat cultivars. PI 182103, a spring wheat landrace originally from Pakistan, has shown a high level of resistance to stripe rust in fields for many years, but genes for resistance to stripe rust in the variety have not been studied. To map the resistance gene(s) in PI 182103, 185 recombinant inbred lines (RILs) were developed from a cross with Avocet Susceptible (AvS). The RIL population was genotyped with SSR and SNP markers and tested with races PST-100 and PST-114 at the seedling stage under controlled greenhouse conditions and at the adult-plant stage in fields at Pullman and Mt. Vernon, Washington under natural infection by the stripe rust pathogen in 2011, 2012, and 2013. A total of five quantitative trait loci (QTL) were detected. QyrPI182103.wgp-2AS and QyrPI182103.wgp-3AL were detected at the seedling stage, QyrPI182103.wgp-4DL was detected only in Mt. Vernon field tests, and QyrPI182103.wgp-5BS was detected in both seedling and field tests. QyrPI182103.wgp-7BL was identified as a high-temperature adult-plant (HTAP) resistance gene and detected in all field tests. Interactions among the QTL were mostly additive, but some negative interactions were detected. The 7BL QTL was mapped in chromosomal bin 7BL 0.40-0.45 and identified as a new gene, permanently designated as Yr79 . SSR markers Xbarc72 and Xwmc335 flanking the Yr79 locus were highly polymorphic in various wheat genotypes, indicating that the molecular markers are useful for incorporating the new gene for potentially durable stripe rust resistance into new wheat cultivars. 6 Succession of Fungal and Oomycete Communities in Glyphosate-Killed Wheat Roots. The successional dynamics of root-colonizing microbes are hypothesized to be critical to displacing fungal pathogens that can proliferate after the use of some herbicides. Applications of glyphosate in particular, which compromises the plant defense system by interfering with the production of aromatic amino acids, is thought to promote a buildup of root pathogens and can result in a ‘greenbridge’ between weeds or volunteers and crop hosts. By planting two to three weeks after spraying, growers can avoid most negative impacts of the greenbridge by allowing pathogen populations to decline, but with the added cost of delayed planting dates. However, the specific changes in microbial communities during this period of root death and the microbial taxa likely to be involved in displacing pathogens are poorly characterized. Using high-throughput sequencing, we characterized fungal and oomycete communities in roots after applications of herbicides with different modes of action (glyphosate or clethodim) and tracked their dynamics over three weeks in both naturally infested soil and soil inoculated with Rhizoctonia solani *AG-8. We found that many unexpected taxa were present at high relative abundance (eg. *Pythium volutum and Myrmecridium species) in live and dying wheat roots and may play an under-recognized role in greenbridge dynamics. Moreover, communities were highly dynamic over time and had herbicide-specific successional patterns, but became relatively stable by two weeks after herbicide application. Network analysis of communities over time revealed patterns of interactions among taxa that were both common and unique to each herbicide treatment and identified two primary groups of taxa with many positive associations within-groups but negative associations between-groups, suggesting that these groups are antagonistic to one another in dying roots and may play a role in displacing pathogen populations during greenbridge dynamics. 7 Characterization of Adult Plant Resistance to Leaf Rust and Stripe Rust in Indian Wheat Cultivar ‘New Pusa 876’ Growing resistant varieties is the most effective and economical method for controlling rust of wheat ( Triticum aestivum L.). Resistance to leaf rust and stripe rust, caused by Puccinia triticina Erikss. and P. striiformis Westend. f. sp. tritici , respectively, was investigated in 148 F5recombinant inbred lines derived from a cross between ‘Avocet’ and ‘New Pusa 876’ (NP876). The parents and population were phenotyped for resistance in field trials for 3 and 2 yr for leaf rust and stripe rust, respectively, and genotyped with gene-linked molecular markers. The segregation analyses indicated that the adult plant resistance to leaf rust and stripe rust was conferred by five and four additive effect genes, respectively. Among them, the slow-rusting adult plant resistance gene Lr46/Yr29 reduced 14 and 16% of mean leaf rust and stripe rust severities, respectively, whereas a severity reduction of 26% occurred due to Lr67/Yr46 for both rusts. Both resistance genes were contributed by NP876. An additive effect between leaf rust resistance genes Lr46 and Lr67 was detected, with a reduction up to 11% when they were present together. The effect of combining Yr29 and Yr46 was additive but not significant, with a mean reduction of 5% in severity. New Pusa 876 can be used as a multiple rust resistance source to breed wheat varieties that may contribute towards durable resistance. 8 Temperature and Alternative Hosts Influence Aceria tosichella Infestation and Wheat Streak Mosaic Virus Infection Wheat streak mosaic, caused by Wheat streak mosaic virus (WSMV; family Potyviridae), is the most important and common viral disease of wheat (Triticum aestivum L.) in the Great Plains of North America. WSMV is transmitted by the wheat curl mite (WCM; Aceria tosichella). We evaluated how mean daily temperatures, cumulative growing degree-days, day of the year, and surrounding alternative host identity affected WCM infestation and WSMV infection of wheat from late summer through early autumn in Montana, United States. Cumulative growing degree-days, warm mean daily temperatures (i.e., 10°C), and surrounding alternative hosts interacted to alter risk of WCM infestation and WSMV infection. Wheat surrounded by Bromus tectorum L. and preharvest volunteer wheat had WCM infestation and WSMV infection rates of 88% in years when the mean daily temperature was 15°C in October, compared with 23% when surrounded by bare ground, and 1% when the temperature was 0°C regardless of surrounding alternative host. Mean daily temperatures in the cereal-growing regions of Montana during autumn are marginally conducive to WCM population growth and movement. As the region continues to warm, the period of WCM movement will become longer, potentially increasing the frequency of WSMV outbreaks. 9 Wheat resistances to Fusarium root rot and head blight are both associated with deoxynivalenol and jasmonate related gene expression Fusarium graminearum is a major pathogen of wheat causing Fusarium head blight (FHB). Its ability to colonize wheat via seedling root infection has been reported recently. Our previous study on Fusarium root rot (FRR) has disclosed histological characteristics of pathogenesis and pathogen defense that mirror processes of spike infection. Therefore, it would be interesting to understand whether genes relevant for FHB resistance are induced in roots. The concept of similar-acting defense mechanisms provides a basis for research at broad Fusarium resistance in crop plants. However, molecular defense responses involved in FRR as well as their relation to spike resistance are unknown. To test the hypothesis of a conserved defense response, a candidate gene expression study was conducted to test the activity of selected prominent FHB defense-related genes in seedling roots, adult plant roots, spikes and shoots. FRR was examined at seedling and adult plant stages to assess age-related pattern of disease and pathogen resistance. This study offers first evidence for a significant genetic overlap in root and spike defense responses, both in local and distant tissues. The results point to plant development-specific rather than organ-specific determinants of resistance, and suggest roots as an interesting model for studies on wheat-Fusarium interactions. 10 Three-Dimensional Analysis of Chloroplast Structures Associated with Virus Infection Chloroplasts are multifunctional organelles whose morphology is affected by environmental stresses. Although the three-dimensional (3D) architecture of thylakoid membranes has been reported previously, a 3D visualization of chloroplast under stress has not been explored. In this work, we used a positive-strand RNA ((+)RNA) virus, barley stripe mosaic virus (BSMV) to observe chloroplast structural changes during infection by electron tomography. The analyses revealed remodeling of the chloroplast membranes, characterized by the clustering of outer membrane-invaginated spherules in inner membrane-derived packets. Diverse morphologies of cytoplasmic invaginations ( CI s) were evident with spherules at the periphery and different sized openings connecting the CI s to the cytoplasm. Immunoelectron microscopy of these viral components verified that the aberrant membrane structures were sites for BSMV replication. The BSMV αa replication protein localized at the surface of the chloroplasts and played a prominent role in eliciting chloroplast membrane rearrangements. In sum, our results have revealed the 3D structure of the chloroplasts induced by BSMV infection. These findings contribute to our understanding of chloroplast morphological changes under stress conditions and during assembly of plant (+)RNA virus replication complexes. 11 No Time to Waste: Transcriptome Study Reveals that Drought Tolerance in Barley May Be Attributed to Stressed-Like Expression Patterns that Exist before the Occurrence of Stress Plant survival in adverse environmental conditions requires a substantial change in the metabolism, which is reflected by the extensive transcriptome rebuilding upon the occurrence of the stress. Therefore, transcriptomic studies offer an insight into the mechanisms of plant stress responses. Here, we present the results of global gene expression profiling of roots and leaves of two barley genotypes with contrasting ability to cope with drought stress. Our analysis suggests that drought tolerance results from a certain level of transcription of stress-influenced genes that is present even before the onset of drought. Genes that predispose the plant to better drought survival play a role in the regulatory network of gene expression, including several transcription factors, translation regulators and structural components of ribosomes. An important group of genes is involved in signaling mechanisms, with significant contribution of hormone signaling pathways and an interplay between ABA, auxin, ethylene and brassinosteroid homeostasis. Signal transduction in a drought tolerant genotype may be more efficient through the expression of genes required for environmental sensing that are active already during normal water availability and are related to actin filaments and LIM domain proteins, which may function as osmotic biosensors. Better survival of drought may also be attributed to more effective processes of energy generation and more efficient chloroplasts biogenesis. Interestingly, our data suggest that several genes involved in a photosynthesis process are required for the establishment of effective drought response not only in leaves, but also in roots of barley. Thus, we propose a hypothesis that root plastids may turn into the anti-oxidative centers protecting root macromolecules from oxidative damage during drought stress. Specific genes and their potential role in building up a drought-tolerant barley phenotype is extensively discussed with special emphasis on processes that take place in barley roots. When possible, the interconnections between particular factors are emphasized to draw a broader picture of the molecular mechanisms of drought tolerance in barley. 12 How exogenous nitric oxide regulates nitrogen assimilation in wheat seedlings under different nitrogen sources and levels Nitrogen (N) is one of the most important nutrients for plants and nitric oxide (NO) as a signaling plant growth regulator involved in nitrogen assimilation. Understanding the influence of exogenous NO on nitrogen metabolism at the gene expression and enzyme activity levels under different sources of nitrogen is vitally important for increasing nitrogen use efficiency (NUE). This study investigated the expression of key genes and enzymes in relation to nitrogen assimilation in two Australian wheat cultivars, a popular high NUE cv. Spitfire and a normal NUE cv. Westonia, under different combinations of nitrogen and sodium nitroprusside (SNP) as the NO donor. Application of NO increased the gene expressions and activities of nitrogen assimilation pathway enzymes in both cultivars at low levels of nitrogen. At high nitrogen supplies, the expressions and activities of N assimilation genes increased in response to exogenous NO only in cv. Spitfire but not in cv. Westonia. Exogenous NO caused an increase in leaf NO content at low N supplies in both cultivars, while under high nitrogen treatments, cv. Spitfire showed an increase under ammonium nitrate (NH4NO3) treatment but cv. Westonia was not affected. N assimilation gene expression and enzyme activity showed a clear relationship between exogenous NO, N concentration and N forms in primary plant nitrogen assimilation. Results reveal the possible role of NO and different nitrogen sources on nitrogen assimilation in Triticum aestivum plants. 13 Reference Quality Genome Assemblies of Three Parastagonospora nodorum Isolates Differing in Virulence on Wheat Parastagonospora nodorum , the causal agent of Septoria nodorum blotch of wheat, has emerged as a model necrotrophic fungal organism for the study of host-microbe interactions. To date, three necrotrophic effectors have been identified and characterized from this pathogen, including SnToxA, SnTox1, and SnTox3. Necrotrophic effector identification was greatly aided by the development of a draft genome of Australian isolate SN15 via Sanger sequencing, yet remained largely fragmented. This research presents the development of near-finished genomes of *P. nodorum *isolates Sn4, Sn2000, and Sn79-1087 using long-read sequencing technology. RNAseq analysis of isolate Sn4 consisting of eight time-points covering various developmental and infection stages mediated the annotation of 13,379 genes. Analysis of these genomes revealed large-scale polymorphism between the three isolates, including the complete absence of contig 23 from isolate Sn79-1087 and a region of genome expansion on contig 10 in isolates Sn4 and Sn2000. Additionally, these genomes exhibit the hallmark characteristics of a 'two-speed' genome, being partitioned into two distinct GC-equilibrated and AT-rich compartments. Interestingly, isolate Sn79-1087 contains a lower proportion of AT-rich segments, indicating a potential lack of evolutionary hot spots. These newly sequenced genomes, consisting of telomere to telomere assemblies of nearly all 23 *P. nodorum *chromosomes provides a robust foundation for the further examination of effector biology and genome evolution. 14 Exploration of Mechanisms for Internal Deterioration of Wheat Seeds in Postharvest Storage and Nitrogen Atmosphere Control for Properties Protection Wheat ( Triticum aestivum L.) seeds were stored in simulated conditions of four regions for 300 d. Changes of biochemical properties and electron microscope pictures demonstrated that unfavorable storage conditions caused serious internal deterioration and promoted the accumulation of unhealthy products in wheat seeds. Two hypotheses were proposed to explain the internal deterioration during storage. This work confirmed that the unfavorable storage conditions damaged enzymatic scavenging systems. As a result, without an effective scavenging system, serious internal deterioration occurred in wheat seeds. Atmospheric composition was adjusted to evaluate the potential of applying nitrogen atmosphere control in wheat storage. The results showed that 98% nitrogen gas in atmosphere effectively protected scavenging systems in wheat seeds and alleviate the internal deterioration. 15 Winter Wheat Yield Gaps and Patterns in China Wheat ( Triticum aestivum L.) yield stagnation has been reported in some regions of the world. China is the largest producer of wheat across the globe, but the pattern of its wheat yield stagnation remains poorly addressed. Here, our goal is to examine the temporal trends and spatial patterns of wheat yields along with possible causes based on a comprehensive assessment of winter wheat yield throughout China over the 31-yr period from 1980 to 2010. Combined with the Agricultural Production Systems Simulator (APSIM) wheat model, we assessed the winter wheat yield gaps and patterns in 1414 counties and at five physiogeographic regional scales across China to ascertain the driving factors of yield variations. Wheat yields increased in 53% of the 1414 counties, but the remaining counties experienced yields that never improved, stagnated, or collapsed from 1980 to 2010. The yield gap analysis showed that actual yields represented only 59% of the national average yield potential, indicating a substantial opportunity to improve winter wheat yields. Relatively larger yield gaps were observed in the northern China Plain (NC, 47%) and in southwestern China (SW, 45%). Although the yield gaps in these regions were accompanied by significantly progressive uptrends of actual yields, our results suggest that agronomic management could be further improved. Moreover, underperforming regions could potentially benefit from new investments and strategies to reliably increase actual yields and reverse trends in stagnation in winter wheat performance. 16 Pangenome analyses of the wheat pathogen Zymoseptoria tritici reveal the structural basis of a highly plastic eukaryotic genome We constructed and analyzed the pangenome of Zymoseptoria tritici , a major pathogen of wheat that evolved host specialization by chromosomal rearrangements and gene deletions. We used single-molecule real-time sequencing and high-density genetic maps to assemble multiple genomes. We annotated the gene space based on transcriptomics data that covered the infection life cycle of each strain. Based on a total of five telomere-to-telomere genomes, we constructed a pangenome for the species and identified a core set of 9149 genes. However, an additional 6600 genes were exclusive to a subset of the isolates. The substantial accessory genome encoded on average fewer expressed genes but a larger fraction of the candidate effector genes that may interact with the host during infection. We expanded our analyses of the pangenome to a worldwide collection of 123 isolates of the same species. We confirmed that accessory genes were indeed more likely to show deletion polymorphisms and loss-of-function mutations compared to core genes. 17 Expressed Ay HMW glutenin subunit in Australian wheat cultivars indicates a positive effect on wheat quality Out of the six HMW-GS genes, 1Ay is usually not expressed in bread wheat cultivars . In the current study, an active 1Ay gene has been integrated into two Australian wheat cultivars, Livingston and Bonnie Rock, through conventional backcross approach. Three sister lines at BC4F4 generation for each cross were obtained and underwent a series of quality testing. Results show that the active 1Ay subunit increased the amount total protein, Glutenin/Gliadin ratio and unextractable polymeric protein. The expressed 1 Ay also resulted in up to 10% increase of gluten content, 5% increase of glutenin, and hence increased the HMW- to LMW-GS ratio without affecting the relative amount of other subunits. Milling yield and Flour swelling were decreased in the Livingston lines and remained mostly unchanged for Bonnie Rock. Alveograph result showed that Ay improved dough strength in Livingston and dough extensibility in Bonnie Rock. Zeleny sedimentation value was found to be higher in all three lines of Bonnie Rock but only in one of Livingston derivatives. The dough development time and peak resistance, determined on the micro Z-arm mixer were increased in most cases. Overall, the integration of Ay subunit showed significant positive effects in bread making quality.
个人分类: 文献推荐|3925 次阅读|0 个评论
Science:小麦秆锈无毒基因AvrSr50
mashengwei 2017-12-29 08:44
12 29 本期作者:大汉武 胖丫 前几天关于锈病无毒基因解读的年末大餐( 年末的惊喜一:小麦锈病史上具有里程碑意义的进展! , 再析小麦锈病里程碑进展-植物病害流行学角度 ),不知大家感受如何?小编悄悄看了下阅读量,创了历史新高,这倒不是解读的好,主要是结果太震撼了!同时也看出大家的关注程度,抗病这块在小麦育种中还是举足轻重。 就在文章刚刚出来那会,小编第一时间联系到了文章的作者陈嘉鹏博士和 Zhang Peng 老师(这里首先感谢同门晓果同学和河北农大李在峰老师积极的联系),了解到文章背后的一些小故事。多说一句,通讯作者Robert F. Park和Peter N. Dodds可谓是植物病理界冉冉升起的新秀。 在介绍本篇文章之前,首先要回顾两个常识,锈菌有两个核;锈菌是活体寄生,通过自身发育的吸器进入寄主细胞壁与细胞膜形成类似三明治结构。 本文用到两个小种,即野生型 Pgt279 和发生自然变异的 Pgt632 ,前者不可以侵染含有抗病基因 Sr50 的小麦材料,后者可以。作者对这两个小种的基因组进行了全基因组重测序,经过多步生信分析和筛选,两个小种与锈菌参考基因组PGTAus-pan相比分别约有110万个杂合变异(包括单碱基/多碱基的变异, single/multiple nucleotide variants, SNVs/MNVs ; 和小片段插入及缺失)。(为什么作者费力的要挖掘杂合差异?在这里先卖个关子,后面会详细说明。)根据现有的认知,亚麻锈的无毒基因在吸器中表达,因此,作者优先鉴定了编码吸器分泌蛋白haustorial secreted protein (以下简称HSP)的基因592个。尽管没有新的非同义突变nonsynonymous(这次搞对了,哈哈) ,但是有18个HSP基因在 Pgt632 内发生了杂合性丢失(loss-of-heterozygosity,以下简称LOH,可以理解为在染色体发生重组时,其中一条染色体上的一小段发生了丢失)。通过比较这18个HSP基因的物理位置发现,LOH横跨了大约2.5Mb的物理区间,该区间包含4个完整的scaffolds以及1个scaffolds的部分,如下图 Pgt632 的杂合性丢失可能是突变体发生了片段缺失,这会使该区域的DNA拷贝数减半;或者是两个单倍核发生体细胞重组,此时DNA拷贝数不会变化。所以只要检测DNA拷贝数是否变化就可以验证 Pgt632 的杂合性丢失是如何发生的。这个问题就简单了,统计该区域标准化之后的reads覆盖度发现,野生型 Pgt279 和突变型 Pgt632 之间DNA拷贝数相同。进一步对该区域内的一些基因位点进行覆盖度统计和分析,发现两个小种之间也没有差异。如下图A-C 进一步的定量PCR实验验证拷贝数未发生变化。 我想作者此刻的心情是无比兴奋的,他坚定地得出以下结论:该区域的杂合性丢失是由锈菌中的两个单倍核型发生了交换引起的。于是给出了以下几句话(我个人觉得这是本文最重要的发现之一):Although it is not clear how genetic exchange occurs between the two separate haploid nuclei, which are thought to replicate independently , genetic evidence suggests that nuclear exchange and recombination between coinoculated rust isolates can result in previously unknown virulence combinations . There is also evidence for nuclear fusion in Pgt , and somatic hybridization has been postulated as a mechanism underlying the emergence of new lineages in asexual rust populations . 大意是虽然目前还不清楚两个单独的单倍体细胞核之间是如何发生遗传交换的,但遗传证据却表明以前被认为独立复制的两个核的确发生了遗传物质的交换,这种遗传交换会引起小种毒力的变化,以往已经有很多证据,比如核融合,体细胞杂交等都是除了有性重组之外引起遗传物质变化的重要原因。 既然推出了突变型突变的可能原因,那么接下来如何拿到候选基因呢?此刻一个不容忽视的问题摆在了面前,该区间约有2.5Mb。作者率先将该区域所有可能的HSP基因注释了一遍,共有24个,然后比较他们在突变菌Pgt632上丢失但是在野生菌Pgt279杂合率接近0.5的,再进行实验验证。最后只有一个AvrSr50 candidate, 当HSP#8 (HSGS210 |asmbl_13131|m.9539) 与Sr50共表达后能够成功引起细胞坏死实验,并通过酵母双杂等一系列实验验证了结果。这个无毒基因编码132氨基酸,且与已知的鉴定出来的无毒蛋白没有同源性,AvrSr35编码的是578氨基酸,目前同样也是独一的,看来小麦锈菌的无毒蛋白多样 性还很丰富。 还有一张图,见下。作者主要对秆锈菌编码外泌蛋白的基因表达进行了聚类分析,分别从吸器,牙管,及侵染小麦叶片2-7天的这几个层面。 到了这里,本篇解析基本完毕。但是标题说了,还有背后的故事,哈哈。确实有点小故事,彩蛋来了。话说当年Park教授在温室中像往常一样对秆锈菌进行扩繁或者鉴定工作,当他用 Pgt279 (野生型,不侵染 Sr50 基因材料)对含有 Sr50 的小麦材料接种时,突然发现后代出现了致病反应,Park很兴奋,小心的把它保存起来,在排除了锈菌污染和小麦材料可能是假杂种后,他们于2015年便开展了上述研究。另外,同年Lagudgh(偶像之一)率领的团队成功克隆到 Sr50 基因,为Park后期的工作奠定了坚实的基础。小编不由感慨,如果Park当时认为是由污染引起的而忽略它,可能就没有今天这个故事了,所以,科研实验还是要善于观察,留心记录的,另外还要有丰富的基础知识,大胆提出假设。这两篇文章的一作貌似都是做生物信息出身的(再次对生信人顶礼膜拜!),他们通过科学的算法使得科研思路能够实现。当然,也非一帆风顺,本篇一作嘉鹏博士邮件里跟我说,他们后面总共在候选区域预测了25个候选基因,实际上是一个一个进行了验证,当验证到第15个的时候,结果出来了.....看来科研还需要一颗恒心,一次两次失败不要紧,三次四次不要紧,起码像人家弄到15次,哈哈。每一个成功的背后都是辛苦的付出,探究永远在路上! 欢迎关注 “ 小麦研究联盟 ”, 了解小麦新进展 请点击此处输入图片描述 投稿、转载、合作以及信息分布等请联系: wheatgenome
4338 次阅读|0 个评论
ATAC-seq这么火?
mashengwei 2017-12-19 16:30
最近, Plant Cell 发表了一篇题为《 Profiling of AccessibleChromatin Regions Across Multiple Plant Species and Cell Types Reveals CommonGene Regulatory Principles and New Control Modules 》的文章,作者是埃默里大学的 Roger B. Deal 。虽然不是小麦相关的文章,但是笔者认为这个研究值得一看。 这篇文章用 ATAC-seq 技术来研究四种不同植物的转录调控位点,要想读懂这篇文章,我们首先需要了解什么是 ATAC-seq 。 ATAC-seq 的全称是 Assay for Transposase-Accessible Chromatin with high throughputsequencing 。在基因组上,有很多开放的染色质区域,这些区域是转录因子和转录元件的重要结合位点。 ATAC-seq 技术利用 T5 转座酶,将测序的 adaptor 插入这些转录因子结合区域,获得转录因子结合位点等关键信息(图 1 )。 在此之前,其实已经有多种手段可以用来研究转录调控区域。比如 DNAse-seq 和 FAIRE-seq ,但是相比于这两个技术, ATAC-seq 具有样本数目少(约 500 个细胞就足够)、时间短等特点(图 2 ),在转录组学和表观遗传学等方面的作用令人值得期待,因此在近期具有相当高的研究热度。 这篇 PC 文章中,作者准备了拟南芥,苜蓿,番茄,水稻根尖部位细胞,还有拟南芥的根毛细胞和无根毛表皮细胞等样本,对这些细胞进行纯化后用 ATAC-seq 技术获得了开放染色质序列。作者首先比较了三种纯化或者测序方法( INTACT-purified , Crude nuclei 和 DNAse-seq )的差异,发现 Crude nuclei 的方法有太多的细胞器基因组序列,另两种方法( INTACT-purified-ATAC-seq 和 DNAse-seq )的吻合度较高。紧接着,作者分析了四个物种中根尖细胞中 THS (transposase hypersensitive sites) 的数目以及到 TSS 的距离,发现除了番茄每个基因平均的 THS 数目相比其他三个物种较高,其他数据在不同物种中有较好的一致性。 通过研究根毛细胞( root hair cells, H )和无根毛表皮细胞( root epidermal non-hair cells, NH )不同细胞的 ATAC-seq 数据,发现绝大多数的 THS 区域是相似的,细胞特有的 THS ( dTHS )大约有几千个。通过对两种细胞的转录因子进行分析,发现在根毛细胞中表达量更高的转录因子,其结构域与根毛细胞的 dTHS 序列有着显著的关联性。作者着重分析了 ABI5, MYB33 和 NAC083 这三个转录因子,发现了一个根毛细胞特有的 MYB 调控模型,能同时控制细胞调节器( cell fate regulators )和非生物应激反应。 当然,这篇文章还有很多其他结论,在这里小编就不一一罗列了,希望读者们能自己去认真读一读。该作者另有一篇 ATAC-seq 应用的文章同时在预印本上公布( Chromatin accessibility changes between Arabidopsis stem cells andmesophyll cells illuminate cell type-specific transcription factor networks ),只是暂时还未正式发表。 在此之前,也有课题组就植物的 ATAC-seq 进行了相关研究。最早的一篇文章也是发表在 Plant Cell 上的,应用 ATAC-seq 对水稻抗逆进行了调控方面的研究( EGRINs (EnvironmentalGene Regulatory Influence Networks) in Rice That Function in the Response toWater Deficit, High Temperature, and Agricultural Environments OPEN )。第二篇则是发表在核酸研究上,主要是有一个特有的 fluorescence-activatednuclei sorting (FANS) 技术而不是常规的去细胞器步骤( Combining ATAC-seqwith nuclei sorting for discovery of cis-regulatory regions in plant genomes )。第三篇则是今年六月发表在 Genome Biology 上,讲述了 SWI/SNF 蛋白如何通过调控开放染色质区域来调节基因表达,是一篇较为完整的研究 ( The Arabidopsis SWI/SNF protein BAF60 mediates seedlinggrowth control by modulating DNA accessibility )。 因此,我们可以发现,目前为止 ATAC-seq 相关的研究几乎都发表了大文章,那么我们小麦是不是也可以应用这个技术来做一些什么呢?生物信息学最喜欢做的事就是找差异和找相同,我们小麦异源六倍体的特性,很容易让人想到,可以利用 ATAC-seq 技术来研究 A 、 B 、 D 三个亚基因组的转录因子结合位点的差异,从而研究同源基因的表达调控差异。而六倍体与二倍体、四倍体等位基因间调控位点的比较,也是让人颇感兴趣的一个话题。当然,小麦的重复序列以及高度同源对于测序数据分析的难度增加是一个亘古不变的话题,但是难题都是可以解决的嘛,如果有朋友对此感兴趣,不妨来试一试这个新技术。 欢迎关注“ 小麦研究联盟 ” ,了解小麦新进展
个人分类: 文献推荐|26154 次阅读|0 个评论
Nature_Dissect the bread wheat genome
xiaofeicas 2012-12-12 11:08
Dissect the bread wheat genome using next-generation sequencing. The sequence data do cover nearly all wheat genes. The size of wheat genome is about 17 gigabase pairs. About 80% of the genome sequences are repetitive sequences. 94,000-96,000 genes were identified, and this number is consistent with the number of genes identified from A, B and D genome ( T. monococcum and Ae. speltoides and Ae. tauschii ). Based on the sequence data from T. monococcum and Ae. speltoides and Ae. tauschii , 2/3 of these identified genes were assigned to A, B and D genome. Using the full-length cDNA sequences from rice, sorghum, brachypodium and barley, the 454 reads of bread wheat were assembled and 949,279 sequences were identified. By comparing these sequences with the Brachypodium genome, the sequence conservation was investigated. Brachypodium sequence on 1 and 4 chromosomes showed less conservative with sequences from bread wheat. Generally, genes lost during the polyploidy process. But several class of gene families with the role of defence, nutrition content, energy metabolism and growth have increased size (due to domestication). I think, the major contribution of this work is that it produced nearly all the wheat genome sequence and assembled nearly all gene sequences. But no physical map, no location of these genes. It is much easier to get the copy number of certain gene in bread wheat. Here is the report from Scientific American _" New Slice of Wheat Genome Could Help Feed Growing Global Population " http://blogs.scientificamerican.com/observations/2012/11/28/new-slice-of-wheat-genome-could-help-feed-growing-global-population/ Decoding our daily bread_Peter Langridge.pdf wheat genome_nature_2012.pdf
3085 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-16 02:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部