高端的电影网站,做网站镜像,做网站用的hu软件,什么源码做有趣的网站The Genome of Medicinal Plant Macleaya cordata Provides New Insights into Benzylisoquinoline Alkaloids Metabolism药用植物博落回基因组为苄基异喹啉生物碱代谢研究提供新见解摘要动物养殖业与医学领域中抗生素的过度使用已对公共卫生构成一系列潜在威胁。博落回#x…The Genome of Medicinal Plant Macleaya cordata Provides New Insights into Benzylisoquinoline Alkaloids Metabolism药用植物博落回基因组为苄基异喹啉生物碱代谢研究提供新见解摘要动物养殖业与医学领域中抗生素的过度使用已对公共卫生构成一系列潜在威胁。博落回Macleaya cordata是罂粟科Papaveraceae药用植物为畜禽用抗菌饲料添加剂的研发提供了安全资源。已知博落回的活性成分包括血根碱sanguinarine, SAN、白屈菜红碱chelerythrine, CHE等苄基异喹啉生物碱benzylisoquinoline alkaloids, BIAs但该非模式植物中此类生物碱的代谢通路尚未见系统研究。本研究首先通过 13C 标记酪氨酸饲喂实验验证了博落回中 SAN 与 CHE 的主动生物合成过程。为深入解析其分子机制我们完成了博落回全基因组从头测序这是罂粟科植物的首个基因组测序研究。博落回基因组大小为 378 Mb预测编码 22,328 个蛋白编码基因转座元件占比 43.5%。作为基部真双子叶植物的代表博落回基因组未经历几乎所有真双子叶植物均发生过的古六倍体化事件。基于基因组数据我们鉴定获得了完整的 SAN 与 CHE 生物合成通路基因集共 16 个基因并验证了其中 14 个基因的生化功能。这些基因组与代谢组数据揭示了博落回中保守的 BIA 代谢通路为通过作物遗传改良或微生物通路重构实现 SAN 与 CHE 的规模化生产奠定了理论基础。引言动物养殖业与医学领域中抗生素的过度使用已对公共卫生构成一系列潜在威胁Aarestrup, 2000Aarestrup, 2012。为此欧盟自 2006 年起禁止养殖户在动物饲料中添加抗生素生长促进剂Gilchrist 等2007Phillips, 2007Aarestrup, 2012。取而代之的是植物源性物质等天然生长促进剂natural growth promoters, NGPs被广泛开发作为畜禽生产中抗生素的替代物Windisch 等2008。血根碱sanguinarine, SAN和白屈菜红碱chelerythrine, CHE因其显著的抗菌活性和动物生长促进作用受到学术界和工业界的广泛关注Chaturvedi 等1997Kosina 等2004Kosina 等2010。目前含 SAN 的产品已在 70 个国家上市Ikezawa 等2009。北美血根草Sanguinaria canadensis是美国中东部的本土植物也是全球 SAN 生产的主要原料来源但由于过度开采该物种被美国植物保护协会列为 受威胁物种Predny 和 Chamberlain, 2005。尽管罂粟科的罂粟Papaver somniferum能够生物合成 SAN但该植物同时会产生吗啡和可待因两种主要麻醉性镇痛药Park 等1999Samanani 和 Facchini, 2001Dang 等2012Hagel 和 Facchini, 2013Beaudoin 和 Facchini, 2014。由于阿片类药物存在成瘾性风险且可能引发政治争议全球对罂粟的大规模种植实施了严格限制。因此寻找可靠的 SAN 替代来源迫在眉睫。博落回Macleaya cordata中文名 博落回补充图 1A是罂粟科多年生草本植物传统上被用作抗菌药物Kosina 等2010Sai 等2015其功效与用法在唐代早期的植物学与药物学百科全书《本草拾遗》中已有详细记载。更重要的是该植物能产生高含量的抗菌性苄基异喹啉生物碱benzylisoquinoline alkaloids, BIAs如 SAN、CHE、原阿片碱protopine, PRO和别隐品碱allocryptopine, ALLZeng 等2013Sai 等2015而吗啡、可待因等成瘾性 BIA 则完全不存在补充图 1B。因此博落回是替代北美血根草作为 SAN 工业化生产商业原料的理想选择。该植物已被欧洲食品安全局EFSA批准为饲料添加剂生产用安全植物Franz 等2005。然而尽管博落回在中国、日本、俄罗斯、乌克兰等国均有分布Xuan, 1993但它目前仍是野生物种尚未实现广泛栽培这限制了其作为天然生长促进剂中 SAN 来源的进一步开发利用。除了从植物中直接提取外在微生物宿主中重构异源代谢通路作为植物天然产物可持续生产的策略已引起学术界和工业界的关注Paddon 等2013Narcross 等2016Nielsen 和 Keasling, 2016Xiao 和 Zhong, 2016。尽管包括 SAN 在内的多种重要 BIA 的完整生物合成通路已被阐明且其在微生物宿主中的异源生产已得到证实但产量通常仅为微克至毫克每升水平无法达到工业化生产所需的浓度1 g/LFacchini 等2012Fossati 等2014Brown 等2015DeLoache 等2015Galanie 等2015Narcross 等2016Schlager 和 Drager, 2016。从不同植物物种中获取具有理想催化活性的新型生物合成酶或酶变体有助于推动植物天然产物的代谢工程研究Fossati 等2014DeLoache 等2015Galanie 等2015Trenchard 和 Smolke, 2015。随着新技术的出现和测序成本的显著降低基因组测序已成为研究未探索非模式生物植物代谢的基础且强大的工具Zerikly 和 Challis, 2009De Luca 等2012Chae 等2014。已测序的植物基因组将为发现植物中的生物合成酶和基因簇奠定基础Itkin 等2013Nutzmann 和 Osbourn, 2014Shang 等2014Boutanaev 等2015。本研究完成了罂粟科植物的首个基因组测序并采用同位素追踪、代谢物谱分析和同源克隆等整合策略解析了博落回中 SAN 和 CHE 的生物合成通路。通过对通路中间产物和终产物的深入分析揭示了该植物高效生产 SAN 和 CHE 过程中可能涉及的调控与转运机制。结果博落回中保守的 SAN 和 CHE 生物合成通路SAN 和 CHE 的生物合成始于两种酪氨酸衍生物多巴胺和 4 - 羟基苯乙醛在去甲乌药碱合酶的催化下缩合生成去甲乌药碱Ziegler 和 Facchini, 2008Beaudoin 和 Facchini, 2014。随后通过一条共同通路从去甲乌药碱生成斯阔任碱Facchini 和 De Luca, 1994Pauli 和 Kutchan, 1998Choi 等2001Ounaroon 等2003Winkler 等2006Lee 和 Facchini, 2010Lee 和 Facchini, 2011Dang 和 Facchini, 2012。在 SAN 生物合成通路中斯阔任碱经细胞色素 P450 酶CFS和斯阔任碱合酶SPS催化转化为 STYLOPINE而在 CHE 通路中斯阔任碱在S- 斯阔任碱 - 9-O - 甲基转移酶SMT和S- 加拿大麻苷合酶TDC的作用下生成四氢 ColumbamineTakeshita 等1995Ikezawa 等2003Ikezawa 等2007Diaz 等2011。随后四种具有广泛底物特异性的酶四氢原小檗碱顺式 - N - 甲基转移酶 [TNMT]、S- 顺式 - N - 甲基 STYLOPINE 14 - 羟化酶 [MSH]、原阿片碱 6 - 羟化酶 [P6H] 和二氢苯并菲啶氧化酶 [DBOX]共同参与 SAN 和 CHE 的生成Liscombe 和 Facchini, 2007Hagel 等2012Beaudoin 和 Facchini, 2013Takemura 等2013。为验证在其他罂粟科植物中发现的完整 SAN 和 CHE 生物合成通路是否在博落回中保守我们采用液相色谱 - 质谱联用LC/MS技术进行靶向代谢物谱分析。所有中间化合物Cp1 至 Cp32通过化学合成、商业采购或植物分离获得补充表 1其结构经核磁共振NMR光谱验证补充图 2-7。将 13C6苯环标记的酪氨酸Cp1加入培养基后利用这些标准品鉴定图 1 所示的植物体内代谢中间产物。LC/MS 分析结果显示除 6 - 羟基原阿片碱Cp16和 6 - 羟基别隐品碱Cp23外图 1 及补充图 8-10补充表 2其余所有中间产物均在博落回中检测到这两种化合物分别可自发转化为二氢血根碱Cp17和二氢白屈菜红碱Cp24Takemura 等2013。这些结果表明SAN 和 CHE 生物合成通路在罂粟科中具有保守性。有趣的是在酵母异源合成 SAN 过程中产生的两种不良副产物 ——N - 甲基斯阔任碱Cp26和 N - 甲基白屈菜红碱Cp27Fossati 等2014首次在植物中被检测到图 1 及补充图 11其结构经 NMR 分析进一步验证补充图 12-13。这些结果提示博落回中存在涉及 Cp26 和 Cp27 的代谢网络而非线性代谢通路。图 1 博落回中血根碱SAN与白屈菜红碱CHE的生物合成通路化合物的 [苯环 -¹³C₆] 标记结构以蓝色标注推测的旁路途径以橙色虚线箭头表示。我们进一步分析了博落回不同组织的代谢物谱。在其他罂粟科植物中根是 SAN 和 CHE 生物合成的主要组织Hagel 等2012Lee 等2013。与之相反博落回中 SAN 和 CHE 主要在蒴果中积累表明该生物合成过程可能涉及蒴果特异性表达的酶或潜在转运蛋白图 2A。值得注意的是SANCp18和 CHECp25的前体物质 —— 原阿片碱PRO, Cp15和别隐品碱ALL, Cp22的定量代谢物谱显示二者在根中积累量最高在叶、花和蒴果中呈中等水平积累图 2A而在茎组织中仅检测到微量的 PRO 和 ALL图 2A。其他中间产物也呈现类似的组织分布模式尽管其丰度显著低于 PRO 和 ALL补充图 14。图 2 代谢物分布与候选酶表达谱的相关性(A) 博落回 5 种不同组织中终产物血根碱、白屈菜红碱及两种高积累中间产物原阿片碱、别隐品碱的绝对定量分析。数据以平均值 ± 标准差表示n4。(B) 39 个候选酶的表达谱采用梯度颜色呈现。基因表达量TPM经 log₂标准化处理表达模式通过 R 包Pheatmap绘制。最小值统一设为 - 5对应原始值 0。具有预期表达模式的基因红色标注被筛选用于后续功能验证。预测基因的具体表达数值见补充表 15。博落回基因组从头测序与组装为系统解析博落回中 SAN 和 CHE 生物合成的代谢机制我们对其进行了全基因组从头测序。博落回为二倍体植物染色体数目 2n20分为 10 对同源染色体补充图 15。通过 HiSeq 2000 测序平台由诺禾致源提供构建 6 个插入片段长度为 180 bp 至 10 kb 的基因组文库共产生 256.5 Gb 的双末端序列读长 100 bp基因组覆盖度约 466.4×补充表 3。19-kmer 分析显示博落回基因组大小约为 540.5 Mb杂合率为 0.92%补充图 16 及补充表 4。最终组装结果包含 4551 个 scaffold总长度 378 Mbscaffold N50 和 contig N50 分别为 308 kb 和 25 kb补充表 5。最长 scaffold 长度为 5.6 Mb1426 个长度大于 51.9 kb 的 scaffold 占组装基因组的 90%并覆盖 95.4% 的注释基因。推测的 540.5 Mb 基因组中约 30% 未被组装可能与博落回基因组中重复序列占比高63.1%相关。为验证组装序列的高覆盖度将可用表达序列标签EST映射至组装基因组利用 BLAT 软件Kent, 2002默认参数分析显示组装序列包含 NCBI 数据库中 395 条博落回 EST 的 95%。采用 Trinity 软件V2.1.0默认参数基于 22 个博落回样本的 RNA 测序RNA-seq数据进行从头全长转录本组装Haas 等2013通过 BLASTTBLASTNe 值 1e-20分析22328 个注释基因模型中 89%19890/22328与全长转录本组装序列存在重叠补充表 6。基于 BUSCO 软件V2Simão 等2015评估组装序列中鉴定到 91.3%1315/1440的完整真核生物保守基因和 90.4%388/429的完整植物保守基因表明最终组装基因组的编码区覆盖度较高。组装结果中未获得完整线粒体基因组以莲Nelumbo nucifera线粒体基因组为参考GenBank 登录号 KR610474通过 blastp 分析e 值 1e-5覆盖度 0.5一致性 0.5鉴定到 32 个同源线粒体基因但未发现所有基因均与线粒体基因同源的 scaffold仅 3 个 scaffold 中超过 50% 的基因与线粒体基因同源。由于测序材料为博落回根组织组装过程中已过滤叶绿体基因组以莲叶绿体基因组为参考GenBank 登录号 KM655836通过 blastn 分析e 值 1e-10覆盖度 0.9未发现与叶绿体基因组高度相似的 scaffold。博落回基因组的转座元件与基因注释结合同源预测与从头预测方法鉴定到转座元件TEs占组装基因组的 43.5%157.7 Mb补充表 7低于 19-kmer 分析预测的 63.1%提示未组装区域主要由重复序列构成。优势转座元件为长末端重复LTR逆转录转座子占 104.8 Mb占所有鉴定转座元件的 66.5%。其中Copia 类和 Gypsy 类元件Suoniemi 等1998在拷贝数和基因组占比上相近分别为 37.3 Mb 和 51.3 Mb补充表 8。约 70% 的 LTR 序列与已知重复序列无同源性表明博落回基因组中的转座元件多为支系特异性。采用三种基因预测方法cDNA-EST 辅助预测、同源预测、从头预测共预测到 22328 个蛋白编码基因基因、外显子和内含子的平均长度分别为 3708 bp、237 bp 和 577 bp补充表 9。约 94.03% 的基因在 TrEMBL 蛋白数据库中存在同源序列阈值 e 值 1e-578.61% 的基因可通过 InterPro 数据库进行功能分类总计 94.54% 的基因具有已知同源序列或可被功能注释补充表 10。此外基于 RNA-seq 数据超过 88% 的基因在根、叶或果实中表达表明博落回基因组的基因预测准确性较高。同时在博落回基因组中鉴定到 1355 个非编码 RNAncRNA基因包括 216 个 rRNA、815 个 tRNA、75 个 microRNA 和 249 个小核 RNA 基因补充表 11。基因家族进化分析基于序列相似性比对利用博落回及其他 11 种已测序被子植物的蛋白编码基因集鉴定推定直系同源基因簇Li 等2003。以无油樟Amborella trichopoda为外类群307143 个非冗余基因被划分为 33824 个直系同源基因簇每个簇至少包含 2 个基因。博落回的 19198 个基因分属 12933 个基因家族平均每个家族含 1.5 个基因。其中337 个家族为博落回特有包含 1122 个基因图 3A。该分类结果显示10302 个基因家族在真双子叶植物三大基部支系中均存在很可能代表基部真双子叶植物的 “核心蛋白质组”。其中33 个直系同源基因群148 个基因仅特异性存在于三大基部真双子叶植物博落回、莲、耧斗菜 Aquilegia coerulea中。对博落回中这三大基部真双子叶植物特有基因的基因本体GO注释分析揭示了与基部真双子叶植物支系关键创新特征相关的直系同源基因群的起源。图 3 博落回M. cordata基因组进化及基因家族分布(A) 维恩图展示四个测序数据集间基因家族的特有与共有情况基部真双子叶植物绿色、博落回黄色、核心真双子叶植物紫色和单子叶植物粉色。涉及的物种包括 2 种基部真双子叶植物莲、博落回、6 种核心真双子叶植物拟南芥、毛果杨、大豆、葡萄、番茄、马铃薯、2 种单子叶植物水稻、高粱并以无油樟作为外类群。(B) 包含主要谱系测序基因组代表的陆生植物系统发育关系。系统发育树中用星号标注陆生植物进化过程中推测的多倍化事件紫色星号表示 γ 古六倍化事件的进化时间百万年前红色星号表示博落回进化过程中的全基因组加倍WGD事件绿色星号表示其他多倍化事件。(C) 博落回、葡萄和莲的种内及种间基因组 4DTV四倍简并位点颠换率分布。博落回的谱系核苷酸替换速率显著慢于葡萄。基因家族大小的变异是塑造不同物种适应性自然变异的重要机制Guo, 2013。不同谱系间基因家族的平均扩张与收缩程度存在差异补充图 17。在 33,797 个基因家族中479 个基因家族的进化具有非随机性P 0.01其中 131 个基因家族包含博落回的基因。在这 131 个快速进化的基因家族中31 个在博落回的终端分支上发生了显著变化P 0.01其中 28 个显著扩张包含 1030 个基因。例如DBOX 酶负责血根碱SAN合成的最后一步催化反应该基因家族在博落回基因组中显著扩张含 35 个 DBOX 基因而在莲中为 9 个、蓝花耧斗菜中为 4 个、葡萄中为 1 个、拟南芥中为 10 个、水稻中为 5 个补充图 18。多物种共线性与基因组进化全基因组加倍WGD作为基因起源的重要原始素材来源在陆生植物基因组中普遍存在Van de Peer 等2009。约 1.25 亿年前发生的 γ 古六倍化事件在几乎所有已测序的真双子叶植物基因组中均被检测到Vanneste 等2014。作为基部真双子叶植物的博落回其基因组分析显示该物种未经历 γ 事件图 3B这与另一种基部真双子叶植物莲的结果一致Ming 等2013表明基部真双子叶植物可能未发生该古六倍化事件。葡萄与博落回的共线性区块分析发现葡萄中的一个区域通常对应博落回中的两个区域而博落回中的一个区域对应葡萄中的三个区域补充表 12暗示博落回可能经历了一次物种特异性的额外全基因组加倍事件。在该加倍事件中保留的 2344 个博落回基因中1306 个55.7%为单拷贝基因621 个26.5%为双拷贝基因417 个17.8%包含三个以上同源基因补充表 13。旁系同源基因的同义替换率Ks和四倍简并位点颠换率4DTV分布也支持这一特异性全基因组加倍事件。基于博落回与葡萄全基因组水平的 Ks 分布证据博落回的谱系核苷酸替换速率显著慢于葡萄且博落回与葡萄的分化时间早于仅影响葡萄的 γ 三倍化事件。两种基部真双子叶植物博落回与莲的 4DTV 和 Ks 分布特征相似进一步表明博落回的物种特异性全基因组加倍事件发生于约 98±16 百万年前图 3C 及补充图 19。博落回中血根碱SAN与白屈菜红碱CHE的生物合成机制利用博落回基因组数据结合转录组测序和 cDNA 克隆技术我们搜索了 14 个先前报道的参与 SAN 和 CHE 生物合成的酶的直系同源基因包括 9 个来自罂粟的酶6-O - 甲基转移酶 [6OMT]、小檗碱桥酶 [BBE]、TNMT、SMT、CFS、细胞色素 P450 还原酶 [CPR]、MSH、P6H、DBOX、3 个来自耧斗菜的酶4-O - 甲基转移酶 [4OMT]、可待因 N - 甲基转移酶 [CNMT]、TDC以及各 1 个来自蓟罂粟和花菱草的酶SPS、N - 甲基可待因羟化酶 [NMCH]Hagel 和 Facchini, 2013。通过基于序列相似性的基因组搜索共鉴定出 39 个候选基因结合转录组数据进一步筛选后图 2B候选基因数量缩减至 16 个 —— 由于茎中未积累 SAN 和 CHE 的前体物质在缺乏明确生物合成通量证据的情况下首先排除了在茎组织中高表达的酶图 2B。实时荧光定量 PCRqPCR进一步验证了这些候选基因的表达模式补充图 20。为验证候选酶的功能我们将每个 cDNA 在酿酒酵母中表达并通过底物饲喂实验检测其催化能力对于细胞色素 P450 酶将候选 P450 基因与 CPR 基因Mco19967在酵母中共表达。最终共验证了 14 个参与 SAN 和 CHE 生物合成步骤的催化酶包括 McP6HMco11229、Mco11218、Mc6OMT/Mc4OMTMco2833、McCFSMco217、McNMCHMco2661、McTDCMco9485、McCNMTMco769、Mco8567、McTNMTMco833、Mco830、McSMTMco9487、McBBEMco20113和 McDBOXMco6407、Mco06408补充图 21、22。尽管未能阐明 McSPS 和 McMSH 的功能但推测主要原因是其在酵母中的蛋白表达量较低 —— 类似问题在罂粟中 PsSPS 和 PsMSH 的功能验证中也出现过Diaz 等2011Beaudoin 和 Facchini, 2013Fossati 等2014。有趣的是博落回基因组中未鉴定到参与吗啡和可待因分支合成途径的网状番荔枝碱差向异构酶的直系同源基因Farrow 等2015Winzer 等2015这与博落回不合成成瘾性阿片类物质的观察结果一致。除 McP6HMco11229可能比花菱草中的同源酶具有更高的催化活性外图 4 及补充图 23这些酶的催化能力与其他植物物种的同源酶基本相当。图 4 不同植物物种来源 P6H 酶的催化能力比较(A) 转入Mco11229黑色、Mco11218紫色、EcP6H绿色基因的酵母菌株及对照组蓝色产二氢血根碱的液质联用LC/MS图谱。实验所用酵母均饲喂浓度为 10 μM 的底物 Cp15。(B) 对 (A) 中产物目标化合物含量的绝对定量分析。数据以平均值 ± 标准差表示n 3。(C) 转入Mco11229、Mco11218或EcP6H基因的酵母蛋白样品免疫印迹检测结果。肌动蛋白Actin作为内参蛋白采用抗 MYC 标签抗体检测带 MYC 标签的 P6H 融合蛋白。实验独立重复三次结果一致。除分离鉴定血根碱SAN与白屈菜红碱CHE的生物合成酶外同位素示踪实验结果还揭示了博落回M. cordata中二者完整的生物合成途径。有趣的是本研究首次在植物体内证实了 Cp27 的存在 —— 尽管此前在工程酵母中曾检测到该化合物的推测存在Fossati et al., 2014。这一发现表明植物中可能存在一条由 Cp27 介导、将 Cp11 转化为 Cp14 的旁路合成途径图 5红色区域。与该假说相符的是McTNMT/McCNMT 酶能够分别催化 Cp11 和 Cp12 发生甲基化反应生成 Cp26 和 Cp27图 5红色区域补充图 24C、24D其功能与同源酶 PsTNMT 一致Fossati et al., 2014。遗憾的是我们未能鉴定出可催化 Cp26 或 Cp27 生成 Cp14 的细胞色素 P450 酶。这条尚未完全验证的旁路途径或可缓解因 TNMT 酶催化广谱性而产生的副产物问题。对博落回提取物的精细分析还首次证实植株体内存在去甲劳丹碱Cp30、6-O - 甲基去甲劳丹碱Cp31及去甲网状番荔枝碱Cp32三种化合物补充图 25同时鉴定到负责催化 Cp30 经两步连续甲基化生成 Cp32 的关键酶 ——Mc6OMT/Mc4OMT编码基因Mco2833图 5顶部虚线框补充图 24A、24B。该催化过程或可绕过苄基异喹啉类生物碱BIA骨架后续的羟基化反应步骤Fossati et al., 2014补充图 24C、24D、25。已有研究表明Morishige et al., 2000Inui et al., 2007罂粟Papaver somniferum中完成这一催化过程需要两种不同的酶Ps6OMT 与 Ps4OMT协同作用。随后Cp31 和 Cp32 可分别在 McCNMT 酶编码基因Mco769、Mco8567的催化下生成 3- 羟基 - 甲基可待因Cp9和 (S)- 网状番荔枝碱Cp10补充图 24E、24F。上述结果表明博落回中可能存在一条循环式的生物合成途径图 5。图 5 博落回M. cordata中血根碱SAN与白屈菜红碱CHE的详细生物合成途径图中以绿色、红色和紫色矩形标注博落回血根碱与白屈菜红碱生物合成研究的新发现首次在植株提取物中检测到化合物 Cp27 及 Cp30–Cp32参与成瘾性苄基异喹啉类生物碱BIA合成关键分支途径的 STORR/REPI 基因直系同源物未在博落回基因组中被注释催化活性更优的 McP6H 酶以橙色和蓝色标注。虚线箭头表示博落回中催化该反应的对应酶尚未被鉴定。如前文所述血根碱与白屈菜红碱主要在果荚中积累而大部分前体物质则在除茎以外的植株各组织中合成图 2A 及补充图 14。与这一观测结果相符的是负责催化合成最后一步反应的两个功能性 McDBOX 酶编码基因Mco6407和Mco6408在果荚中特异性表达图 2B 及补充图 20。与 McDBOX 酶不同博落回中同时鉴定到根特异性表达和果荚特异性表达的 McP6H 酶编码基因Mco11218和Mco11229图 2B 及补充图 20。尽管在根组织中检测到 McP6H 的高表达且其底物Cp15 和 Cp22含量丰富但其催化产物Cp16 和 Cp23及其自发反应产物Cp17 和 Cp24并未在该组织中积累图 2A 及补充图 14。上述结果表明植株中可能存在潜在的转运蛋白可将 Cp17 和 Cp24 从根组织转运至果荚组织在果荚中这两种化合物经果荚特异性表达的 McDBOX 酶催化分别生成血根碱与白屈菜红碱。这一潜在转运机制的阐明尚需未来开展更多研究。讨论生物的遗传蓝图编码于其基因组之中Toriello, 2002。因此基因组挖掘已成为研究天然产物的强有力策略Zerikly Challis, 2009De Luca et al., 2012Chae et al., 2014该策略尤其适用于非模式药用植物与真菌物种 —— 这类生物是高价值代谢物的丰富来源但缺乏便捷的基础研究工具。例如灵芝是首个完成基因组测序的药用物种通过对其基因组的挖掘鉴定出大量参与次生代谢及调控过程的候选基因Chen et al., 2012。尽管近年来对多种罂粟科植物的深度转录组分析以及病毒诱导的基因沉默技术的应用已推动苄基异喹啉类生物碱代谢研究取得进展Desgagne-Penix et al., 2010Dang et al., 2012Farrow et al., 2012Winzer et al., 2012Xiao et al., 2013但此前尚未有任何一种罂粟科植物的基因组序列被公布。为填补这一空白我们对富含血根碱与白屈菜红碱的药用植物博落回开展了从头基因组测序。借助多种互补工具我们鉴定出参与血根碱与白屈菜红碱合成的全套代谢基因。最终从博落回中鉴定出 16 个参与血根碱与白屈菜红碱合成的代谢基因并验证了其中 14 个基因的催化功能图 5。本研究鉴定的酶Mco11229其催化活性优于花菱草E. californica来源的直系同源酶 EcP6H图 4。因此该酶可用于重构微生物合成体系以提高血根碱的产量。除生物合成过程外解析苄基异喹啉类生物碱的调控与转运机制对于其代谢研究及利用合成生物学策略实现规模化生产也至关重要。有趣的是博落回中的血根碱与白屈菜红碱似乎严格在果荚中完成合成而其他前体物质则主要在植株全身合成。血根碱可能被植株用于抵御植食性动物从而保护富含营养的种子Schmeller et al., 1997。由此推测植株中可能存在一种特异性转运蛋白可将血根碱高效且选择性地在果荚中积累而避免其在其他组织中留存以降低其固有的细胞毒性。博落回的全基因组测序数据将为揭示这一转运过程背后未知的分子机制提供宝贵资源。综上对罂粟科植物博落回的基因组测序为系统性研究这一非模式药用植物中血根碱与白屈菜红碱的生物合成、调控及转运机制打开了新的突破口。本研究获得的基因组、代谢组及生物化学层面的信息可用于优化药用植物或微生物体系中血根碱与白屈菜红碱的生物合成产量。方法实验试剂可待因Cp7、N - 甲基可待因Cp8、斯库莱林Cp11、N - 甲基刺罂粟碱Cp14及 N - 甲基加拿大麻碱Cp21的合成参照已报道方法进行Sun 等2013Cheng 等2014。白屈菜红碱Cp12、N - 甲基斯库莱林Cp26及 N - 甲基白屈菜红碱Cp27均从博落回M. cordata中分离提取。其余中间体购自美国 Sigma-Aldrich 公司及其他商业供应商补充表 1。采用电喷雾电离质谱ESI-MS、氢核磁共振¹H-NMR及碳核磁共振¹³C-NMR技术验证上述化合物的结构补充图 2-7、12、13。甲醇与乙腈为质谱级试剂购自中国 CNW 公司同位素标记的 [苯环 -¹³C₆]- 酪氨酸购自美国 Sigma-Aldrich 公司实验用水经 Milli-Q Integral 纯水系统美国 Millipore 公司纯化制备甲酸为高效液相色谱HPLC级试剂购自美国 Merck 公司其余试剂均为分析纯。植物材料与组织培养本研究采集的多份野生博落回种质资源均来自中国各地采集过程无需相关许可所有材料均种植于湖南农业大学实验基地。其中血根碱SAN与白屈菜红碱CHE含量最高的种质源自福建省编号 FJ1种子可按需索取地理坐标北纬 27°46′23.408″、东经 117°25′12.560″。为降低该种质的杂合度、获得单倍二倍体基因组并确保后续实验材料具有一致的遗传背景以 FJ1 植株叶片为外植体开展组织培养获得组培苗用于同位素示踪实验、代谢物分析、基因组测序、转录组测序RNA-seq、实时荧光定量 PCRqRT-PCR及基因克隆。FJ1 植株叶片先用 70% 乙醇振荡处理 1 min再浸入含 0.02% 吐温 20v/v的 1.0% 次氯酸钠溶液中表面灭菌 10 min经无菌蒸馏水漂洗 5 次后将叶片横向切成 1.0 cm 长的小段接种于含 3.0% 蔗糖且不含植物生长调节剂PGRs的 MSMurashige and Skoog固体培养基上诱导体细胞胚发生。培养 3 周后挑选疏松、生长迅速的胚性愈伤组织转接至相同培养基继代培养。为促进体细胞胚萌发将愈伤组织在无植物生长调节剂的培养基上培养 2 周后转移至含 MS 培养基的培养瓶中。待组培苗在该培养基上启动生长后转入植物生长箱内的新鲜 MS 培养基继续培养培养条件为 12 h 光照光照强度 4500-9000 lx。培养 60 d 后将再生植株移栽至大田生长 5 个月后达到成熟阶段。博落回代谢物提取采集种植于湖南农业大学实验基地的 1 年生 FJ1 植株新鲜根、叶、茎、花及果荚组织液氮研磨成细粉冷冻干燥后获得干燥粉末。取 50 mg 干燥粉末加入 25 mL 甲醇室温超声提取 30 min提取液经 0.22 μm 滤膜美国 Pall 公司过滤后采用液相色谱 - 三重四极杆质谱联用技术LC/QQQ-MS进行定量分析。[苯环 -¹³C₆]- 酪氨酸同位素标记实验将 FJ1 组培苗在 MS 培养基上培养 60 d株高 10-12 cm向培养瓶内的培养基中添加 4 mL 浓度为 0.4 mg/mL 的 [苯环 -¹³C₆]- 酪氨酸溶液以未标记酪氨酸处理组为对照。将培养瓶直径 4 cm、高度 15 cm封口后置于 26℃培养箱中给予 2000 lx 持续光照暖白色荧光灯。培养 6 d 后收获植株每个处理设置 3 个生物学重复n3 株按前述方法提取代谢物。提取液经 0.22 μm 滤膜美国 Pall 公司过滤后采用液相色谱 - 四极杆飞行时间质谱联用技术LC/Q-TOF-MS分析。在总离子流图中通过在质子化分子离子峰质量数基础上增加 6.02013即 [MH6.02013]⁺提取各类 [苯环 -¹³C₆] 标记化合物的特征峰。通过对比标记化合物与非标记标准品的保留时间、质谱精确质量数及二级质谱指纹图谱完成标记化合物的定性验证。本研究中同位素标记酪氨酸示踪实验及对照组的原始仪器数据与 mzML 格式数据均已上传至 MetaboLights 数据库网址http://www.ebi.ac.uk/metabolights/MTBLS435。博落回生物碱的分离提取取 100 kg 新鲜博落回根组织采自湖南农业大学实验基地加入 95% 乙醇按料液比 1:6 在 70℃条件下回流提取 2 次每次 2 h。提取液合并后悬浮于 150 L 盐酸溶液分 3 次添加每次 50 LpH3中静置 24 h加入氢氧化钾调节溶液 pH 至 10继续静置 24 h 后经 500 目尼龙滤布过滤获得 150 g 不溶性浸膏。将浸膏上硅胶柱色谱硅胶规格 200-300 目色谱柱尺寸 105 mm×1000 mm采用二氯甲烷 - 甲醇混合溶液体积比 10:1 至 5:1 梯度洗脱收集得到 4 个洗脱组分。采用荧光硅胶薄层色谱法检测各组分展开剂为二氯甲烷 - 甲醇体积比 8:1结合紫外灯显色分析。取组分 27.8 g上硅胶柱色谱硅胶规格 200-300 目以二氯甲烷 - 甲醇体积比 95:5洗脱得到 6 个亚组分F2-1 至 F2-6取亚组分 F2-32.1 g进一步上硅胶柱色谱硅胶规格 300-400 目以石油醚 - 乙酸乙酯体积比 5:1洗脱得到 4 个混合亚组分F2-3-1 至 F2-3-4对亚组分 F2-3-30.3 g再次进行硅胶柱色谱纯化获得化合物 Cp12分子量m/z326.1383质量 22 mg。取组分 32.4 g采用制备型高效液相色谱纯化色谱系统为安捷伦 1260 高效液相色谱仪配备制备型反相色谱柱美国安捷伦 ZORBAX SB-C18 柱粒径 5 μm规格 9.4 mm×250 mm、自动进样器、快速分离二元泵、柱温箱及二极管阵列检测器流动相为甲醇 - 0.1% 甲酸水溶液体积比 60:40流速 3 mL/min收集保留时间 6.2 min 的洗脱峰获得化合物 Cp26分子量m/z342.1698质量 38 mg。取组分 43.7 g经制备型反相高效液相色谱分离流动相为甲醇 - 0.1% 甲酸水溶液体积比 40:60得到 5 个亚组分F4-1 至 F4-5取亚组分 F4-2 进一步纯化流动相更换为乙腈 - 0.1% 甲酸水溶液体积比 30:70收集保留时间 11.2 min 的洗脱峰获得化合物 Cp27分子量m/z340.1540质量 16.2 mg。在整个提取分离过程中均采用液相色谱 - 质谱联用技术LC/MS监测并鉴定目标生物碱。合成与分离生物碱的结构鉴定对从博落回中分离的生物碱及人工合成的生物碱均采用液相色谱 - 质谱联用LC/MS、氢核磁共振¹H-NMR及碳核磁共振¹³C-NMR技术进行结构鉴定。核磁共振谱图在布鲁克 ACF-400 型核磁共振仪上测定¹H-NMR 测试频率为 400 MHz¹³C-NMR 测试频率为 100 MHz以四甲基硅烷TMS为内标液相色谱 - 质谱联用分析在安捷伦 1290-6530A 液相色谱 - 四极杆飞行时间质谱联用仪上完成。液相色谱 - 四极杆飞行时间质谱联用LC/Q-TOF-MS分析色谱分离在安捷伦 1290 超高效液相色谱仪上完成色谱柱为艾杰尔 X-aqua C18 柱粒径 5 μm规格 2.1 mm×150 mm流动相 A 为 0.1% 甲酸水溶液v/v流动相 B 为 0.1% 甲酸乙腈溶液v/v流速 0.3 mL/min进样量 1 μL。梯度洗脱程序设置如下0-1 min流动相 B 比例由 5% 线性升至 10%1-6 min升至 30%6-7 min升至 38%7-9 min保持 38% 等度洗脱9-15 min升至 60%15-25 min升至 75%25.1-30 min保持 95% 等度洗脱30.1-35 min降至 5% 并保持等度洗脱。自动进样器温度为室温。超高效液相色谱仪与安捷伦 6530A 四极杆飞行时间质谱仪联用采用正离子电离模式全扫描范围m/z 100-1000。质谱喷雾参数设置如下干燥气温度 350℃干燥气流速 11 L/min雾化器压力 32 psi鞘气温度 350℃鞘气流速 10 L/min毛细管电压 4000 V喷嘴电压 500 V碎裂电压 135 V其余参数根据仪器调谐结果优化。采用嘌呤C₅H₄N₄m/z121.0508购自安捷伦公司与 HP-0921C₁₈H₁₈O₆N₃P₃F₂₄m/z922.0097购自安捷伦公司进行质量校准。通过四极杆飞行时间质谱仪配套数据处理软件计算质子化分子离子 [MH]⁺的单同位素质量数。依据保留时间、质子化分子离子 [MH]⁺或自由基分子离子 [M]⁺的单同位素质量数质量误差 5 ppm进行生物碱定性采用安捷伦 MassHunter Qualitative Analysis 软件版本 B.05.00处理液相色谱 - 四极杆飞行时间质谱数据通过与标准品比对进一步验证各中间体的结构。