news 2026/6/11 14:16:53

PBJ |兰科植物多组学数据库OrchidMD正式上线,解锁我国传统兰花基因挖掘与分子育种新路径

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
PBJ |兰科植物多组学数据库OrchidMD正式上线,解锁我国传统兰花基因挖掘与分子育种新路径

近日,国际知名期刊《Plant Biotechnology Journal》在线发表了由广东省农业科学院环境园艺研究所牵头联合广东省农业科学院水稻研究所和大理大学完成的“OrchidMD: An Integrated and User-Interactive Orchid Multi-Omics Database for Mining Genes and Biological Research”研究论文。该工作针对兰科植物研究中多组学数据分散、整合分析工具缺乏的核心痛点,构建了首个覆盖基因组、转录组、蛋白质组、代谢组和表型组的兰科植物多组学综合交互数据库 OrchidMD(www.orchidcomics.com)。该数据库整合213个兰科物种的 329.40 Gb多组学数据,开发18种专业化分析工具,通过“数据整合 – 工具创新–工功能验证”的研究思路,不仅实现了兰科植物多维度数据的高效检索与交互式分析,更通过 ARF 基因家族鉴定、CRISPR 基因编辑靶点设计两个典型案例,证实其在兰科基因挖掘与基因编辑的实用价值,为兰科植物基础研究、分子育种与资源保护提供了全新的一站式研究平台。

兰科(Orchidaceae)是被子植物中物种多样性最丰富的家族之一,包含约 3万个物种,广泛分布于全球各地,兼具极高的观赏、药用、文化与生态价值。从热带雨林中的附生兰到干旱沙漠中的地生兰,兰花演化出独特的生物学特性:如依赖真菌的种子萌发机制、与传粉者高度协同的花部结构、适应附生生活的景天酸代谢(CAM)光合途径,以及复杂庞大的基因组。这些特性不仅是植物进化研究的重要模型,也为园艺育种提供了丰富的性状资源。

近年来,多组学技术已成为解析植物关键性状分子机制的核心手段。在水稻、小麦、玉米等主要作物中,多组学整合平台的建立极大推动了功能基因组学研究与育种应用。然而,兰科植物研究中,现有数据库多局限于单一组学数据存储,在多维度数据关联分析尚有不足,尤其难以支撑花型发育、花香合成、逆境响应等复杂性状的遗传解析。此外,兰科植物基因编辑研究中,传统 CRISPR 靶点设计工具因未适配兰花基因组特征,存在效率低、脱靶风险高等问题,制约了其在兰花育种中的应用进程。

为解决上述瓶颈,研究团队系统整合全球兰科植物多组学数据,创新开发分析工具,构建了OrchidMD 数据库。该平台不仅涵盖22个高质量基因组、767 个转录组文库、26 个蛋白质组数据集、51 个代谢组数据集及 227 个种质的表型数据,更通过整合 GWAS 分析、共线性分析、CRISPR 设计等功能模块,实现从 “数据检索–基因筛选–功能预测–实验设计”的全流程支持。研究通过两个典型案例验证了平台的实用性:一是鉴定ARF基因家族并证实CsiARF04促进墨兰龙根分化,二是利用CRISPR引物设计工具,助力实现CsiPDS基因高效编辑,为兰科植物研究提供了可直接应用的技术方案。全文主要研究结果如下:

1 OrchidMD 数据库核心架构:五大组学整合,23 个模块覆盖全研究场景

为实现兰科植物多组学数据的系统整合与高效利用,研究团队构建了 “数据层–工具层–应用层”三层架构的OrchidMD平台,核心数据资源与功能模块如下:

1.1 多维度数据资源:覆盖 213 个物种,总数据量达 329.40 Gb

OrchidMD 整合了来自213个兰科物种的五大组学数据,经标准化处理后形成结构化数据库,具体包括:

基因组数据:收录22个高质量兰科物种基因组,涵盖树兰亚科(17个物种)、拟兰亚科(2个物种)、兰亚科(2个物种)、香荚兰亚科(1个物种),共注释 569,981个基因,其中 432,716个基因提供GO、KEGG等功能注释;同时整合 65,318,522 个单核苷酸多态性(SNP)和 3,906,176 个结构变异(SV),为遗传变异分析提供基础。

转录组数据:汇集174个物种的767个RNA-seq文库。尤其针对其中225个有参考基因组的转录组样本统一计算表达量,输入基因ID即可自动生成高水平论文发表级eFP电子荧光图谱。

蛋白质组数据:整合26个蛋白质组数据集,涉及墨兰、石斛兰、蝴蝶兰等物种,涵盖花发育阶段比较、叶色突变体差异、真菌共生响应、铅/盐胁迫应答等,如墨兰6个花发育阶段的蛋白质动态变化、霍山石斛盐胁迫下的蛋白表达差异,为翻译水平研究提供数据支撑。

代谢组数据:收录51个高分辨率代谢组数据集,覆盖18个兰科物种的器官特异性代谢谱(根、假鳞茎、块茎、叶、花)、昼夜代谢动态(12 h光周期下7个时间点)、环境适应性代谢变化等,共鉴定6114种代谢物,包括花香成分、色素、抗逆相关次生代谢物等。

表型组数据:收集 227个墨兰核心种质的84个表型性状,同时整合156,630

张兰属植物图像,为表型 - 基因型关联分析奠定基础。

图1. OrchidMD总览

1.2 23 个功能模块:从数据浏览到实验设计的全流程支持

OrchidMD 设计 23 个功能明确的模块,覆盖多组学数据分析的核心需求,关键模块功能如下:

数据浏览与检索模块:包括“Genome Browse”(基因组浏览器,支持染色体区间、基因ID检索,可视化基因结构、变异位点)、“Gene Search”(基因搜索,支持基因ID、序列同源性检索,直接下载核酸/蛋白质序列)、“Gene Location”(基因定位,输入基因 ID 生成个性化染色体定位图),满足基础数据获取需求。

比较基因组分析模块:“Collinearity Analysis”(共线性分析)可识别 395,908个蛋白质间的1,484,675 个互作关系及123,038个共线性区块,支持基因家族进化分析;“Gene Orthology Clusters”(基因同源簇)整合 OrthoVenn3 工具,实现不同物种同源基因分组与物种特异性基因筛选。

功能分析模块:“GO/KEGG Enrichment Analysis”(富集分析)支持目标基因集的功能分类与通路注释;“Gene Co-Expression Networks(GCNs)”(基因共表达网络)已鉴定 8,881,927个共表达基因对,输入基因 ID 即可获取功能关联基因;“Transcription Factors”(转录因子)模块收录 35,122个转录因子,涵盖 AP2/ERF、MYB、bHLH 等主要家族,支持调控因子筛选。

育种与实验工具模块:“Primer Designer”(引物设计)支持基因特异性引物设计;“CRISPR Design”针对兰科植物基因组优化,预测高效编辑靶点;“Breed Recognition”(品种识别)基于深度学习模型,上传图像即可快速鉴定兰属物种,准确率达86.50%;“GWAS”(全基因组关联分析)模块支持遗传变异与表型性状关联分析,辅助关键基因定位。

1.3 技术架构与用户体验:高稳定性、高兼容性、零门槛使用

OrchidMD 基于ThinkPHP 5.0.24 框架与jQuery 3.6.0 前端开发,采用 Apache 2.4.53 web 服务器与 MySQL 8.0.29 数据库引擎,通过 Apache JMeter 性能测试验证:平台支持多用户并发访问,median响应时间<1秒,稳定性优异;同时采用 HTTPS 加密与角色访问控制,保障数据安全。

平台兼容 Chrome、Opera、Firefox、Edge、Safari 等主流浏览器,无需注册即可免费使用,所有分析结果支持可视化导出,且提供详细的使用教程,即使无生物信息学专业背景的研究者也能快速上手。

图2.OrchidMD部分代表性功能模块

2 OrchidMD 在基因挖掘与基因编辑中的应用

2.1 ARF 基因家族鉴定与 CsiARF04 功能验证

生长素响应因子(ARF)是植物生长素信号通路的核心转录因子,通过结合靶基因启动子的AuxRE元件调控生长发育,但兰科植物中 ARF 基因家族的系统鉴定与功能研究尚未报道。研究团队利用OrchidMD 的“Transcription Factors” 与“Gene Family”模块,完成从基因筛选到功能验证的全流程研究:首先,通过“Gene Family”模块设定保守结构域(PF06507)检索条件,从16个兰科物种基因组中鉴定出281个ARF转录因子,基于系统发育分析将其分为4个亚家族;结合“Gene Expression”模块的时空表达数据发现,墨兰(Cymbidium sinense)中的CsiARF04在花芽和根中高表达,且与花发育、根分化相关基因共表达,利用“Gene Expression”模块的电子荧光图谱(eFP)系统分析CsiARF04表达模式,发现其在花芽和根中表达量最高。为验证功能,研究团队构建 35S::CsiARF04过表达载体,通过农杆菌介导转化墨兰龙根,结果显示转基因植株首次出芽时间(7.02±0.82 天)较Ruby对照(17.36±1.28 天)提前 10.34 天(59.56%)、较 EV对照(16.78±1.72 天)提前 9.76 天(58.16%),差异极显著(p<0.001);转化后 30 天,转基因植株出芽中位数(4.00,IQR 3.00-5.00)显著高于 Ruby 对照(3.00,IQR 2.00-3.00)和 EV 对照(3.00,IQR 2.00-4.00)。该案例证实,OrchidMD可高效完成基因家族筛选、表达模式分析,为功能基因验证提供精准靶点,显著缩短研究周期。

2.2 CRISPR设计工具助力实现墨兰CsiPDS基因高效编辑

八氢番茄红素脱氢酶(PDS)是类胡萝卜素合成的关键基因,其突变会导致植物白化表型,常作为基因编辑效率验证的报告基因。研究团队利用OrchidMD 的 “CRISPR Design”模块,针对墨兰CsiPDS基因设计靶点并验证编辑效率,解决传统工具在兰花中编辑效率低的问题:通过 “CRISPR Design” 模块输入CsiPDS基因ID(Mol008762),平台基于兰花基因组GC含量、脱靶风险评分,预测出两个最优靶点。基于该靶点序列,研究团队构建 pCAMBIA3301-Cas9-sgRNA 载体,通过农杆菌介导转化墨兰幼叶,培养4天后提取基因组DNA;通过 PCR 扩增CsiPDS靶点区域,将产物克隆至测序载体后随机挑选20个单克隆测序,结果显示靶点1编辑效率达 35%,靶点2编辑效率达20%。测序结果证实,OrchidMD 设计的靶点编辑效率显著高于传统工具(平均编辑效率约15%),且脱靶检测未发现非特异性突变,说明该工具适配兰科植物基因组特征,可用于高效基因编辑实验设计。

图3. OrchidMD应用案例

OrchidMD数据库的成功构建,不仅从多组学分析角度揭示兰花独特生物学特性的分子机制和进化规律,同时还能推动分子育种进程,包括性状基因定位、基因编辑设计和后代鉴定等关键环节,为兰科植物基础研究到产业应用提供了全链条支撑。未来OrchidMD平台将持续迭代更新,并增加数据共享与协作功能,深化基础研究与产业应用的紧密衔接。

3 研究团队与项目资助

该工作由广东省农业科学院环境园艺研究所魏永路、林增裕、谢琦为论文共同第一作者,杨凤玺、朱根发、刘琦、杨邓奇为共同通讯作者。大理大学李文康、黄传峰等参与平台开发与数据处理。该工作得到国家重点研发计划、广东省科技计划项目、广东省农业科学院项目等多个项目的资助。

论文链接:

https://doi.org/10.1111/pbi.70445

数据库链接:

http://www.orchidcomics.com

最全1000+植物核基因组数据库IMP (点击图片直达)

高颜值免费 SCI 在线绘图(点击图片直达)


往期精品(点击图片直达文字对应教程)

LinuxPython

R绘图NGS基础GEO高级

生信自学生信书籍系列教程心得体会

转录组经典宏基因组蛋白质组单细胞系列测序发展史

免费在线画图色彩搭配图形排版图形解读

ChIP-seqTCGAGSEAWGCNA

海哥组学傻瓜系列文章写作

CytoscapeExcelPPT

机器学习

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 14:11:26

Go-nunu技术深度解析:构建企业级应用的最佳实践

Go-nunu技术深度解析&#xff1a;构建企业级应用的最佳实践 【免费下载链接】nunu A CLI tool for building Go applications. 项目地址: https://gitcode.com/GitHub_Trending/nu/nunu Go-nunu是一个专为Go语言应用开发设计的CLI工具&#xff0c;通过自动化代码生成和依…

作者头像 李华
网站建设 2026/6/10 13:51:12

1Panel面板OpenResty部署终极指南:从环境预检到性能调优

1Panel面板OpenResty部署终极指南&#xff1a;从环境预检到性能调优 【免费下载链接】1Panel 新一代的 Linux 服务器运维管理面板 项目地址: https://gitcode.com/feizhiyun/1Panel "为什么别人能一键部署成功&#xff0c;我却总是卡在某个环节&#xff1f;"这…

作者头像 李华
网站建设 2026/6/10 14:10:35

DBeaver GIS空间数据可视化:3步搞定地理信息展示

DBeaver GIS空间数据可视化&#xff1a;3步搞定地理信息展示 【免费下载链接】dbeaver DBeaver 是一个通用的数据库管理工具&#xff0c;支持跨平台使用。* 支持多种数据库类型&#xff0c;如 MySQL、PostgreSQL、MongoDB 等&#xff1b;提供 SQL 编辑、查询、调试等功能&#…

作者头像 李华
网站建设 2026/6/10 2:15:52

浏览器乐谱革命:OpenSheetMusicDisplay如何重塑数字音乐体验

浏览器乐谱革命&#xff1a;OpenSheetMusicDisplay如何重塑数字音乐体验 【免费下载链接】opensheetmusicdisplay OpenSheetMusicDisplay renders sheet music in MusicXML format in your web browser based on VexFlow. OSMD is brought to you by PhonicScore.com. 项目地…

作者头像 李华
网站建设 2026/6/11 2:52:17

Unreal Engine Python脚本终极指南:快速实现自动化工作流

Unreal Engine Python脚本终极指南&#xff1a;快速实现自动化工作流 【免费下载链接】UnrealEditorPythonScripts Some of my personal scripts i made to use for my own projects, but free of charge to be used for any project and any purpose as long as it is not vio…

作者头像 李华
网站建设 2026/6/10 15:59:34

ExplorerPatcher:重新定义你的Windows 11工作体验

ExplorerPatcher&#xff1a;重新定义你的Windows 11工作体验 【免费下载链接】ExplorerPatcher 项目地址: https://gitcode.com/gh_mirrors/exp/ExplorerPatcher 你是否曾经因为Windows 11的界面改变而感到不适应&#xff1f;那个熟悉的开始菜单布局突然消失&#xff…

作者头像 李华