种业商务网
www.chinaseed114.com
【慧诺瑞德】从深度伪标注到通用基础模型:DepthCropSeg++ 打破作物分割瓶颈
2026-01-28  浏览:963

      在植物表型研究中,科研人员需要把高通量图像转化为可计算的数字性状:株高、叶面积、冠层覆盖度......,所有指标都建立在“先知道哪些像素是植物、哪些是背景”这一基础上。换言之,作物分割的精度直接决定了后续表型分析的准确性与可靠性。

      然而,利用深度学习训练分割模型必须依赖人工标注——在传统的像素级勾画流程下,一张高分辨率图像往往要花费2–4小时才能完成精细标注;更棘手的是,一旦换成另一种作物或不同成像场景,就要重新收集数据、重新标注、重新训练模型,时间与人力成本成倍叠加,成为挡在“大数据育种”与“精准栽培”面前的巨型路障。正因如此,通用且鲁棒的作物分割模型缺位,成为农业AI大规模落地的主要瓶颈。

      01

      破局·DepthCropSeg第一枪

      2025年3月,慧诺瑞德旗下宏表型实验室联合华中科技大学与中国科学院遗传与发育生物学研究所在《Plant Phenomics》期刊上发表了基于单目深度信息的近似无监督作物表型分割方法DepthCropSeg,巧妙利用单目深度估计模型Depth Anything V2自动生成高质量的作物掩码,实现了近乎无监督的作物分割。在多个真实场景(田间、无人机、高通量平台、手机拍摄)下,分割效果几乎媲美全靠人工标注训练的模型,同时节省了70%~80%的标注成本!

      02

      再进化·DepthCropSeg++登刊 IEEE

      “此后,宏表型实验室联合中国科学院遗传与发育生物学研究所、华中科技大学、西北农林科技大学、武汉工程大学等单位持续发力,近期在电气电子工程师学会(IEEE)旗下国际著名学术期刊《IEEE Journal of Selected Topics in Signal Processing》(影响因子13.7)正式发布了DepthCropSeg++ ——一个跨物种,跨场景的作物分割基础模型(Foundation Model)。

      DepthCropSeg++不再局限于单一作物或环境,而是面向30多种作物、15种复杂场景(包括夜间、密植、强反光等复杂模式),构建了一个包含2.8万张图像的大规模伪标注数据集。这些数据并非靠人工标注,而是基于DepthCropSeg的伪标签生成流程高效构建,仅用约12小时就筛选出上万张高质量样本,节省了大量人力。

图1 专用和通用作物分割模型的比较

      (a)专用模型需要对每种作物品种进行单独训练;

      (b)通用模型能够跨场景对多种物种进行精确分割,而无需单独训练。

 图2 数据集的物种分布和成像角度

      为了同时捕捉全局语义与叶片级细节,DepthCropSeg++ 采用更强的 ViT-Adapter 主干网络,在编码阶段嵌入多尺度适配器,使模型对细窄叶缘和茎秆仍保持高分辨率响应;解码端则引入引导特征动态上采样算子(FADE)替换双线性插值,显著减少作物边界模糊。此外,团队设计了两阶段训练策略:第一阶段采用基于深度信息生成的伪掩码作为标签,训练初始深度语义分割模型,第二阶段将推理结果与原始伪掩码取交集,让模型实现无需人工干预的自我迭代优化。

图3 DepthCropSeg++整体框架图

表1综合测试集上消融实验结果

      03

      性能·多维度超越

      在包含6760张图像和多种成像条件的综合测试集上,DepthCropSeg++ 达到了 93.11% 的 平均交并比(mIoU),不仅高于同规模全监督基线,更是远远超过通用视觉大模型如 SAM(32.8%)和 HQ-SAM(44.5%)。面对最具挑战的场景,模型依旧表现亮眼:夜间水稻 mIoU 达到 86.90%,高密度冠层下仍维持 99.86%,对训练阶段从未见过的大豆也能稳定输出 90.09% 的精度。

表2 具体场景下不同作物的分割性能比较

      04

      范式跃迁·从“专用”到“通用”

      DepthCropSeg 让单场景告别人工标注,DepthCropSeg++ 让跨作物、跨场景的分割模型成为即插即用的“农业基础设施”。作物分割任务所依赖的数据范式正在从“高成本人工标注”走向以“高质量伪标签”驱动的大规模深度学习,植物表型分析终于可低成本、高精度、强鲁棒地铺进真实农业场景。

      论文匿名审稿人表示,“The authors presents a novel framework named DepthCropSeg++, aimed at solving cross-species and cross-scene crop segmentation. It has significant practical significance and supplements the shortcomings in this field. Firstly, it constructs a large-scale cross-scene dataset , covering over 30 crop species, significantly reducing annotation costs through depth-informed pseudo-labeling technology. And the authors propose DepthCropSeg++, which integrates the FADE dynamic upsampling module and a two-stage self-training strategy, improving the accuracy of crop boundary segmentation and the utilization efficiency of pseudo-labels. DepthCropSeg++ is the first crop segmentation foundation model with cross-species and cross-scene capabilities, achieving an mIoU of 93.11%, which obtains SOTA results.”

      当分割不再是瓶颈,高通量表型监测才能真正“长”在田里,让每一株作物的生长信息都实时汇入育种与栽培的决策大脑——这正是DepthCropSeg++想给智慧农业带来的未来。

      来源:Zhang J. et al., DepthCropSeg++: Scaling a Crop Segmentation Foundation Model With Depth-Labeled Data, 2026, IEEE Journal of Selected Topics in Signal Processing, doi: 10.1109/JSTSP.2026.3654362.

      作者介绍:宏表型实验室张佳菲、华中科技大学硕士研究生曹松良和武汉数字工程研究所徐冰慧为论文共同第一作者;宏表型实验室韩志国博士和中国科学院遗传与发育生物学研究所胡伟娟博士为论文共同通讯作者。华中科技大学陆昊副教授、西北农林科技大学吴婷婷副教授和武汉工程大学李亚楠副教授团队一起深度参与了算法开发工作。本研究得到了上海市关键技术研发计划(25N32800100)、国家重点研发计划(2023YFF1001502)、国家自然科学基金/面上项目(32370435)、中央引导地方项目(2024ZY-CGZY-19)、湖北省自然科学基金(2024AFB566)和慧诺基金的资助。

      慧诺瑞德宏表型实验室介绍

      慧诺瑞德(PhenoTrait)是一家以植物表型技术为核心的AIoT+DT创新企业。公司专注于利用智能感知、多模态视觉成像、人工智能、自动化及物联网等技术,为大范围、高通量获取与农作物产量、品质、抗性相关的植物表型及环境数据提供系统化解决方案,赋能智慧育种、智慧种植及农业全产业链升级。旗下企业获得专精特新中小企业、高新技术企业、2025“数据要素X”全国总决赛优秀奖、2025中国创新创业大赛现代农业产业技术创新专业赛初创组二等奖、2023中国创新创业大赛新一代信息技术全国赛(初创组)优秀企业奖、2025年长三角高价值专利运营大赛(农业科技赛道)一等奖、2025崖州湾科技城第四届“知识产权创造力TOP30“、2025未来农业TOP100等荣誉。

      宏表型实验室是慧诺瑞德旗下新型研发机构,立足于农业科技变革、产业驱动创新,开展引领性的植物表型技术与装备应用研究、产学研一体化的共性技术联动突破,以及提供高质量植物表型技术服务等。拥有价值近2000万的先进设备,包括擎农植物表型平台(轨道式表型平台)、传送型高通量植物表型平台、云谱系列植物表型物联网、高通量植物根系萌发表型平台、自走式植物表型平台、高通量种子高光谱成像系统、单粒种子精细表型全自动测量系统、数字化玉米考种机、光合表型成像测量系统等。

      主持国家级课题和上海市关键技术研发计划各1项,承担中央引导地方项目1项;发表英文学术论文10篇(其中通讯作者文章7篇);获发明专利22项、实用新型专利26项、软件著作权59项;获软件产品认证8项;制定团体标准3项。

      在国际上首次提出“植物表型就是为植物体检”的概念,并被广泛接受和传播;提出植物表型技术的三位一体概念,将表型传感器对应人的眼睛,自动化系统对应人的身体,软件和算法对应人的大脑(其中软件对应大脑皮层、算法对应神经网络);提出基于单目深度估计的表型算法DepthCropSeg和跨场景跨物种植物表型分割基础模型(foundation model)DepthCropSeg++,为田间表型数据分割节省了70%的工作量;提出利用智能手机进行低成本三维表型测量的方案MobilePheno3D,解决了三维表型测量的大范围落地应用问题。自主开发的轨道式高通量植物表型平台TraitDiscover已落地安装50多套;云谱植物表型物联网是国内首创能在大田长期监测的表型物联网系统,在全国各地安装应用上千套;植物表型小程序OpenPheno是国际上第一个开放获取的植物表型小程序,已发布10个表型模块,覆盖全球17000多用户。

下一篇:奋进九圣禾 弘农启新程|河南九圣禾弘农种业正式启航,突破性玉米新品种九圣禾6137重磅发布 上一篇:《主要农作物品种审定办法》
关闭


扫描二维码,关注官方微信