
我国作物学界位“AI同事”——由上海人工智能实验室联合崖州湾实验室、农业大学等机构共同研发的“丰登·基因科学”今年夏天问世后受到各关注。记者新获悉,这一基于大模型的科研智能体计划明年面向全球上线。
“丰登·基因科学”不仅能回答育种域问题,能模拟育种专的思维链条:提出科学假设、自主设计实验、解析结果数据。截至目前,已辅助科研人员发现数十个此前未被报道的作物基因,并获得实验证实。
农业事关大国粮仓,但因投入周期长、见慢的特性,并非资本青睐的热门赛道。“丰登·基因科学”的出现,不止于探索AI与产业度融合的新路径。正如上海人工智能实验室研究员董楠卿所言,期待“丰登”能成为一条“鲶鱼”,以从0到1的探索,撬动多“AI+农业”的变革力量。
打破技术“盲区”
AI赋能科研的潜力已经现。
英国帝国理工学院微生物学专何塞·佩纳德斯团队耗时十年,发现并验证了一种全新的细菌基因传播机制。而谷歌今年2月出的“AI联合科学”,仅用48小时就验证了这一尚未发表的成果,还提出了多个科学假说。
在育种域,技术智能化转型同样成为趋势。“在AI的介入下,育种科研的范式正逐步从基于科学经验的杂交育种,以及基于分子生物学的设计育种,转向数据驱动的智能育种。”董楠卿介绍。
但在国内,这一转型面临明的底层技术“盲区”:一面,相较于金融、医疗等域,农业研发周期长、回报不确定,难以吸引资本集中投入;另一面,全球种子市场由拜耳等国际巨头主导,这些企业只种子,对育种技术则讳莫如。
毕业于英国牛津大学计算机科学系的董楠卿,受上海建设人工智能地的愿景吸引,怀着科研报国的热情,加入上海人工智能实验室,成为当时国内为数不多的专注人工智能与农业交叉域的研究者。
董楠卿在崖州湾实验室试验田。
为摸清行业痛点,他入走访86科研院所、校、企业及涉农上下游单位,终将突破口锁定在“AI+基因”的交叉创新。“向已经明确,难的是摸清楚底层技术路径。”董楠卿联合崖州湾实验室、农业大学等单位共同攻关,先出国内个种业大模型——“丰登·种业大模型”。
让大模型拥有“种业语感”
与通用大模型相比,“丰登”有何特别之处?董楠卿进行了对比演示,当被要求介绍某一特定基因时,通用大模型查询果,而“丰登”给出了详尽的解答。
秘诀在于“喂的料”。研发团队运用人工智能技术,把育种域多年积淀下来的知识,包括学术论文、书籍,以及田间记录等系统整理,并整合生物学、遗传学、气象学、土壤学等相关域知识,挖掘跨域知识关联,打造提供解答的“科研助手”。
以水稻研究为例,依托崖州湾实验室等平台的丰富数据积累,团队构建了全球规模大的水稻科研语料库,囊括140万篇中英文文献,覆盖该域98%以上的公开发表成果。
为验证模型实力,团队设计近2000道题的“模拟考卷”,考察其回答问题、总结信息、理解语言等多种能力。结果示,离心玻璃棉“丰登”在准确率等重要指标上,明于主流通用模型。
同时,团队联合水稻域专出了一套253道题的“专考卷”,邀请326位评委参与评测。结果表明,“丰登”模型在答题质量上越OpenAI GPT—4及人类本科生平均水平,展现出在农业垂直域的能力。
目前,国内外已有600育种单位申请试用“丰登”大模型,既有隆平科、科学院、农业科学院等国内企业、科研院所及校,也包括国际水稻研究所、印度中央水稻研究所等国际育种机构。
向全流程智慧育种平台演进
今年7月,2025世界人工智能大会接近尾声时,由“丰登”驱动的个“AI作物科学”——“丰登·基因科学”正式亮相,引发行业关注。
相较于“丰登”大模型的原有回答解释能力,它的核心突破主要有三点:一是种业域的信息汇聚能力大提升;二是次实现全基因组水平的“基因—性状”关联断,预测准确率越现有工具;三是初步具备比肩人类专的科研规划能力。
“丰登”进行实验案设计。
“丰登”进行知识总结。
“概括来说,‘丰登·基因科学’可模拟人类科学的思维路径进行理。”董楠卿介绍,根据它的分析,作物基因研究仍存在巨大探索空间。数据示,即便是国内研究较为入的水稻,仍有约90%的基因尚未明确,玉米、大豆等作物的未知基因比例。
作为一名AI科学,“丰登”凭借数据整合与逻辑理的势,开展通量基因挖掘和系统化科研路径规划。截至目前,已辅助科研人员发现数十个此前未被报道的作物基因,关键科研决策均由“丰登”向科研人员提供。
如在水稻基因研究中,科研团队借助这一系统发现与耐盐碱度相关的基因,经三个月对照组试验验证了,且某科研机构此前的田间实验数据也为该发现提供了佐证。
业内人士分析认为,这一技术为我国育种策略转型提供了新可能。受限于客观困难,过去国内育种多追求单一品种的广泛适应性,即“大品种”路线;而在AI技术支撑下,可针对不同地区环境特点研发定制化“小品种”,动品种设计从“广适”向“”升。
不过,行业转型仍面临多重挑战。董楠卿坦言,相较于医学、金融等成熟赛道,植物科学域的基础数据积累相对薄弱,且数据标准不统一、共享机制不完善,导致模型训练的“原料”供给存在短板。关键的是,跨学科人才,尤其是具有AI背景的人才稀缺,成为我国行业发展的突出瓶颈。
可感欣慰的是,自“丰登”系列成果亮相以来,来自各地政府、科研院所、种业企业的咨询量明增加,越来越多从业者开始主动探索AI在育种中的应用场景。
根据计划,“丰登·基因科学”将于明年面向全球上线。董楠卿团队的步伐也未停歇,他们计划整合多作物数据、环境信息和育种知识运城国美玻璃棉,动“丰登”逐步演进为覆盖全物种、全流程的智慧育种平台。“从基因发现到培育出成熟种子,这场千里之行,我们仅迈出了步。”