提速近10倍!基于深度学习的全基因组选择新方法来了******
近日,中国农业科学院作物科学研究所、三亚南繁研究院大数据智能设计育种创新团队联合多家单位提出利用植物海量多组学数据进行全基因组预测的深度学习方法, 可以实现育种大数据的高效整合与利用,将助力深度学习在全基因组选择中的应用,为智能设计育种及平台构建提供有效工具。相关研究成果发表在《分子植物(Molecular Plant)》上。
全基因组选择作为新一代育种技术,通过构建预测模型,根据基因组估计育种值进行早期个体的预测和选择,从而缩短育种世代间隔,加快育种进程,节约成本,推动现代育种向精准化和高效化方向发展。
统计模型作为全基因组选择的核心,极大地影响了全基因组预测的准确度和效率。传统预测方法基于线性回归模型,难以捕捉基因型和表型间的复杂关系。
相较于传统模型,非线性模型(如深度网络神经)具备分析复杂非加性效应的能力,人工智能和深度学习算法为解决大数据分析和高性能并行运算等难题提供了新的契机,深度学习算法的优化将会提高全基因组选择的预测能力。
该研究团队以玉米、小麦和番茄3种作物的4种不同维度的群体数据为测试材料,通过创新深度学习算法框架开发了全基因组选择新方法。
与其他五种主流预测方法相比,该方法有以下优点: 可以利用多组学数据开展全基因组预测;算法设计中包含批归一化层、回调函数和校正线性激活函数等结构,可以有效降低模型错误率,提高运行速度;预测精度稳健,在小型数据集上的表现与目前主流预测模型相当,在大规模数据集上预测优势更加明显;计算时间与传统方法相近,比已有深度学习方法提速近10倍;超参数调整对用户更加友好。
该研究得到了国家重点研发计划、国家自然科学基金、海南崖州湾种子实验室和中国农业科学院科技创新工程等项目的支持。
学术支持
中国农业科学院作物科学研究所
记者
宋雅娟
作为汉人的穆涛******
穆涛,汉人也。
穆涛本籍河北廊坊,中岁移居今之西安汉之长安,是被贾平凹挖去,办一份《美文》杂志。汉字之好,叩其本义,神气活现,比如这个“挖”字:一个老农,盯住邻家一棵苗,看来看去,心想是个好苗,于是抄一柄小锄,连根带土挖了去,种到了自家院里。
从此穆涛办《美文》,搞“大散文”,文章风云,大就是美。很快,此人陕西话说得好了,陕西的人与物了然于心,一个河北人幽州人,不远千里来到长安,在陕西如鱼得水、泯然众人,端的好本事。
我与穆涛相交二十多年,早年间彼此都还不老,此人颇有些任诞疏狂,有五陵少年气、有乡间名士风。这些年来,穆涛发愤读书,日渐厚了、重了、望之俨然了,渐渐有了先生气象。穆涛读书与我不同,我是无事乱翻书,天上地下四面八方,而远远地看穆涛读书,看来看去看出了此人沉着有大志,人家走的是韩愈的路子。韩文公文起八代之衰,以道统为己任,“非三代两汉之书不敢观,非圣人之志不敢存”。穆涛呢,后一句估计他暂时不敢想,前一句他真是照着做,这些年所读皆是先秦两汉之书,所写也都是先秦两汉之事。
汉人穆涛,就是由此而来。汉人说的不是汉族人,说的是,穆涛此人给自己找一个位置,要做汉朝人、做一个汉代儒生。韩愈复古原道,要从文明的根源解决问题,越古越好,上追夏商周三代,最终不得不落实到两汉,因为,三代之学其实都是经过汉学整理定型,不经两汉便近不得三代。穆涛心气高傲,为自己找一处生命、知识、文章的根底,取法乎上,从河北跑到陕西,扎下根来,或许就是为了定位两汉。
两汉茫茫苍苍,雄浑朴茂,上总三代,下开万流。站在两汉的位置上,上看下看、左看右看,看山看水看人看岁月,看历史看文化看社会看人心,所见未必深微——汉家本来不以深微取胜,不是九曲十八弯、不是狮螺壳里做道场,大汉是长风万里,纵横天下。以汉为位置,好处就在大,观其大、取其大,于是有了这本《中国人的大局观》。
此书从三代说起,从时间和天象说起,一本书从头说到尾,就是站在汉学立场,谈中国文明与文化的天、地、人。所谓大局,说到底就是这个天地人的格局。三代肇造,汉代大成,绵延至今,千变万化,但华夏文明的大局仍是那个大局。所以,一个中国人,立起这个大局观,便是行于世间的安然坦然。(李敬泽)
(文图:赵筱尘 巫邓炎)