
目前,盘石科学文档解析器1.0版本已正式开源,并作为核心组件集成到中科院自动化所“盘石科学核心模型”(ScienceOne)中,服务于全球科研界。下一步,研究团队将扩大科学内容多模态分析能力,并将继续促进开放协作的科学情报生态系统的创建。
“人工智能+科学研究团队发布盘石科学文档解析器。照片由中科院自动化研究所提供。
研究团队介绍,盘石科学文档解析器从底层算法入手,构建了多模态训练系统和强化学习机制来理解科学含义。在公式、文本、图形等元素的协同分析上实现质的飞跃,为全球科研人员提供真正“懂科学”的智能分析引擎。
在盘石科学文档解析器的开发过程中,团队放弃了单纯依赖大规模通用视觉语言模型的想法,转而构建了一套适应科学文档场景的p算法训练范式。其核心在于三大技术支柱:全场景科学数据构建、有监督的多模态调整策略以及强化巩固科学文档语义的学习优化机制。
在数据层面,科学文档的三种典型格式包括手写、数字排版和纸质扫描。系统地收集和构建了训练语料库。这种“完全正式、多学科、高质量”的数据基础设施为模型理解科学表征的复杂性提供了强有力的支持。
在模型训练阶段,采用两阶段优化策略。首先,通过多模态监督微调,模型首先获得了联合表示文本、公式、表格和插图等异质元素的能力。在此基础上,引入面向语义的科学文献梯度强化学习策略优化框架,使模型不仅“看得清楚”,而且“理解正确”。
为更好满足科研需求,盘石科学成果ientific Document Parser不仅包含高精度文本和公式识别结果,还支持多种结构化格式的结果,可以无缝连接到知识抽取、文档分类、智能问答等下游应用。
研究团队在对多个科学文献数据集进行系统评估后表示,盘石科学文献解析器在章节级别分析、数学公式专项识别等任务上表现出国际领先水平。 (完)
亚太合作不能“放手”
从饺子到MoMo:跨越喜马拉雅山的中尼美食桥梁
AI时代,互联网必须成为“会思考”的东西
北方大部分地区已经入冬,有的甚至提前了20多天。
10月以来,全国平均气温“初暖终冷”,“冷”北方温暖,南方温暖。”
如何申请技能改进补助金?人类社会的部分反应
咬一口,汁水就爆出来了!充满秋冬所有甜酸的柚子。
“航天鼠”如何度过短暂的太空“出差”?
让人们做自己:城市对年轻人的可贵包容
近期金价为何波动如此之大?还会继续上涨吗?
这些新规定从11月起生效,将影响你我的生活
贵阳是如何成为中国的?它已经成为“咖啡城”了吗?
2025年全球金融科技中心城市名单发布;前10名城市中有5个在中国
如果引入AI标识、大型模型等,非法AI广告将如何处理?
地宫里有“毒气防盗”吗?秦始皇陵发现水银雾
评:说走就走,“馆长”就回大陆了越过障碍。
一个诈骗团伙以求职司机为目标,“雇佣”他们,骗取他们的保证金。
‘我们。债务炸弹每分钟支付 200 万美元利息