17部门:建设高质量语料库和基础科学数据集,支持开展人工智能大模型开发和训练

更新时间:2024-01-04 22:06:09作者:无忧百科

17部门:建设高质量语料库和基础科学数据集,支持开展人工智能大模型开发和训练

国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》。其中提出,推动科学数据有序开放共享,促进重大科技基础设施、科技重大项目等产生的各类科学数据互联互通,支持和培育具有国际影响力的科学数据库建设,依托国家科学数据中心等平台强化高质量科学数据资源建设和场景应用。以科学数据助力前沿研究,面向基础学科,提供高质量科学数据资源与知识服务,驱动科学创新发现。以科学数据支撑技术创新,聚焦生物育种、新材料创制、药物研发等领域,以数智融合加速技术创新和产业升级。以科学数据支持大模型开发,深入挖掘各类科学数据和科技文献,通过细粒度知识抽取和多来源知识融合,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展人工智能大模型开发和训练。探索科研新范式,充分依托各类数据库与知识库,推进跨学科、跨领域协同创新,以数据驱动发现新规律,创造新知识,加速科学研究范式变革。