市直各相关部门,各县(市)区、开发区政数部门:
现将《长春市培育数据标注产业高质量发展行动计划(2025—2027年)》现印发给你们,请结合实际,认真抓好贯彻落实。
长春市推进政府职能转变和数字政府建设领导小组办公室
(长春市政务服务和数字化建设管理局代章)
2025年5月28日
(此件公开发布)
长春市培育数据标注产业高质量发展行动计划
(2025—2027年)
为贯彻落实国家发展改革委、国家数据局、财政部、人社部《关于促进数据标注产业高质量发展的实施意见》有关要求,充分发挥长春市产业基础优势和集聚效应,加快推动长春数据标注产业高质量发展,为人工智能发展提供高质量数据供给,培育壮大标注产业生态,释放数字经济新动能,现制定本行动计划。
一、工作目标
深入贯彻落实习近平总书记关于数据发展和安全的重要论述,以促进数据流通使用、赋能经济社会发展为主线,坚持开放协作和安全发展相结合的工作原则,结合长春现代化都市圈建设规划,以打造东北数据标注产业高地为目标,着力培育数据标注业态,打造产业集聚布局,引育数字标注人才,形成行业赋能动力,促进数字经济高质量发展。构建“1+3+5+N”标注产业发展体系,即:设立一个综合数据标注基地,实施三项攻坚举措,推动产业“五链协同”,支撑N个行业领域应用。到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,建设成为东北地区数据标注产业核心枢纽,引入3家以上数据标注龙头企业,引育20家以上数据标注企业,形成不少于11个行业的高质量数据集,年标注能力超1000TB,辐射带动省内形成10亿级产值数据标注产业集群,带动全省标注从业人员达5000人以上。
二、重点任务
(一)设立一个综合数据标注基地
围绕“基础设施集约化、数据资源集成化、标注服务专业化”目标,在长春市设立一个综合数据标注基地,集聚产业链上下游企业,形成“标注+算力+应用”生态圈,突出三个重点任务:一是推动部署双千兆光纤网络,搭建PB级标注数据中台,夯实标注产业基础;二是因地制宜培育产业集群,吸引人工智能数据服务商、垂直领域标注团队入驻,加快提升综合标注能力;三是促进省内标注产业协同,制定行业数据标注标准,对接区域标注平台、人力和订单等资源,打造东北数据标注供需对接、数据流通和产业创新枢纽。
(二)实施三项攻坚举措
1.组建长春现代化都市圈数据标注产业联盟。在吉林省政数局指导下,打造省内协同发展格局,联合吉林、四平等城市,吉林大学、吉林师大、长春理工大学等高校,净发数科、科大讯飞、联通产互等企业,组建长春现代化都市圈数据标注产业联盟。推动产业联盟建立“标注质量认证、服务标准制定、人才联合培养”三位一体协作机制,开展数据标注服务供需对接、银企对接等活动,促进上下游产业整合协作、产学研用深度融合。
2.搭建通用智能标注公共服务平台。融合对接多行业智能数据标注平台,整合多模态数据标注能力和工具,提供标注基础算力支撑,建设数据标注企业、人才信息登记认证服务中心,集成智能标注、数据合成、算力支撑、算法工具、检验检测和人力资源等服务能力,面向全省提供数据生产、标注、交易等平台解决方案、算法工具和一体化服务。
3.打造行业高质量数据集。围绕数据收集、数据清洗、数据标注、数据验证、数据存管、数据更新、数据维护等环节,实现各行业公共数据的高质量归集汇聚。重点围绕文旅、能源、教育、医疗、医保、交通、城管、应急、农业、气象、政务等11个行业,每个行业建设不少于2个高质量数据集和5个典型案例。
(三)推动标注产业“五链协同”
1.数据资源链:加快完善公共数据资源供给体系,将采购限额以上的数据标注服务纳入政府采购范畴,有序推动公共数据标注与开发利用。鼓励引导企业加大数据开发利用,释放企业数据标注需求,依托可信数据空间汇聚企业数据,形成企业数据“汇聚—加工—应用”模式。
2.技术创新链:聚焦技术瓶颈突破与产业附加值提升,联合高校及数据标注头部企业研发力量探索研发多模态标注、轻量化标注、标注审查、质量评估、基于思维链的专家标注等智能化工具,构建“基础数据标注—场景算法优化—行业解决方案”的全链条服务体系,促进智能质检算法等技术成果转化应用,助推人工智能产业发展。
3.应用生态链:聚焦区域资源整合与优势互补,依托综合数据标注基地,探索建立数据标注“虚拟产业园区”,通过虚拟化集聚产业资源、平台化运营和网络化协同,为入驻企业提供工商注册、法律咨询、人力资源、融资对接等一站式服务,构建数据标注产业生态;提供数据标注交易撮合、标注任务分包、人才培训认证、供应链金融等服务,规范数据标注产业合规运营,打造具有区域竞争力的数据标注产业集群。
4.人才供给链:促进数据标注人才标准化培养与供需对接,推动职业院校开设“数据标注师”订单班和数据标注微专业;依托行业组织、院校、社会培训评价组织等开展数据标注相关职业技能等级认定,支持市属企业、院校申报职业技能等级认定机构人工智能训练师职业(数据标注员工种)的备案;建立数据标注人才库,实现跨区域标注人才互认;加大标注实践和公共实训基地建设,搭建数据标注人才培养通道。
5.产业资金链:构建“数据标注产业资金池”,引入开发区配套资金及龙头企业投资等多元资金,首期募集2000万元设立专项资金池,重点用于标注业务逾期回款、技术升级补贴、闭环风控管理。强化政银企融资对接服务,发挥“政园银担”融资模式作用,畅通企业和金融机构的沟通渠道,加强对数据标注产业的信贷支持力度。
(四)支撑N个行业应用
重点面向数字政务、医疗教育、汽车智能、卫星遥感、低空经济、数字文旅等领域,深入挖掘人工智能技术和应用需求,建成行业高质量数据集,赋能交通、医疗、金融、制造、农业等重点行业发展。
1.数字政务+:以构建电子公文全生命周期规范化、高效化、智慧化管理为目标,归集本地政务公文数据、政策信息,采购政务数据标注服务,坚持场景牵引,建设“长春市数字政务知识中心”,打造政务办公大模型服务平台。
2.数字文旅+:针对重点景区文旅数据,开展数据采集、标注、标定、发布,对文旅行业数据进行轻量化清洗和标注,助力文旅数据集和数字AR/VR景点建设,赋能长春数字文旅新业态。
3.医疗数据+:以医保、医学影像、临床病历、药品临床数据、处置处方、检查检验等多源医疗服务数据标注为基础,形成安全合规的医疗健康数据集资源,满足医疗领域人工智能大模型多方面需求,围绕问诊引导、诊断和治疗辅助决策等场景,推动大模型在医疗领域的应用。
4.智慧农业+:搭建农业大数据赋能平台,应用物联网、无人机等设备,采集农用地、气候环境、作物生长等数据,通过多模态、语义分割等算法进行数据标注,精准识别农作物生长状态、病虫害、加工生产线监测和农产品等级,实现农药精准撒播、农作物智能采摘、生产线智能监测、农产品溯源定级等。
5.教辅数据+:引入教育专业人士和教辅发行机构,强化对教育数据进行专业的标注和注释,构建自主可控的专科数据集,搭建教育出版发行大模型,从推动线上教育由作业答题向数智化升级,助力实现教育高质量发展。
6.住建数据+:按照公共数据授权运营实施规范,对接国家、省级住建部门,回流利用住建行业开放和可授权数据,对住建数据资源进行数据标注和建模,在确保数据安全前提下,面向省内建筑、设计、装修等二级市场开放标定数据产品,赋能传统建筑行业设计、造价、效果图、实施全链条。
三、保障措施
一是加大政策扶持。落实研发费用加计扣除、高新技术企业税收优惠等政策,加大对虚实产业园区税收、奖励等扶持力度,降低数据标注企业成本;鼓励一汽、长光卫星等国企及科研院所优先与综合标注基地形成长效供需对接机制,配套建立数据标注业务发包激励机制,助力本地数据标注产业高质量发展。
二是开展重点招商。聚焦“政务服务、智能制造、低空经济、智慧交通、多行业赋能”应用场景,通过“以商招商”“联合招商”等方式,积极对接百度、科大讯飞等数据标注产业龙头企业,招引数据标注企业及数据采集、清洗等上下游产业链企业落地,快速推进数据标注产业提质扩容。
三是强化安全监管。落实数据标注全过程相关主体的安全责任,依托行业联盟建立健全数据标注行业安全管理规则;搭建区块链技术标注过程存证平台,围绕数据标注全流程质量追溯与数据隐私保护,加强对数据采集、标注存储、使用等环节的安全监管,保护数据标注企业在数据流通过程中形成的相关权益,为数据标注产业的健康发展提供保障。
初审:王冠 复审:柳羽辉 终审:刘晓茹