五、主要任务
(一)加快满足近期迫切算力需求。发挥本市算力资源优势,通过与云厂商建立合作,加快归集现有算力,为市场主体提供多元化优质普惠算力,保障本市大模型团队和AIGC企业产品研发和技术创新。采用用户单位与大模型团队结对方式,对形成场景应用模式或试点案例的本市大模型团队训练、初创企业行业模型调优及行业应用推理算力,给予10%的财政补贴。探索支持各区重点布局的产业园区、基地按照入驻即享原则,对大模型企业给予算力支持。
(二)提升中长期算力供给能力。加快建设海淀区北京人工智能公共算力、朝阳区北京数字经济算力中心等重点项目,尽快形成算力供给,完善本市算力供给体系。建设北京市公共算力服务平台,汇聚云厂商和本地算力,形成统一服务窗口并实现算力任务调度,提升集约化、规模化、专业化算力能力,以商业化运营为主、政府适度补贴为辅,满足未来5-10年本市人工智能企业对算力的规模化需求。提高环京地区算力一体化服务能力,形成全国算力网络调度枢纽节点。
(三)推出一批高质量训练数据。梳理大模型训练数据需求清单和供给目录,建立数据供需对接机制。基于市大数据中心和北京国际大数据交易所探索建设可用于大模型训练的公共数据专栏和社会数据专区,推动公共数据和社会数据定向有条件开放。发挥在京国家机关、科研院所、企事业单位丰富的数据资源优势,用好北京国际大数据交易所社会数据专区成果及智源研究院中文语料库,形成训练数据的定向供给,对数据提供方给予一定比例的补贴支持。
(四)谋划建设国家级数据训练基地。在数据基础制度先行示范区布局中谋划建设国家级数据训练基地,探索高价值数据共享的版权、安全和激励机制问题,推动形成基于贡献的商业化合作模式。发挥本市从事人工智能训练数据的专业服务商优势,为大模型预训练的各个阶段所需的数据提供数据支撑和技术服务,开发涵盖文本、图像、视频等多模态的高质量数据集,助力国家级数据训练基地建设。支持发展基于AIGC技术的合成数据新产业。
(五)实施大模型应用创新标杆试点工程。围绕首都之窗智能问答、在线导办等场景,依托私有化部署的算力集群资源,逐步开展政务服务行业专有模型训练、精调、剪枝、蒸馏等工作,赋能“12345接诉即办”辅助场景,总结专用模型实施部署经验,探索政务服务大模型服务模式。支持金融机构利用大模型技术打造“全能业务助理”,提升金融从业者的服务半径和服务质量。探索大模型助力智慧城市建设,推动城市大脑等城市管理公共平台开放数据接口引入大模型辅助治理。