把握规律抢抓人工智能发展机遇

发表于: 2025年3月6日

工作人员在中国电信云计算贵州信息园机房内巡检。 贵州日报天眼新闻记者 谢佳杰 摄

朱宗尧

党的十八大以来,以习近平同志为核心的党中央把发展人工智能提升到战略高度。早在2018年,中共中央政治局第九次集体学习时,习近平总书记强调,我国经济已由高速增长阶段转向高质量发展阶段,正处在转变发展方式、优化经济结构、转换增长动力的攻关期,迫切需要新一代人工智能等重大创新添薪续力。这一重要论断为我国发展人工智能提供了行动指南和根本遵循。

近年来,全国各省、自治区、直辖市纷纷抢抓人工智能特别是大模型发展机遇,结合自身优势谋篇布局。对贵州来说,发展人工智能大模型,是贯通算力、赋能、产业三个关键的“牛鼻子”工作,必须抓住机遇、全力推进,这已经不是选答题,而是必答题。

人工智能概念1956年在达特茅斯会议上被提出,经历三个发展阶段。“专家系统”阶段,深蓝机器人1997年在围棋大赛中战胜人类顶级高手。“小模型”阶段,2009年,华裔科学家李飞飞推动图像识别技术发展,首次让机器视觉识别图像超越了人类。“大模型”阶段,通过海量数据预训练超大规模参数的大模型,模型参数规模从千亿级发展到万亿级乃至十万亿级,从专用走向通用,其中标志性的事件就是ChatGPT的出现。

大模型发展的特点:通用大模型、行业大模型并重发展

通用大模型L0。是指可以在多个领域和任务上通用的大模型,主要依托巨量参数的深度学习算法,利用大算力在大规模无标注数据上进行训练,形成“举一反三”的强大泛化处理能力,相当于Al完成了“通识教育”,其特点是通识能力强、行业能力不足。包括近期火热的DeepSeek,以及华为“盘古”、百度“文心一言”、阿里“通义千问”、腾讯“混元”、字节“豆包”等,都是通用大模型。在DeepSeek出现前,通用大模型一般都需要巨额资金和顶尖人才的持续投入。

行业大模型L1。是基于通用基础大模型,结合垂直行业数据针对特定行业或领域的大模型。通常使用行业相关的数据,针对通用基础大模型进行预训练或微调,提高在该领域的性能和准确度,相当于培养AI成为“行业专家”。

目前,全国已备案的行业大模型数量超过400个,如中国石油集团油气领域昆仑大模型、国家石油天然气管网集团管网大模型、南方电网集团面向电力行业的大瓦特模型、中国工商银行金融行业大模型、360AI全科医生大模型等。行业大模型建设投入相对较小,有实际项目案例可借鉴,商业模式比较清晰,应当作为贵州的重点发展方向。

人工智能大模型三大核心要素:算力、语料、算法

算力是人工智能大模型发展的“心脏”。就像工业时代的电力,未来可能直接决定一个国家和地区的经济社会发展能力。当前全球人工智能芯片市场,英伟达市场份额达到90%,微软、谷歌、亚马逊、Meta等巨头也在加速布局。国内芯片厂商主要有华为、百度、寒武纪等,2023年自主研发芯片已经占据国内市场35%的份额,比2022年增长一倍还多,在全球市场的竞争力逐步增强。目前贵州总算力规模超过63Eflops,其中智算占比超90%,国产化部分超90%,区域集聚度超90%,2025年总算力规模预计将飞跃至150Eflops。目前,算力发展存在三方面挑战:一是智算产业本身的成熟度和生态建设需要时间;二是国产芯片从单位算力等角度看,成本和价格处于劣势;三是一定程度存在无序竞争。贵州需要持之以恒把发展智算产业、培育智算生态作为战略方向抓下去,坚定不移打造“贵州算力”品牌。

语料是人工智能大模型发展的“血液”。可供大模型训练推理使用的加工处理过的数据称为语料。所谓“读万卷书、行万里路”,语料是构建和训练大模型的基础资源,其质量直接影响大模型的性能。目前,我省从企业数据看,相当部分的企业没有生产管理流程的线上数据,或只有零散数据但未进行数据归集。从公共数据看,医疗、教育、供水、供电、燃气等具有极大价值的公共数据分散各处,数据统筹汇集难、交易流通难等问题依然存在。从政务数据看,有的单位对数据下场仍然“不敢、不愿、不会”。需要从数据源头推动,引导鼓励企业加快数字化转型,细化统一行业数据采集标准,坚持授权运营模式,推动公共数据“应开放尽开放”,牵引带动社会数据汇聚。

算法是人工智能大模型发展的“大脑”。常见的深度学习算法有Transformer、卷积神经网络(CNN)、循环神经网络(RNN)等,同时在行业大模型构建中,由软件解决方案服务商根据行业甚至场景的不同特点和需求,对通用算法和建模进行调优,使之更加轻量化、专业化、个性化,突破通用算法在行业具体应用上的一些瓶颈。贵州软件产业规模小、经营主体少,好的软件解决方案服务商更是稀缺,需要突出补链强链,加速培育数字产业生态。

行业大模型四大特征:聚焦解决行业难题

行业或企业本身的数字化是行业大模型发展的前提基础。数字化—网络化—智能化是逐步积累、逐项递进的过程,没有数字化、网络化的基础,不可能飞跃到智能化。大模型是智能化阶段的典型特征,大模型的质量,直接取决于数据集的质量,取决于各行业、各企业主体本身数字化的水平。对网络化、数字化本身基础比较差的,需要逐步推动改造升级,否则发展大模型是空谈;对基础比较好的,要重点支持构建高质量数据集,优先开展行业大模型应用。

“小切口、大场景”是行业大模型发展的关键。发展行业大模型一定要突出需求导向,从“小切口”入手,满足具体的需求,解决具体的问题。例如,贵州电网基于“大瓦特”大模型,从电力系统的无人机巡检缺陷图片识别切入,通过提升算力、优化算法不断提升识别准确率、缩短识别时间,目前每分钟能够处理100张图片,准确识别20类缺陷,效率是过去的10倍。

“嵌入式”“伴随式”是行业大模型发挥作用的主要方式。“嵌入式”是指将大模型以特定方式集成到其他系统或产品中,“伴随式”是指大模型以一种类似于陪伴或助手的角色与用户任务执行相伴随。绝大多数行业大模型均采用这两种模式,而不是另起炉灶,单独建设一套系统平台。例如,贵州旅游数智互联平台通过大模型嵌入,实现自动生成旅游宣传视频,大大降低了成本、提升了效率。

软件解决方案服务商是行业大模型发展的重要抓手。好的大模型应用需要业主方和软件解决方案服务商双方通力配合完成。从业主方角度,要规划并把握好大模型建设的定位、目标和预算等,帮助软件解决方案服务商深度梳理自身的业务流程和需求、痛点。从软件解决方案服务商角度,要承接大模型的具体建设开发,负责数据的归集治理形成高质量数据集,通过专业服务、场景定制化开发等,确保落地的模型满足实际的应用场景。例如,贵州能源集团与华为基于文家坝煤矿建设矿山大模型,为瓦斯浓度时序预测、瓦斯突出异常分析等模型开发设计提供了行业经验。

下一步,贵州将深入贯彻落实《贵州省推动人工智能高质量发展行动方案(2025—2027年)》《贵州省促进行业大模型发展行动方案》部署,抢抓机遇、拥抱创新、发挥优势、练强内功,坚持算力、数据、应用、产业联动,全力打造全国数据产业集聚区,建设全国算力高地、数据高地,推动治理数字化转型、生活数字化转型、产业数字化转型。

(作者为贵州省大数据发展管理局党组书记、局长,省政府副秘书长(兼))

 

 

来源:贵州省大数据局官网

相关推荐