民生证券表示,各家大模型推出后,市场会逐步凝结共识,得数据者得天下,数据将成为大模型差异化竞争的关键。
近日,继百度之后,阿里、华为、京东、360 等大模型也陆续浮出水面,大模型军备竞赛正式开启。
4 月 7 日,阿里云宣布自研大模型 “通义千问” 开始邀请企业用户测试体验。
4 月 8 日上午,华为云人工智能领域首席科学家田奇现身《人工智能大模型技术高峰论坛》,分享了华为云盘古大模型的进展及其应用。
同是 4 月 8 日召开的人工智能大模型技术高峰论坛上,京东集团副总裁何晓冬表示,针对真实的产业需求,京东将在今年发布新一代产业大模型,言犀是 “京东版” ChatGPT,言犀大模型预训练参数达到千亿级,品类覆盖 3000+,人工审核通过率 95%+、生成文字 30 亿 +。
4 月 9 日晚,360 正式官宣,基于 360GPT 大模型开发的人工智能产品矩阵 “360 智脑” 率先落地搜索场景,将面向企业用户开放内测。
据民生证券根据公开信息不完全统计,目前国内至少已经有 30 多家大模型亮相,其中不乏参数规模甚至超过 ChatGPT 规模的大模型,厂商涵盖了互联网巨头、AI 上市公司、服务器龙头企业、科研院所与一级市场创业公司。
当大模型不再稀缺,得数据者得天下
民生证券表示,大模型表面不再稀缺后,实质格局更像 “太极拳”:易学难精。
其指出,因为开源基础以及大公司本身的算力储备与资金实力,单纯发布一个大模型门槛并没有市场想象那么高,但能够拥有高质量数据场景助力持续迭代,使得逐步性能逼近 ChatGPT 的大模型预计最终仍是 “凤毛麟角”。市场会逐步凝结共识:得数据者得天下,数据将成为大模型差异化竞争的关键。
兴业证券也表示,受制于算力资源、商业模式等原因,国内市场针对 2B 垂直领域、基于大模型精调之后的小模型有望率先商业化落地,百度、华为、彭博等已陆续发布多个垂直行业大模型,而要训练专业的行业大模型,优质的行业数据、公共数据至关重要。
其同时指出,AI 三大核心要素算力、算法和数据,数据是AI算法(模型)的 “饲料”,重要性甚至超过算法和算力。
就国内数据市场而言,据发改委官方批露,我国政府数据资源占全国数据资源的比重超过 3/4,但开放规模不足美国的 10%,个人和企业可以利用的规模更是不及美国的 7%。因此,其表示加强公共数据的开放开发,是当前急需落实的核心问题,而国家数据局的组建有望,或将从数据源头加快重要政务部门、重点关键行业的数据分类、确权进程。
国盛证券也表示,AIGC 算法日新月异,更加证明数据要素在当今的重要性。
其指出,Meta 发布基础模型 SAM 并开源。SAM 已在 1100 万张图片和 11 亿个掩码的数据集上进行了训练,具有超强的自动识别、切割功能。其认为,SAM 使用的 1100 万张图片训练集仅是一个开始,未来随着用户数量增加,SAM 的图片训练量和分割掩码体量会呈指数级增长,因此数据要素的价值应得到持续关注。
数据要素领域动作频频
据浙商证券梳理,近两周内,国内多地政府频出数据政策,加速数字化建设。
首先是,哈尔滨市大数据中心《网信部门行政执法程序规定》,规范和保障了网信部门依法履行职责,保护了公民、法人和其他组织的合法权益,维护国家安全和公共利益。
其次是,深圳市发展和改革委员会公示《深圳市数据产权登记管理暂行办法》征求意见稿结果,针对这些意见和建议,发改委已经采纳并做出相应调整,包括明晰数据资源持有权、数据加工使用权、数据产品经营权的概念、优化数据资源和数据产品的名词解释等;
接着是,苏州市大数据管理局为了规范和促进本市公共数据开放、激活数据要素潜能,全面赋能数字苏州建设而制定发布《苏州市公共数据开放实施细则(征求意见稿)》;
然后是,河南省制造强省建设领导小组办公室发布《2023 年河南省大数据产业发展工作方案》,提出 2023 年全省大数据产业规模将增长 25% 以上,基础设施将不断完善,5G 基站总数将突破 18 万个,新型数据中心和边缘数据中心将得以建设。
此外,3 月 28 日,第三届两化融合暨数字化转型大会在江苏苏州召开;3 月 31 日,上海数据交易所上线国内首个数据交易链;4 月 1 日,深圳数据交易所完成增资。4 月 3 日,银保监会将全面开展非银机构数据治理工作。
浙商证券表示,数据政策不断涌现,为数据要素的兴起注入法治精神和制度动力,孕育优越外部环境,国内数据要素市场蒸蒸日上,展现出蓬勃生机。
哪些数据要素应用有望率先落地?
招商证券表示,我国组建国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等。其认为,国计民生类数据有望率先成为国家数据局试点改革的领域,重点可关注医保数据及交通数据两个方向。
其中医保方面上周市场已充分演绎,医疗 +AI 大涨,龙头久远银海4 天 3 板。一方面,全国统一医保信息平台已在 31 省全域上线,覆盖支付方式、跨省异地就医、公共服务等多个子系统,实现全国医保业务编码标准统一、数据规范统一、经办服务统一,也实现国家/省/市/县四级医保部门以及医保与人社等部门和医疗机构等单位的数据互联互通。另一方面,国家医保局等持续深化医保数据治理水平,通过治理规范、质量评估标准等的建立为医保大数据应用提供基础。
第二就是交通数据。
招商证券表示,多项交通大数据相关顶层政策连发,智慧交通政策驱动强。
2022 年 10 月国务院印发的《全国一体化政务大数据体系建设指南》中,提出全国一体化政务大数据体系按需接入供水、供电、供气、公共交通等公共服务运营单位在依法履职或者提供公共服务过程中收集、产生的公共数据;鼓励各地区各部门开展应用创新,在普惠金融、卫生健康、社会保障、交通运输、应急管理等领域开展试点,推进重点领域政务数据深度应用。
2023 年 2 月国务院印发的《数字中国建设整体布局规划》中,提出要推动数字技术和实体经济深度融合,在农业、工业、金融、教育、医疗、交通、能源等重点领域,加快数字技术创新应用。多项国家级政策连发,智慧交通顶层设计明确,政策驱动强。