天风研究(AI核心三要素中,数据稀缺性明显)
5月30日,《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》发布,提到“加强公共数据开放共享”、“加快构建高质量人工智能训练数据集,研究建立数据集开放共享机制”;5月31日,《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》,提到“培育高质量数据要素市场”、“2023年年底前出台公共数据开放管理办法、公共数据资源目录,制定公共数据开放计划”。
3、数据要素是数字经济核心引擎,进入加速落地阶段
3)数据平台与安全:安恒信息、启明星辰、信安世纪、三维天地、普元信息
4)垂直行业AI应用:科大讯飞、同花顺、中科软、恒生电子、顶点软件、新致软件
2、北京、深圳相继发布AI支持政策,强调公共数据开放
算法、算力、数据是AI核心三要素,我们认为AI三要素中数据是直接影响AI大模型在垂直行业落地效果的关键。数据流通是数据资源体系构建的关键,是数据要素建设重点方向,其中数据交易制度、公共数据流通体系是建设重点,我们认为,算力之外,重视数据要素在AI大模型中的价值。数据是数字经济时代新型生产要素,是数字经济深化发展的核心引擎。
1、AI三要素中,数据稀缺性明显
风险提示:
数据是数字经济时代新型生产要素,是数字经济深化发展的核心引擎。2022年12月,《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》发布,2023年3月,国家数据局成立,顶层框架文件 管理机构落地,数据要素进入加速落地阶段。2023年以来各地方积极推进数据要素落地,例如:2023年2月,《杭州市公共数据授权运营实施方案(试行)》(征求意见稿)发布;4月,广东省政务服务数据管理局局长在“2023数字经济峰会”主题发言中透露,《广东省数据条例》即将出台,广东研究将数据生产要素纳入国民经济核算体系,广州海珠、深圳南山已获批开展数据生产要素统计核算试点。
建议关注:
2)数据产品服务商:中科江南、上海钢联、通行宝、海天瑞声、中远海科
1)国家云:深桑达A、中国电信(通信组覆盖)、品高股份
本文源自券商研报精选
算法、算力、数据是AI核心三要素,当前AI大模型的训练,算法端向神经网络Transformer模型收敛,算力端依赖具备大规模并行计算能力的AI服务器集群,数据端则需要巨大数据量的大规模数据集投喂,我们认为AI三要素中数据是直接影响AI大模型在垂直行业落地效果的关键,而垂类数据通常由政府和行业机构掌握,相比于模型和算力,数据稀缺性明显。目前通用大模型的训练数据集多来自互联网文本数据,例如ChatGPT训练数据集来自维基百科、互联网新闻、社交媒体、电子书等。彭博社发布了针对金融领域的大型语言模型BloombergGPT,训练采用51.27%金融信息数据和48.73%的公共数据,在500亿参数规模下,BloombergGPT对金融任务效果好于通用大模型。
世界新七大奇迹 世界七大建筑奇迹
这个充满竞争的时代,人与人之间会比较,城市与城市之间也常见,而国与国之间就更加的明显。各种奇怪的“比拼”:世界文化遗产最多的国家,最脏的国家,破世界纪录最多的国家……在世界新七大奇迹的“比拼”中,中国成为佼佼者,独占两席。这两大奇迹,一个超1200亿,一个占据榜首。大财经2023-03-23 11:24:480000整栋楼的天然气管道横穿自家厨房 业主担心存在安全隐患
袁先生想搞清楚:整栋楼的天然气管道穿过自家厨房再通向楼上是否合理?已经装好的天然气管道能否改装?南飞鸿·天锦小区位于西安市科技二路。2023年4月袁先生购买小区7号楼3层现房一套,同年6月收房。近期袁先生着手装修房子,才发现横跨厨房的天然气管道影响了橱柜安装。大财经2024-01-12 11:12:230000数读惠州国资国企2022年经济成绩单
点击查看专题报道2022年是国企改革三年行动攻坚之年、收官之年。回首这一年,惠州市国有企业经济运行取得哪些成绩?南方梳理相关数据,带你一图“数”读。【统筹】罗锐【记者】廖钰娴【制图】刘晓娜【作者】廖钰娴【来源】南方报业传媒集团南方客户端大财经2023-04-16 20:16:390000曾卖到16万/平的豪宅延期交付半年,却因为28.31平方米而无法办理房产证…
每经记者:黄婉银每经编辑:陈梦妤超出的28.31平方米,令徐晴(化名)等一众豪宅业主始终无法办理房产证。今年8月,在业主们的持续“监工”下,原本应该2022年底精装交付的房屋终于延期交付。但还没高兴多久,大家就发现,项目至今未办理大确权手续。0000