登陆注册
27710

历经九年(终迎花开,声网正成为AIGC发展的,铲子股)

大财经2023-05-08 23:27:020

而随着泛娱乐社交赛道的逐渐成熟,从找到合适的新场景,到将想法转化为产品,留给创业者的时间越来越短,这也导致了产品的快速上线变得越来越重要。声网作为音像技术的底层服务商,一直致力于为企业快速构建泛娱乐场景,提供场景化的 API。

两年前泛娱乐社交热潮的时候,元宇宙这个概念很火,从去年开始, AIGC的元素就开始慢慢地融入其中,再到最近的 ChatGPT,人们已经达成了共识,那就是人工智能领域的突破,将会引领新一轮的技术浪潮。整合大模型也会成为未来泛娱乐社会产品的发展方向。

声网作为一家历经九年发展的全球实时互动云服务开创者和引领者,终于迎来了“开花期”。声网API将成为AIGC的关键突破点之一,而不是前几年被机构所遗忘的“鸡肋”技术。

二十届中央财经委员会第一次会议提到:要把握人工智能等新科技革命浪潮。声网作为行业内的先行者正努力发展成为我国AIGC产业的关键“铲子”企业,为我国人工智能发展奠定一定的基础。

本文源自证券之星

声网生成式AI不仅从技术上已经大大超过了许多A股上市公司的大模型架构,而且在机构投资者众多的美股市场也受到了极大的认可,就在5月5日,公司美股一度涨幅超11%,获得了大量资金的入场投资。

声网首席科学家钟声对生成式人工智能的未来发展提出了两点设想,第一点就是读取人的大脑,将其转化为互动。随着内容越来越多,搜索的重点也越来越多,算法推荐也就应运而生了。有很多知识,但我们却不知道如何获取,也不知道哪种知识对我们有用,因此需要自动化地获取它们。现在看得更加清楚了,在未来,它们将会融合成一个统一的整体,完全由 AI产生并支配, AI生成的视频可以让你无时无刻不在看。

就拿在线合唱场景来说,声网除了提供实时、低延迟、强同步的音视频功能外,还提供了一整套 KTV场景的组建化工具。

目前,上海几个游戏公司已经在 NPC中加入了大型模型。声网娱乐产品总监李斯特认为,目前有很多新兴的游戏,比如虚拟主播、棋牌游戏、社交类游戏等,都非常适合大语言模型的使用。比如,与音视频技术紧密结合的狼人杀场景,在未来,在一局真实的线上狼人杀游戏中,可能会有很多的 AI玩家和真实玩家同时存在。

就拿声网 SDK来说,仅凭声音数据,就能生成视频或驱动“超音”,将 ChatGPT数据输入左侧,右侧就能得到1080 p以上的分辨率。从移动端实现的面捕实时驱动案例看,因为模型相对较好,所以要在移动端有较高的覆盖率,不能只关注高端手机。声网在算法上进行了最大程度的优化,就像我刚刚提到的超级画质,每帧都能达到1080 P。在iphone10和iphone11中,处理时间少于1毫秒,而4 K视频同样可以通过软件进行处理。

从2018年开始,声网一直在为内容,用户,互动方式而苦恼。无论是在内容还是在数据方面, UGC数量都在增加;在消费方式方面,它变得更加个性化了,不仅是算法推荐,而且是非线性的、突发性的消费,许多虚拟内容都希望有一种实时临场的感觉,如今的交互方式除了手之外,已经开始使用语音和手势。

AI 游戏娱乐的应用空间很大

在线实时合唱场景是近年来声网观察到的一种快速增长的场景,在用户留存、活跃度等方面具有显著优势。声网发现将优秀的合唱团功能加入到产品中,能够极大的提高用户的参与度和粘性,根据数据显示,上麦率提高了七成,活跃度提高了三成。这个组件化工具可以理解成功能的代码块,在被集成到开发者的项目里后,可以快速把K歌场景跑起来,尽量减少中间的复杂逻辑。

声网生成式人工智能技术致力于为 RTC/RTE领域提供更好的服务,它能够实现超分、超质、超音、超流、超测、超帧、抠图等功能。目前,除了“超帧”这个尚未完全落地、商业化的产品外,其他的都已经开发出来了,或者即将开发出来。

声网生成式AI技术正得到国际市场认可

0000
评论列表
共(0)条
热点
关注
推荐