YBB Capital:Sora横空出世,2024或成AI Web3变革元年?
原文作者:YBB Capital? Zeke
2?月?16?日,OpenAI?公布了最新的文本控制视频生成扩散模型“Sora”,通过多段涵盖的广泛视觉数据类型的高质量生成视频,展现了生成式?AI?的又一个里程碑时刻。不同于?Pika?这类?AI?视频生成工具还处于用多张图像生成几秒视频的状态,Sora?通过在视频和图像的压缩潜在空间中训练,将其分解为时空位置补丁,实现了可扩展的视频生成。除此之外该模型还体现出了模拟物理世界和数字世界的能力,最终呈现的?60?秒?Demo,说是“物理世界的通用模拟器”也并不为过。
而在构建方式上,Sora?延续了此前?GPT?模型“源数据-Transformer-Diffusion-涌现”的技术路径,这意味着其发展成熟同样需要算力作为引擎,且由于视频训练所需数据量远大于文本训练的数据量,对于算力的需求还将进一步拉大。但我们在早期的文章《潜力赛道前瞻:去中心化算力市场》中已经探讨过算力在?AI?时代的重要性,并且随着近期?AI?热度的不断攀升,市面上已经有大量算力项目开始涌现,而被动受益的其它?Depin?项目(存储、算力等)也已经迎来一波暴涨。那么除了?Depin?之外,Web3与?AI?的交织还能碰撞出怎样的火花?这条赛道里还蕴含着怎样的机会?本文的主要目的是对过往文章的一次更新与补全,并思考?AI?时代下的Web3存在哪些可能。
从层次上划分神经网络可分为输入层、隐藏层、输出层,而不同层之间连接的便是参数。
由于过去已经写过相关文章,所以本段的主要目的是更新一下算力赛道的近况。当谈到?AI?时,算力永远是难以绕开的一环。AI?对于算力的需求之大,在?Sora?诞生之后已经是难以想象了。而近期,在瑞士达沃斯?2024?年度世界经济论坛期间,OpenAI?首席执行官山姆·奥特曼更是直言算力和能源是现阶段最大的枷锁,两者在未来的重要性甚至会等同于货币。而在随后的?2?月?10?日,山姆·奥特曼在推上发表了一个极为惊人的计划,融资?7?万亿美元(相当于中国?23?年全国?GDP?的?40%?)改写目前全球的半导体产业格局,创立一家芯片帝国。在写算力相关的文章时,我的想象力还局限在国家封锁,巨头垄断,如今一家公司就想要控制全球半导体产业真的还是挺疯狂的。
所以去中心化算力的重要性自然不言而喻,区块链的特性确实能解决目前算力极度垄断的问题,以及购置专用?GPU?价格昂贵的问题。从?AI?所需的角度来看,算力的使用可以分为推理和训练两种方向,主打训练的项目,目前还是寥寥无几,从去中心化网络需要结合神经网络设计,再到对于硬件的超高需求,注定是门槛极高且落地极难的一种方向。而推理相对来说简单很多,一方面是在去中心化网络设计上并不复杂,二是硬件和带宽需求较低,算是目前比较主流的方向。
中心化算力市场的想象空间是巨大的,常常与“万亿级”这个关键词挂钩,同时也是?AI?时代下最容易被频繁炒作的话题。不过从近期大量涌现的项目来看,绝大部分还是属于赶鸭子上架,蹭热度。总是高举去中心化的正确旗帜,却闭口不谈去中心化网络的低效问题。并且在设计上存在高度同质化,大量的项目非常相似(一键L2加挖矿设计),最终可能会导致一地鸡毛,这样的情况想要从传统?AI?赛道分一杯羹着实困难。
机器学习算法,是指这些算法能够从数据中学习规律和模式,并据此做出预测或决策。算法是技术密集型的,因为它们的设计和优化需要深厚的专业知识和技术创新。算法是训练?AI?模型的核心,它定义了数据如何被转化为有用的见解或决策。较为常见的生成式?AI?算法比如生成对抗网络(GAN)、变分自编码器(VAE)、转换器(Transformer),每个算法都是为了一个特定领域(比如绘画、语言识别、翻译、视频生成)或者说目的而生,再通过算法训练出专用的?AI?模型。
那么如此之多的算法和模型,都是各有千秋,我们是否能将其整合为一种能文能武的模型?近期热度高涨的?Bittensor?便是这个方向的领头者,通过挖矿激励的方式让不同?AI?模型和算法相互协作与学习,从而创作出更高效全能的?AI?模型。而同样以这个方向为主的还有?Commune AI(代码协作)等,不过算法和模型对于现在的?AI?公司来说,都是自家的看门法宝,并不会随意外借。
所以?AI?协作生态这种叙事很新奇有趣,协作生态系统利用了区块链的优势去整合?AI?算法孤岛的劣势,但是否能创造出对应的价值目前尚未可知。毕竟头部?AI?公司的闭源算法和模型,更新迭代与整合的能力非常强,比如?OpenAI?发展不到两年,已从早期文本生成模型迭代到多领域生成的模型,Bittensor?等项目在模型和算法所针对的领域也许要另辟蹊径。
从简单的角度来说,将私有数据用来喂?AI?以及对数据进行标记都是与区块链非常契合的方向,只需要注意如何防止垃圾数据以及作恶,并且数据存储上也能使?FIL、AR?等?Depin?项目受益。而从复杂的角度来说,将区块链数据用于机器学习(ML),从而解决区块链数据的可访问性也是一种有趣的方向(Giza?的摸索方向之一)。
在理论上,区块链数据可随时访问,反映了整个区块链的状态。但对于区块链生态系统之外的人来说,获取这些庞大数据量并不容易。完整存储一条区块链需要丰富的专业知识和大量的专门硬件资源。为了克服访问区块链数据的挑战,行业内出现了几种解决方案。例如,RPC?提供商通过?API?访问节点,而索引服务则通过?SQL?和?GraphQL?使数据提取变得可能,这两种方式在解决问题上发挥了关键作用。然而,这些方法存在局限性。RPC?服务并不适合需要大量数据查询的高密度使用场景,经常无法满足需求。同时,尽管索引服务提供了更有结构的数据检索方式,但Web3协议的复杂性使得构建高效查询变得极其困难,有时需要编写数百甚至数千行复杂的代码。这种复杂性对于一般的数据从业者和对Web3细节了解不深的人来说是一个巨大的障碍。这些限制的累积效应凸显了需要一种更易于获取和利用区块链数据的方法,可以促进该领域更广泛的应用和创新。
那么通过?ZKML(零知识证明机器学习,降低机器学习对于链的负担)结合高质量的区块链数据,也许能创造出解决区块链可访问性的数据集,而?AI?能大幅降低区块链数据可访问性的门槛,那么随着时间的推移,开发者、研究人员和?ML?领域的爱好者将能够访问到更多高质量、相关的数据集,用于构建有效和创新的解决方案。
自?23?年,ChatGPT?3?爆火以来,AI?赋能?Dapp?已经是一个非常常见的方向。泛用性极广的生成式?AI,可以通过?API?接入,从而简化且智能化分析数据平台、交易机器人、区块链百科等应用。另一方面,也可以扮演聊天机器人(比如?Myshell)或者?AI?伴侣(Sleepless AI),甚至通过生成式?AI?创造链游中的?NPC。但由于技术壁垒很低,大部分都是接入一个?API?之后进行微调,与项目本身的结合也不够完美,所以很少被人提起。
但在?Sora?到来之后,我个人认为?AI?赋能?GameFi(包括元宇宙)与创作平台的方向将是接下来关注的重点。因为Web3领域自下而上的特性,肯定很难诞生出一些与传统游戏或是创意公司抗衡的产品,而?Sora?的出现很可能会打破这一窘境(也许只用两到三年)。以?Sora?的?Demo?来看,其已具备和微短剧公司竞争的潜力,Web3活跃的社区文化也能诞生出大量有趣的?Idea,而当限制条件只有想象力的时候,自下而上的行业与自上而下的传统行业之间的壁垒将被打破。
随着生成式?AI?工具的不断进步,我们未来还将经历更多划时代的“iPhone?时刻”。尽管许多人对?AI?与Web3的结合嗤之以鼻,但实际上我认为目前的方向大多没有问题,需要解决的痛点其实只有三点,必要性、效率、契合度。两者的融合虽处于探索阶段,却并不妨碍这条赛道成为下个牛市的主流。
对新事物永远保持足够的好奇心和接纳度是我们需要必备的心态,历史上,汽车取代马车的转变瞬息之间便已成定局,亦如同铭文和过去的?NFT?一样,持有太多偏见只会和机遇失之交臂。