首頁 > 金融理財 > 正文

Sora橫空出世,2024或成AI+Web3變革元年?

來源:淺藍攻略網(wǎng) 時間:2024-12-23 10:42 作者:小藍整合

原文標題：Sora 橫空出世，2024 或成 AI+Web3 變革元年?

原文作者： Zeke，YBB Capital

前言

2 月 16 日，OpenAI 公布了最新的文本控制視頻生成擴散模型「Sora」，通過多段涵蓋的廣泛視覺數(shù)據(jù)類型的高質量生成視頻，展現(xiàn)了生成式 AI 的又一個里程碑時刻。不同于 Pika 這類 AI 視頻生成工具還處于用多張圖像生成幾秒視頻的狀態(tài)，Sora 通過在視頻和圖像的壓縮潛在空間中訓練，將其分解為時空位置補丁，實現(xiàn)了可擴展的視頻生成。除此之外該模型還體現(xiàn)出了模擬物理世界和數(shù)字世界的能力，最終呈現(xiàn)的 60 秒 Demo，說是「物理世界的通用模擬器」也并不為過。

而在構建方式上，Sora 延續(xù)了此前 GPT 模型「源數(shù)據(jù)-Transformer-Diffusion-涌現(xiàn)」的技術路徑，這意味著其發(fā)展成熟同樣需要算力作為引擎，且由于視頻訓練所需數(shù)據(jù)量遠大于文本訓練的數(shù)據(jù)量，對于算力的需求還將進一步拉大。但我們在早期的文章潛力賽道前瞻：去中心化算力市場中已經(jīng)探討過算力在 AI 時代的重要性，并且隨著近期 AI 熱度的不斷攀升，市面上已經(jīng)有大量算力項目開始涌現(xiàn)，而被動受益的其它 Depin 項目（存儲、算力等）也已經(jīng)迎來一波暴漲。那么除了 Depin 之外，Web3 與 AI 的交織還能碰撞出怎樣的火花?這條賽道里還蘊含著怎樣的機會?本文的主要目的是對過往文章的一次更新與補全，并思考 AI 時代下的 Web3 存在哪些可能。

AIGC原理概述

現(xiàn)階段正在經(jīng)歷爆炸式發(fā)展的生成式 AI（Artificial Intelligence Generated Content，簡稱 AIGC），便是對于連接主義的一種演化和應用，AIGC 能夠模仿人類創(chuàng)造力生成新穎的內(nèi)容。這些模型使用大型數(shù)據(jù)集和深度學習算法進行訓練，從而學習數(shù)據(jù)中存在的底層結構、關系和模式。根據(jù)用戶的輸入提示，生成新穎獨特的輸出結果，包括圖像、視頻、代碼、音樂、設計、翻譯、問題回答和文本。而目前的 AIGC 基本由三個要素構成：深度學習（Deep Learning，簡稱 DL）、大數(shù)據(jù)、大規(guī)模算力。

深度學習

深度學習是機器學習（ML）的一個子領域，深度學習算法是仿照人腦建模的神經(jīng)網(wǎng)絡。例如，人腦包含數(shù)百萬個相互關聯(lián)的神經(jīng)元，它們協(xié)同工作以學習和處理信息。同樣，深度學習神經(jīng)網(wǎng)絡（或人工神經(jīng)網(wǎng)絡）是由在計算機內(nèi)部協(xié)同工作的多層人工神經(jīng)元組成的。人工神經(jīng)元是稱為節(jié)點的軟件模塊，它使用數(shù)學計算來處理數(shù)據(jù)。人工神經(jīng)網(wǎng)絡是使用這些節(jié)點來解決復雜問題的深度學習算法。

從層次上劃分神經(jīng)網(wǎng)絡可分為輸入層、隱藏層、輸出層，而不同層之間連接的便是參數(shù)。

● 輸入層（Input Layer）：輸入層是神經(jīng)網(wǎng)絡的第一層，負責接收外部輸入的數(shù)據(jù)。輸入層的每個神經(jīng)元對應于輸入數(shù)據(jù)的一個特征。例如，在處理圖像數(shù)據(jù)時，每個神經(jīng)元可能對應于圖像的一個像素值；

● 隱藏層（Hidden Layer）：輸入層處理數(shù)據(jù)并將其傳遞到神經(jīng)網(wǎng)絡中更遠的層。這些隱藏層在不同層級處理信息，在接收新信息時調整其行為。深度學習網(wǎng)絡有數(shù)百個隱藏層，可用于從多個不同角度分析問題。例如，你得到了一張必須分類的未知動物的圖像，則可以將其與你已經(jīng)認識的動物進行比較。比如通過耳朵形狀、腿的數(shù)量、瞳孔的大小來判斷這是什么動物。深度神經(jīng)網(wǎng)絡中的隱藏層以相同的方式工作。如果深度學習算法試圖對動物圖像進行分類，則其每個隱藏層都會處理動物的不同特征并嘗試對其進行準確的分類；

● 輸出層（Output Layer）：輸出層是神經(jīng)網(wǎng)絡的最后一層，負責生成網(wǎng)絡的輸出。輸出層的每個神經(jīng)元代表一個可能的輸出類別或值。例如，在分類問題中，每個輸出層神經(jīng)元可能對應于一個類別，而在回歸問題中，輸出層可能只有一個神經(jīng)元，其值表示預測結果；

● 參數(shù)：在神經(jīng)網(wǎng)絡中，不同層之間的連接由權重（Weights）和偏置（Biases）參數(shù)表示，這些參數(shù)在訓練過程中被優(yōu)化以使網(wǎng)絡能夠準確地識別數(shù)據(jù)中的模式和進行預測。參數(shù)的增加可以提高神經(jīng)網(wǎng)絡的模型容量，即模型能夠學習和表示數(shù)據(jù)中復雜模式的能力。但相對應的是參數(shù)的增加會提升對算力的需求。

大規(guī)模算力

神經(jīng)網(wǎng)絡的多層復雜結構，大量參數(shù)，大數(shù)據(jù)處理需求，迭代訓練方式（在訓練階段，模型需要反復迭代，訓練過程中需要對每一層計算進行前向傳播和反向傳播，包括激活函數(shù)的計算、損失函數(shù)的計算、梯度的計算和權重的更新），高精度計算需求，并行計算能力，優(yōu)化和正則化技術以及模型評估和驗證過程共同導致了其對高算力的需求。

Sora

作為 OpenAI 最新發(fā)布的視頻生成 AI 模型，Sora 代表了人工智能處理和理解多樣化視覺數(shù)據(jù)能力的巨大進步。通過采用視頻壓縮網(wǎng)絡和空間時間補丁技術，Sora 能夠將來自世界各地、不同設備拍攝的海量視覺數(shù)據(jù)轉換為統(tǒng)一的表現(xiàn)形式，從而實現(xiàn)了對復雜視覺內(nèi)容的高效處理和理解。依托于文本條件化的 Diffusion 模型，Sora 能夠根據(jù)文本提示生成與之高度匹配的視頻或圖片，展現(xiàn)出極高的創(chuàng)造性和適應性。

不過，盡管 Sora 在視頻生成和模擬真實世界互動方面取得了突破，但仍面臨一些局限性，包括物理世界模擬的準確性、長視頻生成的一致性、復雜文本指令的理解以及訓練與生成效率。并且 Sora 本質上還是通過 OpenAI 壟斷級的算力和先發(fā)優(yōu)勢，延續(xù)「大數(shù)據(jù)-Transformer-Diffusion-涌現(xiàn)」這條老技術路徑達成了一種暴力美學，其它 AI 公司依然存在著通過技術彎道超車的可能。

雖然 Sora 與區(qū)塊鏈的關系并不大，但個人認為之后的一兩年里。因為 Sora 的影響，會迫使其它高質量 AI 生成工具出現(xiàn)并快速發(fā)展，并且將輻射到 Web3 內(nèi)的 GameFi、社交、創(chuàng)作平臺、Depin 等多條賽道，所以對于 Sora 有個大致了解是必要的，未來的 AI 將如何有效的與 Web3 結合，也許是我們需要思考的一個重點。

AI+Web3的四大路徑

如上文所訴，我們可以知道，生成式 AI 所需的底層基座其實只有三點：算法、數(shù)據(jù)、算力，另一方面從泛用性和生成效果來看 AI 是顛覆生產(chǎn)方式的工具。而區(qū)塊鏈最大的作用有兩點：重構生產(chǎn)關系以及去中心化。所以兩者碰撞所能產(chǎn)生的路徑我個人認為有如下四種：

去中心化算力

由于過去已經(jīng)寫過相關文章，所以本段的主要目的是更新一下算力賽道的近況。當談到 AI 時，算力永遠是難以繞開的一環(huán)。AI 對于算力的需求之大，在 Sora 誕生之后已經(jīng)是難以想象了。而近期，在瑞士達沃斯 2024 年度世界經(jīng)濟論壇期間，OpenAI 首席執(zhí)行官山姆·奧特曼更是直言算力和能源是現(xiàn)階段最大的枷鎖，兩者在未來的重要性甚至會等同于貨幣。而在隨后的 2 月 10 日，山姆·奧特曼在推上發(fā)表了一個極為驚人的計劃，融資 7 萬億美元（相當于中國 23 年全國 GDP 的 40%）改寫目前全球的半導體產(chǎn)業(yè)格局，創(chuàng)立一家芯片帝國。在寫算力相關的文章時，我的想象力還局限在國家封鎖，巨頭壟斷，如今一家公司就想要控制全球半導體產(chǎn)業(yè)真的還是挺瘋狂的。

所以去中心化算力的重要性自然不言而喻，區(qū)塊鏈的特性確實能解決目前算力極度壟斷的問題，以及購置專用 GPU 價格昂貴的問題。從 AI 所需的角度來看，算力的使用可以分為推理和訓練兩種方向，主打訓練的項目，目前還是寥寥無幾，從去中心化網(wǎng)絡需要結合神經(jīng)網(wǎng)絡設計，再到對于硬件的超高需求，注定是門檻極高且落地極難的一種方向。而推理相對來說簡單很多，一方面是在去中心化網(wǎng)絡設計上并不復雜，二是硬件和帶寬需求較低，算是目前比較主流的方向。

中心化算力市場的想象空間是巨大的，常常與「萬億級」這個關鍵詞掛鉤，同時也是 AI 時代下最容易被頻繁炒作的話題。不過從近期大量涌現(xiàn)的項目來看，絕大部分還是屬于趕鴨子上架，蹭熱度。總是高舉去中心化的正確旗幟，卻閉口不談去中心化網(wǎng)絡的低效問題。并且在設計上存在高度同質化，大量的項目非常相似（一鍵 L2 加挖礦設計），最終可能會導致一地雞毛，這樣的情況想要從傳統(tǒng) AI 賽道分一杯羹著實困難。

算法、模型協(xié)作系統(tǒng)

機器學習算法，是指這些算法能夠從數(shù)據(jù)中學習規(guī)律和模式，并據(jù)此做出預測或決策。算法是技術密集型的，因為它們的設計和優(yōu)化需要深厚的專業(yè)知識和技術創(chuàng)新。算法是訓練 AI 模型的核心，它定義了數(shù)據(jù)如何被轉化為有用的見解或決策。較為常見的生成式 AI 算法比如生成對抗網(wǎng)絡（GAN）、變分自編碼器（VAE）、轉換器（Transformer），每個算法都是為了一個特定領域（比如繪畫、語言識別、翻譯、視頻生成）或者說目的而生，再通過算法訓練出專用的 AI 模型。

那么如此之多的算法和模型，都是各有千秋，我們是否能將其整合為一種能文能武的模型?近期熱度高漲的 Bittensor 便是這個方向的領頭者，通過挖礦激勵的方式讓不同 AI 模型和算法相互協(xié)作與學習，從而創(chuàng)作出更高效全能的 AI 模型。而同樣以這個方向為主的還有 Commune AI（代碼協(xié)作）等，不過算法和模型對于現(xiàn)在的 AI 公司來說，都是自家的看門法寶，并不會隨意外借。

所以 AI 協(xié)作生態(tài)這種敘事很新奇有趣，協(xié)作生態(tài)系統(tǒng)利用了區(qū)塊鏈的優(yōu)勢去整合 AI 算法孤島的劣勢，但是否能創(chuàng)造出對應的價值目前尚未可知。畢竟頭部 AI 公司的閉源算法和模型，更新迭代與整合的能力非常強，比如 OpenAI 發(fā)展不到兩年，已從早期文本生成模型迭代到多領域生成的模型，Bittensor 等項目在模型和算法所針對的領域也許要另辟蹊徑。

去中心化大數(shù)據(jù)

從簡單的角度來說，將私有數(shù)據(jù)用來喂 AI 以及對數(shù)據(jù)進行標記都是與區(qū)塊鏈非常契合的方向，只需要注意如何防止垃圾數(shù)據(jù)以及作惡，并且數(shù)據(jù)存儲上也能使 FIL、AR 等 Depin 項目受益。而從復雜的角度來說，將區(qū)塊鏈數(shù)據(jù)用于機器學習（ML），從而解決區(qū)塊鏈數(shù)據(jù)的可訪問性也是一種有趣的方向（Giza 的摸索方向之一）。

在理論上，區(qū)塊鏈數(shù)據(jù)可隨時訪問，反映了整個區(qū)塊鏈的狀態(tài)。但對于區(qū)塊鏈生態(tài)系統(tǒng)之外的人來說，獲取這些龐大數(shù)據(jù)量并不容易。完整存儲一條區(qū)塊鏈需要豐富的專業(yè)知識和大量的專門硬件資源。為了克服訪問區(qū)塊鏈數(shù)據(jù)的挑戰(zhàn)，行業(yè)內(nèi)出現(xiàn)了幾種解決方案。例如，RPC 提供商通過 API 訪問節(jié)點，而索引服務則通過 SQL 和 GraphQL 使數(shù)據(jù)提取變得可能，這兩種方式在解決問題上發(fā)揮了關鍵作用。然而，這些方法存在局限性。RPC 服務并不適合需要大量數(shù)據(jù)查詢的高密度使用場景，經(jīng)常無法滿足需求。同時，盡管索引服務提供了更有結構的數(shù)據(jù)檢索方式，但 Web3 協(xié)議的復雜性使得構建高效查詢變得極其困難，有時需要編寫數(shù)百甚至數(shù)千行復雜的代碼。這種復雜性對于一般的數(shù)據(jù)從業(yè)者和對 Web3 細節(jié)了解不深的人來說是一個巨大的障礙。這些限制的累積效應凸顯了需要一種更易于獲取和利用區(qū)塊鏈數(shù)據(jù)的方法，可以促進該領域更廣泛的應用和創(chuàng)新。

那么通過 ZKML（零知識證明機器學習，降低機器學習對于鏈的負擔）結合高質量的區(qū)塊鏈數(shù)據(jù)，也許能創(chuàng)造出解決區(qū)塊鏈可訪問性的數(shù)據(jù)集，而 AI 能大幅降低區(qū)塊鏈數(shù)據(jù)可訪問性的門檻，那么隨著時間的推移，開發(fā)者、研究人員和 ML 領域的愛好者將能夠訪問到更多高質量、相關的數(shù)據(jù)集，用于構建有效和創(chuàng)新的解決方案。

AI 賦能 Dapp

自 23 年，ChatGPT3 爆火以來，AI 賦能 Dapp 已經(jīng)是一個非常常見的方向。泛用性極廣的生成式 AI，可以通過 API 接入，從而簡化且智能化分析數(shù)據(jù)平臺、交易機器人、區(qū)塊鏈百科等應用。另一方面，也可以扮演聊天機器人（比如 Myshell）或者 AI 伴侶（Sleepless AI），甚至通過生成式 AI 創(chuàng)造鏈游中的 NPC。但由于技術壁壘很低，大部分都是接入一個 API 之后進行微調，與項目本身的結合也不夠完美，所以很少被人提起。

但在 Sora 到來之后，我個人認為 AI 賦能 GameFi（包括元宇宙）與創(chuàng)作平臺的方向將是接下來關注的重點。因為 Web3 領域自下而上的特性，肯定很難誕生出一些與傳統(tǒng)游戲或是創(chuàng)意公司抗衡的產(chǎn)品，而 Sora 的出現(xiàn)很可能會打破這一窘境（也許只用兩到三年）。以 Sora 的 Demo 來看，其已具備和微短劇公司競爭的潛力，Web3 活躍的社區(qū)文化也能誕生出大量有趣的 Idea，而當限制條件只有想象力的時候，自下而上的行業(yè)與自上而下的傳統(tǒng)行業(yè)之間的壁壘將被打破。

結語

隨著生成式 AI 工具的不斷進步，我們未來還將經(jīng)歷更多劃時代的「iPhone 時刻」。盡管許多人對 AI 與 Web3 的結合嗤之以鼻，但實際上我認為目前的方向大多沒有問題，需要解決的痛點其實只有三點，必要性、效率、契合度。兩者的融合雖處于探索階段，卻并不妨礙這條賽道成為下個牛市的主流。

對新事物永遠保持足夠的好奇心和接納度是我們需要必備的心態(tài)，歷史上，汽車取代馬車的轉變瞬息之間便已成定局，亦如同銘文和過去的 NFT 一樣，持有太多偏見只會和機遇失之交臂。

AI發(fā)展史的三大方向

人工智能 (Artificial Intelligence) 是一門旨在模擬、擴展和增強人類智能的新興科學技術。人工智能自二十世紀五六十年代誕生以來，在經(jīng)歷了半個多世紀的發(fā)展后，現(xiàn)已成為推動社會生活和各行各業(yè)變革的重要技術。在這一過程中，符號主義、連接主義和行為主義三大研究方向的相互交織發(fā)展，成為了如今 AI 飛速發(fā)展的基石。

符號主義 (Symbolism)

亦稱邏輯主義或規(guī)則主義，認為通過處理符號來模擬人類智能是可行的。這種方法通過符號來表示和操作問題領域內(nèi)的對象、概念及其相互關系，并利用邏輯推理來解決問題，尤其在專家系統(tǒng)和知識表示方面已取得顯著成就。符號主義的核心觀點是智能行為可以通過對符號的操作和邏輯推理來實現(xiàn)，其中符號代表對現(xiàn)實世界的高度抽象；

連接主義 (Connectionism)

或稱為神經(jīng)網(wǎng)絡方法，旨在通過模仿人腦的結構和功能來實現(xiàn)智能。該方法通過構建由眾多簡單處理單元（類似神經(jīng)元）組成的網(wǎng)絡，并通過調整這些單元間的連接強度（類似突觸）來實現(xiàn)學習。連接主義特別強調從數(shù)據(jù)中學習和泛化的能力，特別適用于模式識別、分類及連續(xù)輸入輸出映射問題。深度學習，作為連接主義的發(fā)展，已在圖像識別、語音識別和自然語言處理等領域取得突破；

行為主義 (Behaviorism)

行為主義則與仿生機器人學和自主智能系統(tǒng)的研究緊密相關，強調智能體能夠通過與環(huán)境的交互學習。與前兩者不同，行為主義不專注于模擬內(nèi)部表征或思維過程，而是通過感知和行動的循環(huán)實現(xiàn)適應性行為。行為主義認為，智能通過與環(huán)境的動態(tài)交互、學習而展現(xiàn)，這種方法應用于需要在復雜和不可預測環(huán)境中行動的移動機器人和自適應控制系統(tǒng)中時，顯得尤為有效。

盡管這三個研究方向存在本質區(qū)別，但在實際的 AI 研究和應用中，它們也可以相互作用和融合，共同推動 AI 領域的發(fā)展。

大數(shù)據(jù)

為了有效訓練，神經(jīng)網(wǎng)絡通常需要大量、多樣及質量高和多源的數(shù)據(jù)。它是機器學習模型訓練和驗證的基礎。通過分析大數(shù)據(jù)，機器學習模型可以學習數(shù)據(jù)中的模式和關系，從而進行預測或分類。

溫馨提醒：投資有風險，入市須謹慎，本文部分內(nèi)容來自幣圈網(wǎng)，本內(nèi)容不可作為投資理財建議。
上文即是Sora橫空出世,2024或成AI+Web3變革元年?的全部內(nèi)容了，文章的版權歸原作者所有，本站僅作網(wǎng)絡經(jīng)驗公益分享，如有侵犯您的權利，請聯(lián)系刪除，想了解更多behaviorism相關信息，請關注收藏淺藍網(wǎng)。

上一篇：新手怎么下載注冊歐意APP?

下一篇：Uniswap

相關閱讀推薦