#AI 和 #RWA 是我們本週期最看好的賽道,團隊投入了大量的精力去研究,期間,我經常問團隊一個問題:“到底什麼才是真正稀缺的 #AI 資源?” 有人說是算力,有人說是算法。在不斷的請教和交流中,我越來越清晰地意識到,真正的稀缺是高質量的人類數據。 最近 #Vana 發佈的 #Playground AI數據產品讓我眼前一亮,讓真正高質量的人類數據迴歸個體,開啟了數據資本時代! 過去,數據基本分三類: 1️⃣公共抓取數據:推文、Reddit 爬取,這類數據多,但淺薄、缺乏語境。 2️⃣平臺私有數據:Spotify、Telegram、ChatGPT交互,這才是真正有價值的深度數據,但被大廠死死鎖住。 3️⃣標註數據集:Kaggle 或眾包標註,質量有限、成本高,還很難規模化。 而 #Playground 做的事是開創了第四類數據:社區集體擁有的數據。這就厲害了。因為它既不是免費爬取的“浮光掠影”,也不是平臺的“黑箱壟斷”,而是用戶主動貢獻、由 DAO 聚合的“深度人類數據”。 當我看完 #VanaPlayground 的視頻演示後,我第一次看到可以在一個界面裡預覽數據集架構、下載合成樣本、甚至和背後的 DataDAO 對接時,真的覺得有點像在逛“數據農貿市場”。對比過去我們買數據就像買罐頭食品,冷冰冰、不知道成分;現在是直接和農戶(社區)對話,看見產地和新鮮度。 #VanaPlayground 對 #AI 為何如此重要? 當前訓練 #AI 模型靠的不是算力多,而是數據的深度和多樣性。我來打個比方,例如我們日常使用的 #ChatGPT 的交互數據能體現人類的真實思考方式;再比如,人們使用 #Spotify 聽歌數據能刻畫用戶的偏好和情緒;社區小夥伴在使用 #Telegram 群聊的時候,群聊數據能映射社區互動的真實語境。 上述這些東西不是爬蟲能給的。它們是 #AI personalization、#Agent 交互、下一代應用所必須的“燃料”。而在 #Playground 裡,數據不是一堆雜亂的 JSON,而是帶架構、可瀏覽、可測的結構化樣本。這讓開發者能更快設計模型、做測試,而買家也能先“試吃”再決定是否購買。 整體來看,我個人認為 #VanaPlayground 的願景很大,不只是一個“數據展示廳”,而是去中心化數據經濟的前臺。...
介紹 Vana Playground。一個自助探索 Vana 數據集的方式。 從一開始,我們就專注於構建有價值的數據集,並通過我們的網絡進行商業化。 這是演變:允許任何人查看和使用 Vana 上的數據。
查看原文
4.77萬
51
本頁面內容由第三方提供。除非另有說明,OKX 不是所引用文章的作者,也不對此類材料主張任何版權。該內容僅供參考,並不代表 OKX 觀點,不作為任何形式的認可,也不應被視為投資建議或購買或出售數字資產的招攬。在使用生成式人工智能提供摘要或其他信息的情況下,此類人工智能生成的內容可能不準確或不一致。請閱讀鏈接文章,瞭解更多詳情和信息。OKX 不對第三方網站上的內容負責。包含穩定幣、NFTs 等在內的數字資產涉及較高程度的風險,其價值可能會產生較大波動。請根據自身財務狀況,仔細考慮交易或持有數字資產是否適合您。