我觉得有趣的是,人工智能的人们不断*重新发现*加密货币人们遇到的问题。 比特币中的工作量证明之所以有效,是因为验证一个哈希比计算一个哈希要容易。 GPU/任务/工作加密网络从来没有成功过,因为不可能“证明”你完成了X数量的工作,因为这很容易被操控。 主观性无法通过计算来解决,因为这需要“品味”。
关于验证的不对称性和“验证者法则”的新博客文章: 验证的不对称性——某些任务的验证要比解决更容易的想法——随着我们有了最终普遍有效的强化学习,正变得越来越重要。 验证不对称性的好例子包括数独谜题、为像 Instagram 这样的网站编写代码,以及 BrowseComp 问题(需要大约 100 个网站来找到答案,但一旦有了答案就很容易验证)。 其他任务的验证几乎是对称的,比如对两个 900 位数字求和或一些数据处理脚本。还有一些任务提出可行解决方案要比验证它们容易得多(例如,核实一篇长文章的事实或提出一种新的饮食方式,如“只吃野牛”)。 理解验证不对称性的重要一点是,通过提前做一些工作可以改善这种不对称性。例如,如果你有数学问题的答案钥匙,或者如果你有 Leetcode 问题的测试用例。这大大增加了具有理想验证不对称性的问题集。 “验证者法则”指出,训练 AI 解决任务的难易程度与任务的可验证性成正比。所有可以解决且易于验证的任务都将被 AI 解决。训练 AI 解决任务的能力与任务是否具有以下特性成正比: 1. 客观真理:每个人都同意什么是好的解决方案 2. 快速验证:任何给定的解决方案可以在几秒钟内验证 3. 可扩展验证:可以同时验证多个解决方案 4. 低噪声:验证与解决方案质量的相关性尽可能紧密 5. 连续奖励:很容易对单个问题的多个解决方案的优劣进行排名 验证者法则的一个明显实例是,AI 中提出的大多数基准测试都易于验证,并且迄今为止已被解决。注意,过去十年几乎所有流行的基准测试都符合标准 #1-4;不符合标准 #1-4 的基准测试将难以流行。 为什么可验证性如此重要?当上述标准得到满足时,AI 中的学习量达到最大;你可以进行很多梯度步骤,每一步都有大量信号。迭代速度至关重要——这就是数字世界的进步比物理世界的进步快得多的原因。 谷歌的 AlphaEvolve 是利用验证不对称性的最佳例子之一。它专注于符合上述所有标准的设置,并在数学和其他领域取得了一系列进展。与我们在过去二十年中在 AI 中所做的不同,它是一种新范式,即所有问题都在训练集等于测试集的环境中进行优化。 验证不对称性无处不在,考虑一个我们可以测量的世界的锯齿状智能是令人兴奋的。
查看原文
本页面内容由第三方提供。除非另有说明,欧易不是所引用文章的作者,也不对此类材料主张任何版权。该内容仅供参考,并不代表欧易观点,不作为任何形式的认可,也不应被视为投资建议或购买或出售数字资产的招揽。在使用生成式人工智能提供摘要或其他信息的情况下,此类人工智能生成的内容可能不准确或不一致。请阅读链接文章,了解更多详情和信息。欧易不对第三方网站上的内容负责。包含稳定币、NFTs 等在内的数字资产涉及较高程度的风险,其价值可能会产生较大波动。请根据自身财务状况,仔细考虑交易或持有数字资产是否适合您。