1/ 🧵التعمق في عملنا الجديد على zkGPT: إثبات الاستدلال على LLM بسرعة باستخدام براهين المعرفة الصفرية. لماذا؟ قد ينشر مقدمو الخدمة نموذجا أصغر / أرخص مما وعدوا. يتيح لهم ZK إثبات صحتهم دون الكشف عن معلمات النموذج. 📄
2/ المشكلة: - LLMs = قوية ولكنها مكلفة. - يمكن لمقدمي الخدمة الغش عن طريق تشغيل نماذج أصغر. - لا يمكن للمستخدمين التحقق من الطراز الذي تم استخدامه. تحل ZK Proofs هذه المشكلة ، لكن أنظمة zkML الحالية تختنق على LLMs الحقيقية: - لا يوجد دعم لمعماريات المحولات. - أوقات إثبات ضخمة (دقائق → ساعات).
3/ الأعمال السابقة: - ZKML (Eurosys'24): إطار عمل عام للتحقق من التعلم الآلي. جيد للموديلات الصغيرة ، ولكنه بطيء جدا بالنسبة لLLMs. - Hao et al. (USENIX Security'24): محاولة zkLLM المبكرة ، لا تزال بطيئة جدا (آلاف الثواني). - كلاهما يعاني من طبقة علوية غير خطية ضخمة + ضعف التوازي.
4/ مساهماتنا: 1. براهين فعالة للطبقات الخطية وغير الخطية المصممة خصيصا لطلاب القانون (على سبيل المثال ، GPT-2). 2. → تقليل اندماج القيود من النفقات العامة في الطبقات غير الخطية (مثل GeLU). 3. ضغط الدائرة → يعزز التوازي في توليد الإثبات. 4. تنفيذ مكدس كامل محسن لكتل المحولات.
5/ النتائج: - يثبت استدلال GPT-2 في <25 ثانية. - 279× أسرع من Hao et al. (USENIX'24). - 185× أسرع من ZKML (Eurosys'24). - أوامر من حيث الحجم أقل من تطبيقات محول zk الساذجة.
6/ ما أهمية ذلك: - تمكين النشر العملي ل zkLLM - يمكنك الآن التحقق من إخراج LLM في ثوان. - يحافظ على سرية أوزان الطراز. - يفتح الأبواب أمام خدمات الذكاء الاصطناعي التي تحافظ على الخصوصية مع إمكانية تدقيق التشفير.
7/ البصيرة الرئيسية: لا تقم فقط بتجميع LLM بسذاجة في دائرة. هيكل الاستغلال: - العمليات الخطية (MatMul ، LayerNorm) → قيود فعالة مخصصة. - العمليات غير الخطية (GELU) → قيودا مدمجة لخفض التعقيد. - تخطيط موازي ومناسب لتحقيق أقصى استفادة من أجهزة prover الحديثة.
عرض الأصل
‏‎25.01 ألف‏
‏‎554‏
المحتوى الوارد في هذه الصفحة مُقدَّم من أطراف ثالثة. وما لم يُذكَر خلاف ذلك، فإن OKX ليست مُؤلِّفة المقالة (المقالات) المذكورة ولا تُطالِب بأي حقوق نشر وتأليف للمواد. المحتوى مٌقدَّم لأغراض إعلامية ولا يُمثِّل آراء OKX، وليس الغرض منه أن يكون تأييدًا من أي نوع، ولا يجب اعتباره مشورة استثمارية أو التماسًا لشراء الأصول الرقمية أو بيعها. إلى الحد الذي يُستخدَم فيه الذكاء الاصطناعي التوليدي لتقديم مُلخصَّات أو معلومات أخرى، قد يكون هذا المحتوى الناتج عن الذكاء الاصطناعي غير دقيق أو غير مُتسِق. من فضلك اقرأ المقالة ذات الصِلة بهذا الشأن لمزيدٍ من التفاصيل والمعلومات. OKX ليست مسؤولة عن المحتوى الوارد في مواقع الأطراف الثالثة. والاحتفاظ بالأصول الرقمية، بما في ذلك العملات المستقرة ورموز NFT، فيه درجة عالية من المخاطر وهو عُرضة للتقلُّب الشديد. وعليك التفكير جيِّدًا فيما إذا كان تداوُل الأصول الرقمية أو الاحتفاظ بها مناسبًا لك في ظل ظروفك المالية.