1/ đŸ§”plongĂ©e plus profonde dans notre nouveau travail sur zkGPT : Prouver l'infĂ©rence LLM rapidement avec des preuves Ă  divulgation nulle de connaissance. Pourquoi ? Les fournisseurs de services pourraient dĂ©ployer un modĂšle plus petit/moins cher que promis. ZK leur permet de prouver la justesse sans rĂ©vĂ©ler les paramĂštres du modĂšle. 📄
2/ Le problĂšme : - Les LLMs = puissants mais coĂ»teux. - Les fournisseurs pourraient tricher en utilisant des modĂšles plus petits. - Les utilisateurs ne peuvent pas vĂ©rifier quel modĂšle a Ă©tĂ© utilisĂ©. Les preuves ZK rĂ©solvent ce problĂšme, mais les systĂšmes zkML actuels sont Ă  la traĂźne avec de vrais LLMs : - Pas de support pour les architectures de transformateurs. - Temps de preuve Ă©normes (minutes→heures).
3/ Travaux antĂ©rieurs : - ZKML (Eurosys’24) : Cadre gĂ©nĂ©ral de vĂ©rification ML. Bon pour les petits modĂšles, mais trop lent pour les LLMs. - Hao et al. (USENIX Security’24) : PremiĂšre tentative de zkLLM, encore assez lente (des milliers de secondes). - Les deux souffrent d'un Ă©norme surcoĂ»t des couches non linĂ©aires + mauvaise parallĂ©lisation.
4/ Nos contributions : 1. Preuves efficaces pour les couches linĂ©aires et non linĂ©aires adaptĂ©es aux LLMs (par exemple, GPT-2). 2. Fusion de contraintes → rĂ©duction des surcoĂ»ts dans les couches non linĂ©aires (comme GeLU). 3. Compression de circuit → amĂ©liore le parallĂ©lisme dans la gĂ©nĂ©ration de preuves. 4. Mise en Ɠuvre complĂšte optimisĂ©e pour les blocs de transformateur.
5/ RĂ©sultats : - Prouve l'infĂ©rence GPT-2 en <25 secondes. - 279× plus rapide que Hao et al. (USENIX'24). - 185× plus rapide que ZKML (Eurosys'24). - Des ordres de grandeur de moins de surcharge que les implĂ©mentations naĂŻves de zk-transformer.
6/ Pourquoi c'est important : - Permet le dĂ©ploiement pratique de zkLLM — vous pouvez maintenant vĂ©rifier la sortie d'un LLM en quelques secondes. - Garde les poids du modĂšle secrets. - Ouvre la voie Ă  des services d'IA prĂ©servant la vie privĂ©e avec une auditabilitĂ© cryptographique.
7/ Aperçu clĂ© : Ne vous contentez pas de compiler naĂŻvement un LLM dans un circuit. Exploitez la structure : - OpĂ©rations linĂ©aires (MatMul, LayerNorm) → contraintes personnalisĂ©es efficaces. - OpĂ©rations non linĂ©aires (GELU) → contraintes fusionnĂ©es pour rĂ©duire la complexitĂ©. - Disposition favorable au parallĂ©lisme pour maximiser le matĂ©riel moderne de preuve.
Afficher l’original
25,01 k
554
Le contenu de cette page est fourni par des tiers. Sauf indication contraire, OKX n’est pas l’auteur du ou des articles citĂ©s et ne revendique aucun droit d’auteur sur le contenu. Le contenu est fourni Ă  titre d’information uniquement et ne reprĂ©sente pas les opinions d’OKX. Il ne s’agit pas d’une approbation de quelque nature que ce soit et ne doit pas ĂȘtre considĂ©rĂ© comme un conseil en investissement ou une sollicitation d’achat ou de vente d’actifs numĂ©riques. Dans la mesure oĂč l’IA gĂ©nĂ©rative est utilisĂ©e pour fournir des rĂ©sumĂ©s ou d’autres informations, ce contenu gĂ©nĂ©rĂ© par IA peut ĂȘtre inexact ou incohĂ©rent. Veuillez lire l’article associĂ© pour obtenir davantage de dĂ©tails et d’informations. OKX n’est pas responsable du contenu hĂ©bergĂ© sur des sites tiers. La dĂ©tention d’actifs numĂ©riques, y compris les stablecoins et les NFT, implique un niveau de risque Ă©levĂ© et leur valeur peut considĂ©rablement fluctuer. Examinez soigneusement votre situation financiĂšre pour dĂ©terminer si le trading ou la dĂ©tention d’actifs numĂ©riques vous convient.