The team continues to refine our core infrastructure and boost performance across Gemma3 / zkML Interface key modules. Here’s a quick look at what’s been built and improved this week.
2/
Gemma3 Performance: Quantized Gemma3 model currently includes nearly 10 000 nodes; kernelized execution shows limited performance due to excessive node granularity.
3/
Gemma3 Refactor: Analyzed model structure and found most nodes are shape-related and redundant—potentially removable. In the ideal case, over 90 % of nodes can be eliminated.
4/
zkML Iface Latency Optimization: Refactored zkmlface codebase, cutting inference latency down to tens of milliseconds. The interface is not yet connected to the TEE environment.
5/
Next Steps:
Deploy the optimized zkmlface on a GPU TEE-enabled machine once available.
Compile the pruned Gemma3 graph into high-efficiency GPU kernels for integration testing.
Stay tuned for more updates
3.08 ألف
19
المحتوى الوارد في هذه الصفحة مُقدَّم من أطراف ثالثة. وما لم يُذكَر خلاف ذلك، فإن OKX ليست مُؤلِّفة المقالة (المقالات) المذكورة ولا تُطالِب بأي حقوق نشر وتأليف للمواد. المحتوى مٌقدَّم لأغراض إعلامية ولا يُمثِّل آراء OKX، وليس الغرض منه أن يكون تأييدًا من أي نوع، ولا يجب اعتباره مشورة استثمارية أو التماسًا لشراء الأصول الرقمية أو بيعها. إلى الحد الذي يُستخدَم فيه الذكاء الاصطناعي التوليدي لتقديم مُلخصَّات أو معلومات أخرى، قد يكون هذا المحتوى الناتج عن الذكاء الاصطناعي غير دقيق أو غير مُتسِق. من فضلك اقرأ المقالة ذات الصِلة بهذا الشأن لمزيدٍ من التفاصيل والمعلومات. OKX ليست مسؤولة عن المحتوى الوارد في مواقع الأطراف الثالثة. والاحتفاظ بالأصول الرقمية، بما في ذلك العملات المستقرة ورموز NFT، فيه درجة عالية من المخاطر وهو عُرضة للتقلُّب الشديد. وعليك التفكير جيِّدًا فيما إذا كان تداوُل الأصول الرقمية أو الاحتفاظ بها مناسبًا لك في ظل ظروفك المالية.

