The team continues to refine our core infrastructure and boost performance across Gemma3 / zkML Interface key modules. Here’s a quick look at what’s been built and improved this week.
2/
Gemma3 Performance: Quantized Gemma3 model currently includes nearly 10 000 nodes; kernelized execution shows limited performance due to excessive node granularity.
3/
Gemma3 Refactor: Analyzed model structure and found most nodes are shape-related and redundant—potentially removable. In the ideal case, over 90 % of nodes can be eliminated.
4/
zkML Iface Latency Optimization: Refactored zkmlface codebase, cutting inference latency down to tens of milliseconds. The interface is not yet connected to the TEE environment.
5/
Next Steps:
Deploy the optimized zkmlface on a GPU TEE-enabled machine once available.
Compile the pruned Gemma3 graph into high-efficiency GPU kernels for integration testing.
Stay tuned for more updates
3,07 rb
19
Konten pada halaman ini disediakan oleh pihak ketiga. Kecuali dinyatakan lain, OKX bukanlah penulis artikel yang dikutip dan tidak mengklaim hak cipta atas materi tersebut. Konten ini disediakan hanya untuk tujuan informasi dan tidak mewakili pandangan OKX. Konten ini tidak dimaksudkan sebagai dukungan dalam bentuk apa pun dan tidak dapat dianggap sebagai nasihat investasi atau ajakan untuk membeli atau menjual aset digital. Sejauh AI generatif digunakan untuk menyediakan ringkasan atau informasi lainnya, konten yang dihasilkan AI mungkin tidak akurat atau tidak konsisten. Silakan baca artikel yang terkait untuk informasi lebih lanjut. OKX tidak bertanggung jawab atas konten yang dihosting di situs pihak ketiga. Kepemilikan aset digital, termasuk stablecoin dan NFT, melibatkan risiko tinggi dan dapat berfluktuasi secara signifikan. Anda perlu mempertimbangkan dengan hati-hati apakah trading atau menyimpan aset digital sesuai untuk Anda dengan mempertimbangkan kondisi keuangan Anda.

