GenAI Guardrails: Chi lo sta facendo meglio come servizio?
La Rete Scrypted ha tre modalità: { Strict | Permissive | Open }.
"Strict" impedisce contenuti maturi/espliciti per impostazione predefinita e in cambio ha accesso a modelli proprietari di alto livello.
"Permissive" (predefinito) ha una strategia a due punte che prima tenta il lavoro con più fornitori (in caso di falsi positivi) e poi torna a riscrivere la richiesta per sicurezza.
"Open" non giudica i contenuti e trova soddisfazione in una rete decentralizzata di fornitori, che potrebbe essere più aperta a contenuti maturi.
---
Detto ciò, per prevenire contenuti *illegali* abbiamo comunque forti guardrail, come classificatori costituzionali.
Il Catch-22? Fare affidamento su modelli esterni per giudicare i contenuti può, di per sé, essere una violazione dei Termini di Servizio del fornitore. (Come essere automaticamente reindirizzati ai modelli segreti di OpenAI).
Chi lo sta facendo meglio? Anthropic ha mostrato alcune capacità davvero forti nel loro recente hackathon sulla sicurezza. Chi altro?
Esperimento mentale: come decentralizzeresti il guardrail stesso mantenendo la privacy degli utenti?
Un'idea sarebbe trattarlo come un servizio di "mixing": come Tornado Cash per i contenuti invece che per le monete.
Avresti più nodi che ricevono lotti di contenuti da esaminare, e utilizzano prove ZK per attestare legalità/illegalità + valutazione dei contenuti per ciascuno di essi, ma non conoscono le fonti.
Poi il gateway potrebbe rifiutare il lavoro e fornire prova del "perché" senza essere accusato di pregiudizio/censura non necessaria.
Poi sarebbero parte di una rete incentivata a livello di gateway.
Esempio: supponiamo di aver creato un wrapper per le tue credenziali AWS con accesso a Bedrock Guardrails. Poi, per contribuire al mixing, abbiamo pagato un piccolo premio in ETH su Base, gestito, forse, da un servizio di coordinamento prototipo costruito in @eigenlayer EigenCloud.
Allora chiunque potrebbe partecipare e distribuire il carico e il mixing dei contenuti.
Devo misurare la latenza per questo.
1.758
3
Il contenuto di questa pagina è fornito da terze parti. Salvo diversa indicazione, OKX non è l'autore degli articoli citati e non rivendica alcun copyright sui materiali. Il contenuto è fornito solo a scopo informativo e non rappresenta le opinioni di OKX. Non intende essere un'approvazione di alcun tipo e non deve essere considerato un consiglio di investimento o una sollecitazione all'acquisto o alla vendita di asset digitali. Nella misura in cui l'IA generativa viene utilizzata per fornire riepiloghi o altre informazioni, tale contenuto generato dall'IA potrebbe essere impreciso o incoerente. Leggi l'articolo collegato per ulteriori dettagli e informazioni. OKX non è responsabile per i contenuti ospitati su siti di terze parti. Gli holding di asset digitali, tra cui stablecoin e NFT, comportano un elevato grado di rischio e possono fluttuare notevolmente. Dovresti valutare attentamente se effettuare il trading o detenere asset digitali è adatto a te alla luce della tua situazione finanziaria.