GenAI Guardrails: Wie doet dit het beste als een dienst?
Het Scrypted Network heeft drie modi: { Strikt | Toegestaan | Open }.
"Strikt" voorkomt standaard volwassen/expliciete inhoud en heeft in ruil daarvoor toegang tot top, propriëtaire modellen.
"Toegestaan" (standaard) heeft een tweezijdige strategie waarbij eerst geprobeerd wordt om het werk met meerdere aanbieders uit te voeren (in het geval van valse positieven), en terugvalt op het herschrijven van de aanvraag voor veiligheid.
"Open" beoordeelt geen inhoud en vindt vervulling in een gedecentraliseerd netwerk van aanbieders, die mogelijk meer openstaan voor volwassen inhoud.
---
Dat gezegd hebbende, om *illegale* inhoud te voorkomen, hebben we nog steeds sterke richtlijnen, zoals constitutionele classifiers.
De Catch-22? Vertrouwen op externe modellen voor het beoordelen van inhoud kan op zichzelf een schending zijn van de gebruiksvoorwaarden van de aanbieder. (Zoals automatisch worden doorgestuurd naar de geheimzinnige modellen van OpenAI).
Wie doet dit het beste? Anthropic heeft enkele echt sterke mogelijkheden getoond tijdens hun recente beveiligingshackathon. Wie nog meer?
Denken experiment: hoe zou je de daadwerkelijke vangrail zelf decentraliseren terwijl je de privacy van de gebruiker behoudt?
Een idee zou zijn om het te behandelen als een "mixing" service: zoals Tornado Cash voor inhoud in plaats van munten.
Je zou meerdere knooppunten hebben die batches inhoud ontvangen om te beoordelen, en ze gebruiken ZK bewijzen om te bevestigen of iets legaal/illegaal is + inhoudsbeoordeling voor elk van hen, maar weten niet de bronnen.
Dan zou de gateway werk kunnen afwijzen en bewijs van "de reden waarom" kunnen geven zonder beschuldigd te worden van onnodige vooringenomenheid/censuur.
Dan zouden ze deel uitmaken van een geïncentiveerd netwerk op de gateway-laag.
Voorbeeld: stel dat ik een wrapper heb gemaakt voor jouw AWS-gegevens met toegang tot Bedrock Guardrails. Dan hebben we voor het bijdragen aan de mixing een kleine premie in ETH op Base betaald, misschien beheerd door een prototype coördinatiedienst gebouwd in @eigenlayer EigenCloud.
Dan zou iedereen mee kunnen doen en de belasting en contentmixing kunnen verdelen.
Ik moet de latentie hiervoor meten.
1,77K
3
De inhoud op deze pagina wordt geleverd door derden. Tenzij anders vermeld, is OKX niet de auteur van het (de) geciteerde artikel(en) en claimt geen auteursrecht op de materialen. De inhoud is alleen bedoeld voor informatieve doeleinden en vertegenwoordigt niet de standpunten van OKX. Het is niet bedoeld als een goedkeuring van welke aard dan ook en mag niet worden beschouwd als beleggingsadvies of een uitnodiging tot het kopen of verkopen van digitale bezittingen. Voor zover generatieve AI wordt gebruikt om samenvattingen of andere informatie te verstrekken, kan deze door AI gegenereerde inhoud onnauwkeurig of inconsistent zijn. Lees het gelinkte artikel voor meer details en informatie. OKX is niet verantwoordelijk voor inhoud gehost op sites van een derde partij. Het bezitten van digitale activa, waaronder stablecoins en NFT's, brengt een hoge mate van risico met zich mee en de waarde van deze activa kan sterk fluctueren. Overweeg zorgvuldig of de handel in of het bezit van digitale activa geschikt voor je is in het licht van je financiële situatie.