GenAI Guardrails : Qui le fait le mieux en tant que service ? Le réseau Scrypted a trois modes : { Strict | Permissive | Open }. "Strict" empêche par défaut le contenu mature/explicite et, en échange, a accès à des modèles propriétaires de premier plan. "Permissive" (par défaut) a une stratégie en deux volets consistant d'abord à tenter le travail avec plusieurs fournisseurs (en cas de faux positifs), puis à reformuler la demande pour des raisons de sécurité. "Open" ne juge pas le contenu et trouve satisfaction dans un réseau décentralisé de fournisseurs, qui peuvent être plus ouverts au contenu mature. --- Cela dit, pour prévenir le contenu *illégal*, nous avons toujours de solides garde-fous, comme des classificateurs constitutionnels. Le Catch-22 ? Compter sur des modèles externes pour juger le contenu peut, en soi, être une violation des Conditions de Service du fournisseur. (Comme être automatiquement redirigé vers les modèles secrets d'OpenAI). Qui le fait le mieux ? Anthropic a montré de réelles capacités lors de son récent hackathon de sécurité. Qui d'autre ?
Expérience de pensée : comment décentraliser la barrière elle-même tout en préservant la vie privée des utilisateurs ? Une idée serait de la traiter comme un service de "mixage" : comme Tornado Cash pour le contenu au lieu des pièces. Vous auriez plusieurs nœuds qui reçoivent des lots de contenu à examiner, et ils utilisent des preuves ZK pour attester de la légalité/illégalité + de la classification du contenu pour chacun d'eux, mais ne connaissent pas les sources. Ensuite, la passerelle pourrait rejeter le travail et fournir une preuve de "la raison" sans être accusée de biais/censure inutile. Ils feraient alors partie d'un réseau incitatif au niveau de la passerelle.
Exemple : disons que j'ai créé un wrapper pour vos identifiants AWS avec accès aux Bedrock Guardrails. Ensuite, pour contribuer au mélange, nous avons payé une petite prime en ETH sur Base, gérée, peut-être, par un service de coordination prototype construit dans @eigenlayer EigenCloud. Alors, n'importe qui pourrait participer et distribuer la charge et le mélange de contenu. Je dois mesurer la latence pour cela.
Afficher l’original
1,64 k
3
Le contenu de cette page est fourni par des tiers. Sauf indication contraire, OKX n’est pas l’auteur du ou des articles cités et ne revendique aucun droit d’auteur sur le contenu. Le contenu est fourni à titre d’information uniquement et ne représente pas les opinions d’OKX. Il ne s’agit pas d’une approbation de quelque nature que ce soit et ne doit pas être considéré comme un conseil en investissement ou une sollicitation d’achat ou de vente d’actifs numériques. Dans la mesure où l’IA générative est utilisée pour fournir des résumés ou d’autres informations, ce contenu généré par IA peut être inexact ou incohérent. Veuillez lire l’article associé pour obtenir davantage de détails et d’informations. OKX n’est pas responsable du contenu hébergé sur des sites tiers. La détention d’actifs numériques, y compris les stablecoins et les NFT, implique un niveau de risque élevé et leur valeur peut considérablement fluctuer. Examinez soigneusement votre situation financière pour déterminer si le trading ou la détention d’actifs numériques vous convient.