GenAI Guardrails: ¿Quién lo está haciendo mejor como servicio?
La Red Scrypted tiene tres modos: { Estricto | Permisivo | Abierto }.
"Estricto" previene contenido maduro/explícito por defecto, y a cambio tiene acceso a los mejores modelos propietarios.
"Permisivo" (por defecto) tiene una estrategia de dos frentes que primero intenta el trabajo con múltiples proveedores (en caso de falsos positivos), y recurre a reescribir la solicitud por seguridad.
"Abierto" no juzga el contenido, y encuentra satisfacción en una red descentralizada de proveedores, que puede estar más abierta a contenido maduro.
---
Dicho esto, para prevenir contenido *ilegal* todavía tenemos fuertes guardrails, como clasificadores constitucionales.
¿El dilema? Confiar en modelos externos para juzgar contenido puede, en sí mismo, ser una violación de los Términos de Servicio del proveedor. (Como ser redirigido automáticamente a los modelos secretos de OpenAI).
¿Quién lo está haciendo mejor? Anthropic mostró algunas capacidades realmente fuertes en su reciente hackathon de seguridad. ¿Quién más?
Experimento mental: ¿cómo descentralizarías la propia barandilla mientras mantienes la privacidad del usuario?
Una idea sería tratarlo como un servicio de "mezcla": como Tornado Cash para contenido en lugar de monedas.
Tendrías múltiples nodos que reciben lotes de contenido para revisar, y utilizan pruebas ZK para atestiguar si son legales/ilegales + la calificación del contenido para cada uno de ellos, pero no conocen las fuentes.
Entonces, la puerta de enlace podría rechazar el trabajo y proporcionar prueba de "el porqué" sin ser acusada de sesgo/censura innecesaria.
Luego, formarían parte de una red incentivada en la capa de la puerta de enlace.
Ejemplo: digamos que creé un envoltorio para tus credenciales de AWS con acceso a Bedrock Guardrails. Luego, para contribuir a la mezcla, pagamos una pequeña prima en ETH en Base, gestionada, tal vez, por un servicio de coordinación prototipo construido en @eigenlayer EigenCloud.
Entonces, cualquiera podría unirse y distribuir la carga y la mezcla de contenido.
Necesito medir la latencia para esto.
1,65 mil
3
El contenido de esta página lo proporcionan terceros. A menos que se indique lo contrario, OKX no es el autor de los artículos citados y no reclama ningún derecho de autor sobre los materiales. El contenido se proporciona únicamente con fines informativos y no representa las opiniones de OKX. No pretende ser un respaldo de ningún tipo y no debe ser considerado como un consejo de inversión o una solicitud para comprar o vender activos digitales. En la medida en que la IA generativa se utiliza para proporcionar resúmenes u otra información, dicho contenido generado por IA puede ser inexacto o incoherente. Lee el artículo vinculado para obtener más detalles e información. OKX no es responsable del contenido alojado en sitios de terceros. El holding de activos digitales, incluyendo stablecoins y NFT, implican un alto grado de riesgo y pueden fluctuar en gran medida. Debes considerar cuidadosamente si el trading o holding de activos digitales es adecuado para ti a la luz de tu situación financiera.