GenAI Guardrails: ¿Quién está haciendo esto mejor como servicio? La red cifrada tiene tres modos: { Estricto | Permisivo | Abrir }. "Estricto" evita el contenido para adultos / explícito de forma predeterminada y, a cambio, tiene acceso a los mejores modelos propietarios. "Permisivo" (predeterminado) tiene una estrategia doble de intentar primero el trabajo con múltiples proveedores (en caso de falsos positivos) y volver a reescribir la solicitud de seguridad. "Abierto" no juzga el contenido y encuentra satisfacción en una red descentralizada de proveedores, que puede estar más abierta al contenido para adultos. --- Dicho esto, para evitar el contenido *ilegal* todavía tenemos fuertes barandillas, como clasificadores constitucionales. ¿El Catch-22? Confiar en modelos externos para juzgar el contenido puede, en sí mismo, ser una violación de los Términos de servicio del proveedor. (Como ser enrutado automáticamente a los modelos secretos de OpenAI). ¿Quién lo está haciendo mejor? Anthropic mostró algunas capacidades realmente sólidas en su reciente hackathon de seguridad. ¿Quién más?
Experimento mental: ¿cómo descentralizaría la barandilla real mientras mantiene la privacidad del usuario? Una idea sería tratarlo como un servicio de "mezcla": como Tornado Cash para contenido en lugar de monedas. Tendrías varios nodos que reciben lotes de contenido para revisar, y usan pruebas ZK para dar fe de la calificación de contenido legal/ilegal + para cada uno de ellos, pero no conocen las fuentes. Entonces la puerta de enlace podría rechazar el trabajo y proporcionar pruebas del "por qué" sin ser acusada de sesgo/censura innecesaria. Entonces serían parte de una red incentivada en la capa de entrada.
Ejemplo: digamos que creé un envoltorio para sus credenciales de AWS con acceso a Bedrock Guardrails. Luego, por contribuir a la mezcla, pagamos una pequeña prima en ETH en Base, administrada, tal vez, por un servicio de coordinación de prototipos construido en @eigenlayer EigenCloud. Luego, cualquiera podría unirse y distribuir la carga y la mezcla de contenido. Necesito medir la latencia para esto.
Mostrar original
1.75 K
3
El contenido al que estás accediendo se ofrece por terceros. A menos que se indique lo contrario, OKX no es autor de la información y no reclama ningún derecho de autor sobre los materiales. El contenido solo se proporciona con fines informativos y no representa las opiniones de OKX. No pretende ser un respaldo de ningún tipo y no debe ser considerado como un consejo de inversión o una solicitud para comprar o vender activos digitales. En la medida en que la IA generativa se utiliza para proporcionar resúmenes u otra información, dicho contenido generado por IA puede ser inexacto o incoherente. Lee el artículo enlazado para más detalles e información. OKX no es responsable del contenido alojado en sitios de terceros. Los holdings de activos digitales, incluidos stablecoins y NFT, suponen un alto nivel de riesgo y pueden fluctuar mucho. Debes considerar cuidadosamente si el trading o holding de activos digitales es adecuado para ti según tu situación financiera.