GenAI Guardrails: Quem está fazendo isso melhor como serviço? A Rede Criptografada tem três modos: { Estrito | Permissivo | Abra }. "Estrito" impede conteúdo adulto/explícito por padrão e, em troca, tem acesso aos principais modelos proprietários. "Permissivo" (padrão) tem uma estratégia em duas frentes de primeiro tentar o trabalho com vários provedores (no caso de falsos positivos) e voltar a reescrever a solicitação de segurança. "Aberto" não julga o conteúdo e encontra satisfação em uma rede descentralizada de provedores, que pode ser mais aberta a conteúdo adulto. --- Dito isso, para evitar conteúdo *ilegal*, ainda temos fortes proteções, como classificadores constitucionais. O Catch-22? Confiar em modelos externos para julgar o conteúdo pode, por si só, ser uma violação dos Termos de Serviço do provedor. (Como ser roteado automaticamente para os modelos secretos da OpenAI). Quem está fazendo isso melhor? A Anthropic mostrou alguns recursos realmente fortes em seu recente hackathon de segurança. Quem mais?
Experimento mental: como você descentralizaria a própria proteção real, mantendo a privacidade do usuário? Uma ideia seria tratá-lo como um serviço de "mistura": como o Tornado Cash para conteúdo em vez de moedas. Você teria vários nós que recebem lotes de conteúdo para revisar e eles usam provas ZK para atestar a classificação de conteúdo legal / ilegal + para cada um deles, mas não conhecem as fontes. Então, o gateway poderia rejeitar o trabalho e fornecer provas do "porquê" sem ser acusado de preconceito / censura desnecessário. Em seguida, eles fariam parte de uma rede incentivada na camada de gateway.
Exemplo: digamos que eu criei um wrapper para suas credenciais da AWS com acesso ao Bedrock Guardrails. Então, por contribuir para a mixagem, pagamos um pequeno prêmio em ETH no Base, gerenciado, talvez, por um serviço de coordenação de protótipos construído em @eigenlayer EigenCloud. Então, qualquer pessoa poderia participar e distribuir a carga e a mistura de conteúdo. Preciso medir a latência para isso.
Mostrar original
1,64 mil
3
O conteúdo desta página é fornecido por terceiros. A menos que especificado de outra forma, a OKX não é a autora dos artigos mencionados e não reivindica direitos autorais sobre os materiais apresentados. O conteúdo tem um propósito meramente informativo e não representa as opiniões da OKX. Ele não deve ser interpretado como um endosso ou aconselhamento de investimento de qualquer tipo, nem como uma recomendação para compra ou venda de ativos digitais. Quando a IA generativa é utilizada para criar resumos ou outras informações, o conteúdo gerado pode apresentar imprecisões ou incoerências. Leia o artigo vinculado para mais detalhes e informações. A OKX não se responsabiliza pelo conteúdo hospedado em sites de terceiros. Possuir ativos digitais, como stablecoins e NFTs, envolve um risco elevado e pode apresentar flutuações significativas. Você deve ponderar com cuidado se negociar ou manter ativos digitais é adequado para sua condição financeira.