GenAI Guardrails: Kto robi to najlepiej jako usługa?
Sieć Scrypted ma trzy tryby: { Surowy | Permisyjny | Otwarty }.
"Surowy" domyślnie zapobiega treściom dojrzałym/eksplicytnym i w zamian ma dostęp do najlepszych, zastrzeżonych modeli.
"Permisyjny" (domyślny) ma dwuetapową strategię, najpierw próbując wykonać zadanie z wieloma dostawcami (w przypadku fałszywych pozytywów), a następnie przechodząc do przepisania żądania dla bezpieczeństwa.
"Otwarty" nie ocenia treści i czerpie satysfakcję z zdecentralizowanej sieci dostawców, którzy mogą być bardziej otwarci na treści dojrzałe.
---
Mówiąc to, aby zapobiec *nielegalnym* treściom, nadal mamy silne zabezpieczenia, takie jak klasyfikatory konstytucyjne.
Catch-22? Poleganie na zewnętrznych modelach do oceny treści może samo w sobie naruszać Warunki Usługi dostawcy. (Jak automatyczne przekierowanie do tajnych modeli OpenAI).
Kto robi to najlepiej? Anthropic zaprezentował naprawdę silne możliwości na swoim ostatnim hackathonie bezpieczeństwa. Kto jeszcze?
Eksperyment myślowy: jak zdecentralizować samą barierę ochronną, jednocześnie zachowując prywatność użytkowników?
Jednym z pomysłów byłoby traktowanie jej jako usługi "mieszania": jak Tornado Cash dla treści zamiast monet.
Miałbyś wiele węzłów, które otrzymują partie treści do przeglądu, a one używają dowodów ZK, aby potwierdzić legalność/nielegalność + ocenę treści dla każdej z nich, ale nie znają źródeł.
Wtedy brama mogłaby odrzucić pracę i dostarczyć dowód "dlaczego", nie będąc oskarżoną o niepotrzebne uprzedzenia/cenzurę.
Wtedy stałyby się częścią zmotywowanej sieci na poziomie bramy.
Przykład: powiedzmy, że stworzyłem wrapper do twoich poświadczeń AWS z dostępem do Bedrock Guardrails. Następnie, aby przyczynić się do miksowania, zapłaciliśmy niewielką premię w ETH na Base, zarządzaną, być może, przez prototypową usługę koordynacyjną zbudowaną w @eigenlayer EigenCloud.
Wtedy każdy mógłby dołączyć i rozłożyć obciążenie oraz miksowanie treści.
Muszę zmierzyć opóźnienie dla tego.
1,64 tys.
3
Treści na tej stronie są dostarczane przez strony trzecie. O ile nie zaznaczono inaczej, OKX nie jest autorem cytowanych artykułów i nie rości sobie żadnych praw autorskich do tych materiałów. Treść jest dostarczana wyłącznie w celach informacyjnych i nie reprezentuje poglądów OKX. Nie mają one na celu jakiejkolwiek rekomendacji i nie powinny być traktowane jako porada inwestycyjna lub zachęta do zakupu lub sprzedaży aktywów cyfrowych. Treści, w zakresie w jakim jest wykorzystywana generatywna sztuczna inteligencja do dostarczania podsumowań lub innych informacji, mogą być niedokładne lub niespójne. Przeczytaj podlinkowany artykuł, aby uzyskać więcej szczegółów i informacji. OKX nie ponosi odpowiedzialności za treści hostowane na stronach osób trzecich. Posiadanie aktywów cyfrowych, w tym stablecoinów i NFT, wiąże się z wysokim stopniem ryzyka i może podlegać znacznym wahaniom. Musisz dokładnie rozważyć, czy handel lub posiadanie aktywów cyfrowych jest dla Ciebie odpowiednie w świetle Twojej sytuacji finansowej.