GenAI Guardrails: Kto robi to najlepiej jako usługa? Sieć Scrypted ma trzy tryby: { Surowy | Permisyjny | Otwarty }. "Surowy" domyślnie zapobiega treściom dojrzałym/eksplicytnym i w zamian ma dostęp do najlepszych, zastrzeżonych modeli. "Permisyjny" (domyślny) ma dwuetapową strategię, najpierw próbując wykonać zadanie z wieloma dostawcami (w przypadku fałszywych pozytywów), a następnie przechodząc do przepisania żądania dla bezpieczeństwa. "Otwarty" nie ocenia treści i czerpie satysfakcję z zdecentralizowanej sieci dostawców, którzy mogą być bardziej otwarci na treści dojrzałe. --- Mówiąc to, aby zapobiec *nielegalnym* treściom, nadal mamy silne zabezpieczenia, takie jak klasyfikatory konstytucyjne. Catch-22? Poleganie na zewnętrznych modelach do oceny treści może samo w sobie naruszać Warunki Usługi dostawcy. (Jak automatyczne przekierowanie do tajnych modeli OpenAI). Kto robi to najlepiej? Anthropic zaprezentował naprawdę silne możliwości na swoim ostatnim hackathonie bezpieczeństwa. Kto jeszcze?
Eksperyment myślowy: jak zdecentralizować samą barierę ochronną, jednocześnie zachowując prywatność użytkowników? Jednym z pomysłów byłoby traktowanie jej jako usługi "mieszania": jak Tornado Cash dla treści zamiast monet. Miałbyś wiele węzłów, które otrzymują partie treści do przeglądu, a one używają dowodów ZK, aby potwierdzić legalność/nielegalność + ocenę treści dla każdej z nich, ale nie znają źródeł. Wtedy brama mogłaby odrzucić pracę i dostarczyć dowód "dlaczego", nie będąc oskarżoną o niepotrzebne uprzedzenia/cenzurę. Wtedy stałyby się częścią zmotywowanej sieci na poziomie bramy.
Przykład: powiedzmy, że stworzyłem wrapper do twoich poświadczeń AWS z dostępem do Bedrock Guardrails. Następnie, aby przyczynić się do miksowania, zapłaciliśmy niewielką premię w ETH na Base, zarządzaną, być może, przez prototypową usługę koordynacyjną zbudowaną w @eigenlayer EigenCloud. Wtedy każdy mógłby dołączyć i rozłożyć obciążenie oraz miksowanie treści. Muszę zmierzyć opóźnienie dla tego.
Pokaż oryginał
1,64 tys.
3
Treści na tej stronie są dostarczane przez strony trzecie. O ile nie zaznaczono inaczej, OKX nie jest autorem cytowanych artykułów i nie rości sobie żadnych praw autorskich do tych materiałów. Treść jest dostarczana wyłącznie w celach informacyjnych i nie reprezentuje poglądów OKX. Nie mają one na celu jakiejkolwiek rekomendacji i nie powinny być traktowane jako porada inwestycyjna lub zachęta do zakupu lub sprzedaży aktywów cyfrowych. Treści, w zakresie w jakim jest wykorzystywana generatywna sztuczna inteligencja do dostarczania podsumowań lub innych informacji, mogą być niedokładne lub niespójne. Przeczytaj podlinkowany artykuł, aby uzyskać więcej szczegółów i informacji. OKX nie ponosi odpowiedzialności za treści hostowane na stronach osób trzecich. Posiadanie aktywów cyfrowych, w tym stablecoinów i NFT, wiąże się z wysokim stopniem ryzyka i może podlegać znacznym wahaniom. Musisz dokładnie rozważyć, czy handel lub posiadanie aktywów cyfrowych jest dla Ciebie odpowiednie w świetle Twojej sytuacji finansowej.