GenAI Guardrails: хто найкраще справляється з цим як з сервісом?
Шифрована мережа має три режими: { Строгий | Дозвільна | Відкрити }.
"Строгий" за замовчуванням запобігає контент для дорослих/відвертих, а натомість має доступ до топових, пропрієтарних моделей.
"Permissive" (за замовчуванням) має двосторонню стратегію: спочатку спробувати працювати з декількома провайдерами (у випадку помилкових спрацьовувань) і повернутися до перезапису запиту для безпеки.
"Відкритий" не оцінює контент і знаходить задоволення в децентралізованій мережі провайдерів, які можуть бути більш відкритими для контенту для дорослих.
---
Тим не менш, для запобігання *незаконному* контенту ми все ще маємо міцні захисні бар'єри, такі як конституційні класифікатори.
Пастка-22? Покладання на зовнішні моделі оцінювання контенту саме по собі може бути порушенням Умов надання послуг провайдера. (Наприклад, автоматична маршрутизація до секретних моделей OpenAI).
У кого це виходить найкраще? Anthropic продемонструвала деякі дійсно сильні можливості на своєму нещодавньому хакатоні з безпеки. Хто ще?
Уявний експеримент: як би ви децентралізували саму огорожу, зберігаючи при цьому конфіденційність користувачів?
Однією з ідей було б ставитися до нього як до сервісу «змішування»: як Tornado Cash для контенту замість монет.
У вас буде кілька вузлів, які отримують пакети контенту для перевірки, і вони використовують докази ZK, щоб підтвердити легальний/незаконний + рейтинг контенту для кожного з них, але не знають джерел.
Тоді шлюз міг відхилити роботу та надати докази «чому?», не будучи звинуваченим у непотрібному упередженості/цензурі.
Тоді вони стануть частиною стимульованої мережі на рівні шлюзу.
Приклад: скажімо, я створив обгортку до ваших облікових даних AWS з доступом до Bedrock Guardrails. Потім за внесок у мікшування ми заплатили невелику премію в ETH на Base, керованій, можливо, службою координації прототипів, вбудованою @eigenlayer EigenCloud.
Тоді будь-хто міг приєднатися і розподілити навантаження і зведення контенту.
Для цього мені потрібно виміряти затримку.
1,63 тис.
3
Вміст на цій сторінці надається третіми сторонами. Якщо не вказано інше, OKX не є автором цитованих статей і не претендує на авторські права на матеріали. Вміст надається виключно з інформаційною метою і не відображає поглядів OKX. Він не є схваленням жодних дій і не має розглядатися як інвестиційна порада або заохочення купувати чи продавати цифрові активи. Короткий виклад вмісту чи інша інформація, створена генеративним ШІ, можуть бути неточними або суперечливими. Прочитайте статтю за посиланням, щоб дізнатися більше. OKX не несе відповідальності за вміст, розміщений на сторонніх сайтах. Утримування цифрових активів, зокрема стейблкоїнів і NFT, пов’язане з високим ризиком, а вартість таких активів може сильно коливатися. Перш ніж торгувати цифровими активами або утримувати їх, ретельно оцініть свій фінансовий стан.