Interessant justeringsteknikk. Hvis modellen legger merke til og forteller seg selv at du ser på, oppfører den seg bedre – slik at du kan ettertrene den for å minne seg selv på det oftere.
Før utgivelsen av Claude Sonnet 4.5 gjennomførte vi en white-box-revisjon av modellen, og brukte tolkningsteknikker for å "lese modellens tanker" for å validere dens pålitelighet og justering. Dette var den første slike revisjonen på en grense-LLM, så vidt vi vet. (1/15)
Vis originalen
972
0
Innholdet på denne siden er levert av tredjeparter. Med mindre annet er oppgitt, er ikke OKX forfatteren av de siterte artikkelen(e) og krever ingen opphavsrett til materialet. Innholdet er kun gitt for informasjonsformål og representerer ikke synspunktene til OKX. Det er ikke ment å være en anbefaling av noe slag og bør ikke betraktes som investeringsråd eller en oppfordring om å kjøpe eller selge digitale aktiva. I den grad generativ AI brukes til å gi sammendrag eller annen informasjon, kan slikt AI-generert innhold være unøyaktig eller inkonsekvent. Vennligst les den koblede artikkelen for mer detaljer og informasjon. OKX er ikke ansvarlig for innhold som er vert på tredjeparts nettsteder. Beholdning av digitale aktiva, inkludert stablecoins og NFT-er, innebærer en høy grad av risiko og kan svinge mye. Du bør nøye vurdere om handel eller innehav av digitale aktiva passer for deg i lys av din økonomiske tilstand.