Dzięki modelowi takiemu jak #cliptagger z $GRASS, modele mogą:
- Używać wyjścia w formacie JSON i "oglądać" filmy, informując, co się dzieje i kiedy
- Ponieważ wyjście jest semantyczne, mogą być używane jako dane wejściowe do zadań rozumowania, trenowania modeli wideo, a nawet budowania zbiorów danych dla robotyki.

możesz spróbować cliptagger samodzielnie! załaduj dowolny obraz lub klatkę wideo i uruchom.
generacja zajmuje teraz kilka minut, ale to będzie błyskawiczne, gdy zamienimy @inference_net na zapleczu.
ciekawostka, to napędza nasze wyszukiwanie wideo.

4,99 tys.
29
Treści na tej stronie są dostarczane przez strony trzecie. O ile nie zaznaczono inaczej, OKX nie jest autorem cytowanych artykułów i nie rości sobie żadnych praw autorskich do tych materiałów. Treść jest dostarczana wyłącznie w celach informacyjnych i nie reprezentuje poglądów OKX. Nie mają one na celu jakiejkolwiek rekomendacji i nie powinny być traktowane jako porada inwestycyjna lub zachęta do zakupu lub sprzedaży aktywów cyfrowych. Treści, w zakresie w jakim jest wykorzystywana generatywna sztuczna inteligencja do dostarczania podsumowań lub innych informacji, mogą być niedokładne lub niespójne. Przeczytaj podlinkowany artykuł, aby uzyskać więcej szczegółów i informacji. OKX nie ponosi odpowiedzialności za treści hostowane na stronach osób trzecich. Posiadanie aktywów cyfrowych, w tym stablecoinów i NFT, wiąże się z wysokim stopniem ryzyka i może podlegać znacznym wahaniom. Musisz dokładnie rozważyć, czy handel lub posiadanie aktywów cyfrowych jest dla Ciebie odpowiednie w świetle Twojej sytuacji finansowej.