Recientemente, eché un vistazo serio a @JoinSapien y, para ser honesto, mis ojos se iluminaron.
No es que tenga modelos geniales, es que se toma en serio la "calidad de los datos".
Ves que ahora hay proyectos de IA en todas partes, y las demostraciones de potencia de cómputo, velocidad de razonamiento y quiénes están luchando son más deslumbrantes, pero los lugares donde realmente deberías gastar tus esfuerzos rara vez se tocan...
👉 ¿Están limpios los datos subyacentes de la IA que entrenaste? ¿Es precisa la marca? ¿Son las fuentes lo suficientemente amplias?
🔹 Muchos proyectos comienzan con la sensación de "hazlo primero".
🔹 Como resultado, cuando algo sucedía, volvía a inventar la información, reparaba la etiqueta, volvía a entrenar al modelo y quemaba dinero para compensar el bote......
🔹 Para decirlo sin rodeos: los datos no son buenos y el modelo es en vano.
Tomemos una analogía:
🔹 No importa lo inteligente que seas, ¿qué puedes aprender a entender leyendo errores tipográficos y libros de texto desordenados todos los días?
🔹Lo mismo ocurre con la IA, no se desperdicia ninguna cantidad de GPU si los datos están desordenados.
🔹 En un campo como las finanzas o la sanidad, un solo error en el modelo puede ser catastrófico.
🔹 Especialmente en el caso de la identificación de fraudes, los datos incorrectos = un montón de falsas alarmas y, como resultado, el usuario no confía en absoluto en el sistema.
Así que creo que Sapiens es inteligente en eso:
🔹 Las fuentes de datos enfatizan la diversidad, no solo un tipo de contenido (esto es muy importante para evitar el sesgo del modelo)
🔹 Escriba claramente las reglas de marcado (¿qué es un "automóvil"?) ¿Sedán? ¿Roadster? ¿Autobús? Hazlo claro para que no sea desordenado)
🔹 ¡Alguien revisó! No es que la máquina haya terminado con la marca, por lo que la tasa de error se disparará directamente
En una palabra, se puede resumir como:
Están tratando la cuestión de "cómo se transfiere el conocimiento humano a la IA" como un sistema serio.
Vi una ronda de proyectos y hablé mucho sobre lo rápida que es la GPU y lo deslumbrante que es el modelo.
Pero realmente no se habla mucho de "cómo hacer la información correcta y finamente".
Ahora bien, si quieres dedicarte a la IA en serio, primero tienes que establecer una buena "base de datos".
¿O simplemente estás alimentando a la IA con comida rápida y esperando que sea un científico? Basta.
Así que ahora empiezo a pensar, con proyectos como Sapien,
Puede ser el tipo de IA Web3 en la que realmente debería centrarse:
No es del tipo que estará bien con un lanzamiento aéreo a corto plazo, sino del tipo que construye capacidades de IA sobre "datos reales" y "experiencia humana" paso a paso.
Personalmente, apoyo esta ruta, la IA quiere ser confiable y primero controlar los datos.
No dejes que el modelo haga lo incorrecto de forma rápida y precisa. 😅
#Sapien #SNAPS #COOKIE #Sapien大使 #Web3AI #CookieDotFun #JoinSapien #Spark #CookieDAO #Spark
Mostrar original


100
4.23 K
El contenido al que estás accediendo se ofrece por terceros. A menos que se indique lo contrario, OKX no es autor de la información y no reclama ningún derecho de autor sobre los materiales. El contenido solo se proporciona con fines informativos y no representa las opiniones de OKX. No pretende ser un respaldo de ningún tipo y no debe ser considerado como un consejo de inversión o una solicitud para comprar o vender activos digitales. En la medida en que la IA generativa se utiliza para proporcionar resúmenes u otra información, dicho contenido generado por IA puede ser inexacto o incoherente. Lee el artículo enlazado para más detalles e información. OKX no es responsable del contenido alojado en sitios de terceros. Los holdings de activos digitales, incluidos stablecoins y NFT, suponen un alto nivel de riesgo y pueden fluctuar mucho. Debes considerar cuidadosamente si el trading o holding de activos digitales es adecuado para ti según tu situación financiera.