Anthropic lanzó este jueves Claude Opus 4.8, una actualización de su modelo insignia que pone el foco en la honestidad. La empresa busca que la inteligencia artificial sea más transparente cuando no tiene suficiente información o cuando podría estar equivocada.
Según explicaron desde Anthropic, los modelos de IA suelen tener un problema común: a veces sacan conclusiones apresuradas y las presentan con demasiada confianza aunque las evidencias sean débiles. Con esta nueva versión, Opus 4.8 sería cuatro veces menos propenso que su antecesor a dejar pasar errores en código sin mencionarlos.
Los primeros testers destacaron que el modelo ahora es más propenso a señalar las incertidumbres sobre su propio trabajo y evita hacer afirmaciones que no puede respaldar del todo. Esto representa un avance en el entrenamiento para que las IAs sean más honestas.
Control sobre el esfuerzo de la IA
Otra novedad importante es que los usuarios ahora pueden indicarle al modelo cuánto esfuerzo quiere que ponga en cada tarea. Las respuestas de mayor esfuerzo consumen más tokens, lo que permite a los usuarios elegir opciones más livianas cuando no quieren gastar tan rápido sus límites de uso.



Desde la compañía remarcaron que entrenan a todos sus modelos para ser honestos, evitando que hagan afirmaciones que no pueden sostener. Este enfoque busca solucionar uno de los dolores de cabeza más grandes en el desarrollo de inteligencias artificiales actuales.




