¿Pueden los agentes de IA convertirse en abogados? La última actualización lo sugiere
La reciente actualización de Opus 4.6 de Anthropic ha elevado las puntuaciones de los agentes de IA en tareas legales, alcanzando casi el 30% en pruebas, lo que podría cambiar la percepción sobre su rol en la abogacía.
07/02/2026 | 15:28Redacción Cadena 3
El mes pasado, se analizó el nuevo estándar de Mercor que mide las capacidades de los agentes de IA en tareas profesionales como el derecho y el análisis corporativo. En ese momento, los resultados fueron desalentadores, con todos los laboratorios importantes obteniendo puntajes por debajo del 25%, lo que llevó a la conclusión de que los abogados estaban a salvo de ser desplazados por la IA, al menos por ahora.
Sin embargo, las capacidades de la IA pueden cambiar significativamente en cuestión de semanas.
Esta semana, se lanzó la versión 4.6 de Anthropic, que revolucionó los rankings de agentes de IA. Este nuevo modelo logró un puntaje cercano al 30% en pruebas de un solo intento y un promedio de 45% cuando se le dieron más oportunidades para resolver problemas. Entre las nuevas características se incluyen "enjambres de agentes", que podrían haber contribuido a mejorar la resolución de problemas complejos.
El aumento en el puntaje es un gran avance respecto al estado anterior, lo que indica que el progreso en los modelos de base no está desacelerándose. Brendan Foody, CEO de Mercor, expresó su asombro: "Pasar del 18.4% al 29.8% en pocos meses es una locura".
Un 30% sigue siendo un largo camino hacia el 100%, por lo que no es que los abogados deban preocuparse por ser reemplazados por máquinas la próxima semana. Sin embargo, deberían ser mucho menos confiados que el mes pasado.
Lectura rápida
¿Cuál es el tema principal del artículo?
La evolución de las capacidades de los agentes de IA en el ámbito legal tras la actualización de Opus 4.6.
¿Quién lanzó la actualización mencionada?
La actualización fue lanzada por Anthropic.
¿Qué puntuación alcanzaron los nuevos modelos de IA?
Los nuevos modelos alcanzaron casi el 30% en pruebas de un solo intento.
¿Qué características nuevas se introdujeron en esta actualización?
Se introdujeron características como los "enjambres de agentes" para resolver problemas multistep.
¿Qué opinó el CEO de Mercor sobre el avance?
Brendan Foody consideró que el salto en los puntajes es "una locura".





