Devstral 2507: la nueva élite open-source para agentes de codificación

Mistral vuelve a sacudir el tablero de la inteligencia artificial con el lanzamiento de sus nuevos modelos Devstral Small 1.1 y Devstral Medium, dentro de la familia Devstral 2507. Estos modelos no solo actualizan su capacidad en tareas de programación, sino que marcan un nuevo estándar en el desarrollo de agentes autónomos de software.

💥 ¿Qué hay de nuevo en Devstral 2507?

El enfoque está claro: velocidad, precisión y eficiencia para entornos de desarrollo reales. Con mejoras sustanciales en benchmarks clave, la nueva generación de Devstral no solo rivaliza con los grandes modelos cerrados, sino que supera a cualquier modelo open-source actual en rendimiento verificado de software engineering.

  • 🔹 Devstral Small 1.1 alcanza un impresionante 53.6% en el benchmark SWE-Bench Verified, posicionándose como el modelo abierto N.º 1 en este test.
  • 🔸 Devstral Medium sube aún más el listón, con un 61.6% en el mismo benchmark, acercándose a ligas dominadas por gigantes como Claude o GPT-4.

Ambos modelos están diseñados específicamente para agentes de codificación, lo que los convierte en candidatos ideales para integrar en flujos de trabajo autónomos, IDEs inteligentes y copilotos técnicos.

🧪 ¿Dónde probarlos?

Mistral sigue apostando por la transparencia y la accesibilidad:

👉 Puedes acceder al modelo Devstral Small 2507 en Hugging Face:
🔗 huggingface.co/mistralai/Devstral-Small-2507

🧠 También puedes probar devstral-small-2507 y devstral-medium-2507 directamente a través de la API de Mistral.

🚀 Una carrera por la autonomía del código

El movimiento de Mistral se alinea con una tendencia creciente: el auge de los agentes autónomos especializados en programación. Ya no se trata solo de autocompletar líneas de código, sino de modelos capaces de entender tickets, aplicar parches, modificar estructuras complejas e incluso probar su propio código.

En un mercado cada vez más impulsado por entornos autónomos, la optimización de modelos para tareas concretas (como Devstral para software engineering) marca el futuro de la IA aplicada.

🧩 En contexto: ¿quién gana la partida?

ModeloSWE-Bench Verified (%)Abierto
Devstral Medium 250761.6%
Devstral Small 1.153.6%
OctoCoder (Meta)47.3%
Claude 3.5 Sonnet70.0%
GPT-4 Turbo72.0%

El liderazgo en modelos open-source de Mistral es indiscutible por ahora. Y con el ritmo que llevan, no sería extraño que próximamente veamos una versión Devstral XL compitiendo en igualdad de condiciones con los grandes cerrados.

💬 ¿Usas modelos de codificación en tus flujos de trabajo? ¿Te gustaría integrar Devstral en tus proyectos? Cuéntanoslo en redes o únete a la conversación.

En Sombra Radio seguimos atentos a la evolución de los modelos abiertos y cómo transforman las reglas del juego.

Foto del avatar
Redacción Sombra Radio

Artículos creados por el equipo editorial de Sombra Radio, con la colaboración de herramientas de inteligencia artificial. Supervisado y editado por Sandra Tormo Britapaja, fundadora del medio. En Sombra Radio exploramos la intersección entre tecnología, inteligencia artificial y cultura contemporánea con mirada crítica e independiente.

Artículos: 441

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *