Categorías: Modelos de Lenguaje

Devstral 2507: la nueva élite open-source para agentes de codificación

Mistral vuelve a sacudir el tablero de la inteligencia artificial con el lanzamiento de sus nuevos modelos Devstral Small 1.1 y Devstral Medium, dentro de la familia Devstral 2507. Estos modelos no solo actualizan su capacidad en tareas de programación, sino que marcan un nuevo estándar en el desarrollo de agentes autónomos de software.

💥 ¿Qué hay de nuevo en Devstral 2507?

El enfoque está claro: velocidad, precisión y eficiencia para entornos de desarrollo reales. Con mejoras sustanciales en benchmarks clave, la nueva generación de Devstral no solo rivaliza con los grandes modelos cerrados, sino que supera a cualquier modelo open-source actual en rendimiento verificado de software engineering.

  • 🔹 Devstral Small 1.1 alcanza un impresionante 53.6% en el benchmark SWE-Bench Verified, posicionándose como el modelo abierto N.º 1 en este test.
  • 🔸 Devstral Medium sube aún más el listón, con un 61.6% en el mismo benchmark, acercándose a ligas dominadas por gigantes como Claude o GPT-4.

Ambos modelos están diseñados específicamente para agentes de codificación, lo que los convierte en candidatos ideales para integrar en flujos de trabajo autónomos, IDEs inteligentes y copilotos técnicos.

🧪 ¿Dónde probarlos?

Mistral sigue apostando por la transparencia y la accesibilidad:

👉 Puedes acceder al modelo Devstral Small 2507 en Hugging Face:
🔗 huggingface.co/mistralai/Devstral-Small-2507

🧠 También puedes probar devstral-small-2507 y devstral-medium-2507 directamente a través de la API de Mistral.

🚀 Una carrera por la autonomía del código

El movimiento de Mistral se alinea con una tendencia creciente: el auge de los agentes autónomos especializados en programación. Ya no se trata solo de autocompletar líneas de código, sino de modelos capaces de entender tickets, aplicar parches, modificar estructuras complejas e incluso probar su propio código.

En un mercado cada vez más impulsado por entornos autónomos, la optimización de modelos para tareas concretas (como Devstral para software engineering) marca el futuro de la IA aplicada.

🧩 En contexto: ¿quién gana la partida?

ModeloSWE-Bench Verified (%)Abierto
Devstral Medium 250761.6%
Devstral Small 1.153.6%
OctoCoder (Meta)47.3%
Claude 3.5 Sonnet70.0%
GPT-4 Turbo72.0%

El liderazgo en modelos open-source de Mistral es indiscutible por ahora. Y con el ritmo que llevan, no sería extraño que próximamente veamos una versión Devstral XL compitiendo en igualdad de condiciones con los grandes cerrados.

💬 ¿Usas modelos de codificación en tus flujos de trabajo? ¿Te gustaría integrar Devstral en tus proyectos? Cuéntanoslo en redes o únete a la conversación.

En Sombra Radio seguimos atentos a la evolución de los modelos abiertos y cómo transforman las reglas del juego.

Redacción Sombra Radio

Artículos creados por el equipo editorial de Sombra Radio, con la colaboración de herramientas de inteligencia artificial. Supervisado y editado por Sandra Tormo Britapaja, fundadora del medio. En Sombra Radio exploramos la intersección entre tecnología, inteligencia artificial y cultura contemporánea con mirada crítica e independiente.

Entradas recientes

AlterEgo: La interfaz vestible que interpreta tus pensamientos

AlterEgo, el dispositivo vestible del MIT que interpreta el habla interna, redefine la comunicación silenciosa…

2 horas hace

Google Gemini: Rediseño y Nuevas Funciones para Competir en IA

Google prepara un rediseño total de Gemini, su app de IA, con nueva interfaz y…

3 horas hace

Periodic Labs: IA Revoluciona la Investigación Científica con $300M

Periodic Labs levanta $300M para crear científicos de IA. ¿Revolución o riesgo? Automatizar la ciencia…

3 horas hace

Brecha en Salesforce: ShinyHunters Filtra Datos Robados

ShinyHunters filtra datos robados de Salesforce, exponiendo la fragilidad de la seguridad en la nube.…

3 horas hace

Arabia Saudí y la Conquista Cultural a Través del Gaming

Arabia Saudí invierte en el gaming para influir en la cultura global. ¿Controlará el futuro…

10 horas hace

OpenAI DevDay 2025: Expectativas y Nuevas Fronteras de la IA

Un análisis del próximo OpenAI DevDay 2025: IA multimodal, herramientas para desarrolladores y modelos personalizables.…

10 horas hace