🧩 Lost in Conversation: los LLMs se pierden cuando la charla se alarga

📡 Atención, desarrolladores y fanáticos del prompt perfecto: un nuevo estudio de Microsoft y Salesforce acaba de poner en jaque a los grandes modelos de lenguaje. Bajo el título provocador…

🧠 Claude 4 bajo la lupa: ¿Qué está pasando con sus benchmarks?

Desde su lanzamiento, Claude 4 ha generado grandes expectativas como el buque insignia de Anthropic, con promesas de ser más seguro, ético y potente que sus predecesores. Pero en los…

🛠️ Devstral: el nuevo agente programador de Mistral

La carrera por crear modelos de lenguaje especializados no se detiene, y esta semana Mistral AI ha puesto sobre la mesa una propuesta contundente: Devstral, un LLM de 24 mil…

🔍📚 ¿Qué es suficiente para pensar? Google redefine el contexto en los sistemas RAG

Cuando la IA necesita contexto… pero no demasiado Google Research acaba de publicar un artículo que entra al núcleo del rendimiento real de los modelos de lenguaje: ¿cuánto contexto necesitan…

Claude ahora investiga por ti: Anthropic lanza su función “Research” en móviles

El asistente que responde ya no es suficiente. Ahora tiene que buscar, filtrar, cruzar datos y entender tu contexto de trabajo. Anthropic lo sabe y responde con una actualización silenciosa…

Windsurf presenta SWE-1: su primera familia de modelos de IA para ingeniería de software completa

¿Y si el próximo miembro de tu equipo no fuera humano? La startup Windsurf irrumpe en el escenario de la inteligencia artificial con una propuesta contundente: SWE-1, una familia de…