Excelente domingo – aquí el último resumen escrito desde Mérida ya por volar hoy a Toronto.
- Anthropic construyó un modelo con 83.1% de éxito reproduciendo vulnerabilidades en benchmark y decidió no publicarlo
- GLM-5.1 de Z.ai supera a GPT-5.4 en SWE-Bench Pro con código abierto, evaporando la ventaja competitiva de los modelos de pago
- Un cóctel molotov contra la casa de Sam Altman confirma que la ansiedad por la AGI.
Aquí lo que realmente importó esta semana:
- Mythos: La IA que Anthropic No se Atreve a Soltar: Anthropic desarrolló un modelo que encontró un bug de 27 años en OpenBSD y logra 83.1% de éxito en el benchmark CyberGym de reproducción de vulnerabilidades. En vez de publicarlo, creó «Project Glasswing» dando acceso a 12 organizaciones socias: empresas tecnológicas, de seguridad e infraestructura crítica— para parchear vulnerabilidades antes de que actores maliciosos las exploten. La IA cruzó el umbral de producto comercial a arma cibernética de doble uso.
- Intel y Musk Desafían el Monopolio de Nvidia: Intel se alió con Tesla, SpaceX y xAI en «Terafab» para fabricar chips de IA propietarios optimizados para robots humanoides Optimus y centros de datos de xAI. Buscan integración vertical absoluta desde la fundición del silicio hasta el software. Si lo logran, se saltan los ciclos de lanzamiento de Nvidia por completo.
- OpenAI Vende el Fuego y el Extintor: OpenAI publicó un marco político proponiendo impuestos sobre ganancias de capital e ingresos corporativos impulsados por IA para financiar un fondo de riqueza pública y redes de seguridad social. Es la primera vez que un laboratorio líder asume públicamente que su tecnología causará trastorno laboral si no hay reformas. Al proponer ellos el diseño del impuesto, aseguran su asiento en la mesa regulatoria.
- Código Abierto Derrota a los Gigantes en Programación: Z.ai lanzó GLM-5.1, modelo open source que alcanzó 58.4% en SWE-Bench Pro superando a GPT-5.4 (57.7%) y Claude Opus 4.6 (57.3%). Resuelve problemas reales de GitHub como desarrollador junior autónomo. Cuando las empresas descubran que pueden reemplazar devs junior con modelos gratuitos, la economía de APIs de pago enfrentará crisis.
- Meta Regala Razonamiento para Presionar Suscripciones: Meta lanzó Muse Spark con modo «Contemplating» que orquesta múltiples agentes en paralelo para resolver problemas complejos antes de responder. Lo ofrece gratis para más de 3,000 millones de usuarios vía meta.ai, aunque sin publicar los pesos del modelo. Si el razonamiento avanzado es gratuito para el usuario final, aumenta la presión competitiva sobre el modelo de suscripción de OpenAI y Anthropic.
- Alibaba Gana la Carrera del Video en Secreto: Un modelo anónimo llamado «HappyHorse-1.0» tomó el primer lugar global en generación de texto a video e imagen a video. Resultó ser de Alibaba. Los laboratorios chinos operan bajo alias en rankings occidentales mientras navegan tensiones geopolíticas y competencia doméstica feroz.
- Claude Deja de Ser Chatbot para Ser Sistema Operativo: Anthropic lanzó «Managed Agents» separando el cerebro del modelo de sus entornos de ejecución y memoria. Redujo el tiempo de primer token 60% en condiciones normales y más del 90% en casos de alta carga. Las empresas ahora despliegan ejércitos de agentes autónomos coordinados en la nube con controles de gasto y roles.
- Supercomputador Chino Comprometido: Un actor no identificado afirma haber extraído más de 10 petabytes de datos del Centro Nacional de Supercomputación de Tianjin, incluyendo documentos de defensa y resultados de simulaciones militares. La afirmación no ha sido verificada de forma independiente. Si se confirma, sería uno de los mayores robos de datos en la historia de China.
- Molotov Contra Altman: La Ansiedad AGI se Vuelve Física: Alrededor de las 4 AM lanzaron un cóctel molotov contra la casa de Sam Altman en San Francisco. Arrestaron a un hombre de 20 años. La seguridad física de ejecutivos de IA ahora opera bajo protocolos de jefes de Estado.
- Tu Clon Digital en 15 Segundos con HeyGen: HeyGen Avatar V permite capturar tu identidad visual y voz con solo 15 segundos de video. Reduce las barreras para producir videos personalizados a escala, ideal para ventas, marketing o capacitación sin grabar repetidamente frente a cámara.
- Tu Banco Dentro del Chat con Perplexity: Perplexity se integró con Plaid para conectar tarjetas, hipotecas y préstamos de 12,000 instituciones financieras como Chase o Fidelity. Panel de finanzas personales sin que tus datos toquen sus servidores. El chat ya no busca respuestas, ejecuta transacciones.
2 preguntas para reflexionar:
- xAI/Intel vs Nvidia – quién se quedará como el jugador ganador del segmento de los chips para Robots?
- Pondrán impuestos a la IA en los próximos 5 años?



