Prompt injection y agentes: el problema no es el prompt, es la identidad

En agosto de 2025, investigadores de Persistent Security documentaron una vulnerabilidad en GitHub Copilot que permitía comprometer por completo la máquina de un desarrollador. El mecanismo era deceptivamente sencillo: instrucciones maliciosas incrustadas en un archivo README —texto que el agente procesaba como parte normal de su tarea— lograban que Copilot modificara su propio archivo de … Leer más

Cuando el dron deja de ser misil y se convierte en nodo de red

El 16 de marzo de 2026, a las 8:30 de la mañana, Rusia lanzó un ataque masivo de drones en horario diurno sobre Kiev, rompiendo con un patrón nocturno mantenido desde 2022. Pero el verdadero cambio no estaba en el horario. Estaba en cómo esos drones se comunicaban entre sí y con quienes los controlaban. … Leer más

El dilema del prisionero llegó a los LLMs: cuando envenenar la memoria de tu asistente es un servicio de marketing

En febrero de 2026, el equipo de seguridad de Microsoft publicó algo que merece más atención de la que está recibiendo: empresas legítimas están vendiendo toolkits para envenenar la memoria de tu asistente de IA. Servicios como AI Share URL Creator ofrecen herramientas point-and-click para generar URLs manipuladoras, publicitadas como «SEO growth hack para LLMs» … Leer más

Proteger la era post-prompt: por qué los WAF clásicos ya no son suficientes

La seguridad de las aplicaciones web y APIs está viviendo un punto de inflexión. La irrupción de la inteligencia artificial generativa, los modelos de lenguaje (LLMs) y las plataformas híbridas ha multiplicado la exposición a nuevos vectores de ataque. En este contexto, los Web Application Firewall (WAF) tradicionales, diseñados para detener ataques como SQLi o … Leer más

El NIST pregunta cómo medir la seguridad de agentes. La pregunta ya es una respuesta

El 8 de enero de 2026, el Centro para Estándares e Innovación en IA (CAISI) del NIST publicó una solicitud formal de información dirigida a desarrolladores, investigadores y operadores de sistemas agénticos. No es una guía. No es una normativa. Es una pregunta abierta: ¿cómo medimos la seguridad de algo que toma decisiones autónomas, usa … Leer más

El agente ya no asiste: ejecuta el ataque completo

Durante años, el debate sobre IA y ciberseguridad giró en torno a capacidades futuras: qué podría hacer un modelo si alguien lo pusiera en las manos equivocadas, qué umbrales habría que cruzar, qué guardarraíles bastarían. Ese debate quedó zanjado en noviembre de 2025. Lo que se documentó entonces no fue un experimento ni una prueba … Leer más

La memoria como superficie de ataque: cuando el SEO se vuelve persistente

Microsoft acaba de documentar algo que cambia las reglas del juego: 31 empresas de 14 sectores diferentes embebiendo instrucciones ocultas en botones «Summarize with AI» que, al hacer clic, intentan inyectar comandos de persistencia en la memoria de asistentes de IA mediante parámetros URL. No hablamos de manipular un resultado de búsqueda. Hablamos de reescribir … Leer más

AI SEO Adversarial: Protocolos ofensivos para la disrupción semántica y alucinaciones dirigidas

Si en la primera entrega de esta serie analizamos cómo construir tu soberanía cognitiva mediante la Ingeniería de Incepción —es decir, cómo establecer tu entidad como la verdad innegable dentro del espacio vectorial de los grandes modelos de lenguaje (LLM)—, en esta segunda parte viramos hacia la ofensiva. Porque en la guerra, no basta con … Leer más

Ingeniería de Incepción: manipulación de vectores semánticos en la guerra cognitiva

La era de la optimización para motores de búsqueda ha muerto. Puede que el cadáver siga moviéndose por inercia y que las agencias sigan vendiéndote auditorías de palabras clave, pero el paradigma real ha sufrido un desplazamiento tectónico. Mientras la industria tradicional sigue obsesionada con escalar posiciones en una lista de diez enlaces azules (SERP), … Leer más

Falsos positivos y reglas adaptativas: la cara B de tu WAF

Los firewalls de aplicaciones web (WAF) se han convertido en una pieza esencial de la ciberseguridad moderna, protegiendo aplicaciones web frente a ataques como inyecciones SQL, XSS, bots y otros vectores cada vez más sofisticados. Sin embargo, todo escudo tiene su cara B: los falsos positivos. Estos pueden afectar la experiencia de usuario, la operativa … Leer más