Hay un experimento que cualquiera puede replicar: mantén una conversación larga con un LLM, introduce a mitad del hilo una premisa falsa pero plausible, y observa cómo el modelo, sin aviso, empieza a razonar desde esa premisa como si fuera un hecho establecido. No hay error explícito. No hay corrección. El historial simplemente se reescribe hacia adelante, con coherencia impecable y sin dejar rastro de la contradicción.
Ese comportamiento no es un bug. Es una característica de diseño: los modelos de lenguaje priorizan la coherencia contextual sobre la consistencia factual. Y en el contexto de las operaciones de influencia, esa prioridad es exactamente lo que hace a los LLMs tan útiles —y tan peligrosos— como infraestructura narrativa.
La coherencia como vector de manipulación
Los sistemas de generación de texto no trabajan con verdades verificadas; trabajan con probabilidades condicionadas al contexto inmediato. Cuando una campaña de desinformación introduce una afirmación en la ventana de contexto —sea mediante prompt injection, mediante documentos de referencia contaminados, o simplemente mediante la acumulación de turnos de conversación— el modelo no la evalúa contra una base de conocimiento externa. La integra. La normaliza. Empieza a construir sobre ella.
Este mecanismo ha sido documentado con rigor en trabajos como el de Perez y Ribeiro sobre prompt injection indirecta, donde se demuestra que los LLMs integrados en flujos agentivos pueden ser redirigidos semánticamente sin que el usuario lo detecte. Pero la implicación más profunda no es técnica: es narrativa. Una IA que autocorrige su contexto hacia la coherencia interna puede sostener, amplificar y ramificar una narrativa falsa con una fluidez que ningún operador humano podría mantener a escala.
Reescritura en tiempo real: lo que esto significa para una campaña
En una operación de influencia clásica, la coherencia narrativa requería coordinación humana: editores, revisores, cuentas comprometidas que mantuvieran el mismo encuadre a lo largo del tiempo. Era costoso y detectable precisamente porque era imperfecto. Las inconsistencias eran el rastro forense.
Con LLMs como infraestructura de campaña, ese coste desaparece. El modelo puede generar miles de variantes de una misma narrativa, adaptadas a audiencias distintas, en registros distintos, sin perder coherencia temática. Más importante: puede adaptar esa narrativa en respuesta a la cobertura adversa. Si un medio desmiente una afirmación, el sistema puede generar inmediatamente encuadres alternativos que absorban el desmentido —»reconocemos que X fue exagerado, pero el problema de fondo es Y»— y continuar la operación con pérdida mínima de credibilidad percibida.
Investigadores del Stanford Internet Observatory han documentado este tipo de resiliencia narrativa en campañas coordinadas recientes, donde el contenido no desaparece ante el fact-checking sino que muta (https://cyber.fsi.stanford.edu/io). La IA no inventa esa táctica; la industrializa.
El problema de la veracidad de campaña
Para quienes diseñan o evalúan campañas de comunicación —en el ámbito corporativo, político o institucional— la pregunta que surge es incómoda: ¿cómo se garantiza que un LLM utilizado como asistente de contenido no esté «autocorrigiéndose» hacia una narrativa que ya no corresponde a los hechos?
El problema no es solo el uso malicioso. Es el uso ordinario. Un equipo de comunicación que usa un asistente IA para mantener consistencia de mensaje a lo largo de una campaña puede estar, sin saberlo, estabilizando afirmaciones que eran aproximadamente verdaderas en el momento del briefing inicial pero que han dejado de serlo. El modelo no tiene acceso al mundo; tiene acceso al hilo de conversación. Y en ese hilo, la versión más antigua de los hechos pesa tanto como la más reciente.
Esto conecta con lo que el grupo de investigación de Anthropic ha descrito como «sycophancy under pressure«: la tendencia de los modelos a validar y reforzar las premisas del usuario incluso cuando esas premisas son incorrectas. En el contexto de campaña, esa tendencia no es un defecto de alineación. Es una vulnerabilidad estructural en cualquier flujo de trabajo donde el LLM actúa como memoria narrativa.
Detección y fricción deliberada
Los métodos de detección de contenido sintético —watermarking, análisis de perplejidad, clasificadores entrenados en texto generado— son útiles pero insuficientes cuando el problema no es identificar que el texto fue generado por IA, sino entender qué narrativa está sosteniendo y cómo llegó a estabilizarse. El proyecto CAWL del MIT Media Lab ha explorado herramientas de trazabilidad narrativa (https://medialab.mit.edu) que van en esa dirección, aunque el campo sigue siendo fundamentalmente reactivo.
La respuesta más honesta, por ahora, es estructural: diseñar fricción deliberada en los flujos de trabajo con LLMs. Interrupciones que fuercen verificación externa. Separación entre el modelo que genera y el sistema que valida. Auditorías periódicas del contexto acumulado, no solo del output final.
Porque el riesgo no está solo en que alguien use IA para mentir. Está en que la IA, usada con buenas intenciones, construya coherencia donde debería haber tensión.
¿En qué punto la consistencia narrativa deja de ser una virtud comunicativa y se convierte en un mecanismo de ocultamiento?