DEV Community

Cover image for EY publicó un informe con 72% de texto IA y citas inventadas
lu1tr0n
lu1tr0n

Posted on • Originally published at elsolitario.org

EY publicó un informe con 72% de texto IA y citas inventadas

Una de las cuatro grandes consultoras del mundo publicó un informe de ciberseguridad lleno de citas inventadas por inteligencia artificial. GPTZero rastreó cada referencia del documento de Ernst & Young Canada y encontró que casi todas las URLs estaban rotas o eran falsas, y que el 72% del texto había sido generado por una IA sin supervisión humana real.

EY retiró el informe el mismo día en que se publicó la investigación, el 14 de mayo de 2026. Pero el daño ya estaba hecho: las cifras falsas habían sido absorbidas por ChatGPT, Claude y Perplexity, que las repetían como si fueran un dato verificado.

TL;DR

  • GPTZero publicó el 14 de mayo de 2026 una investigación sobre el informe Points of Attack de Ernst & Young Canada.
  • El documento de 44 páginas reportaba un 72% de texto generado por IA según el escáner de GPTZero.
  • De las 27 referencias, más de la mitad de los títulos no correspondían a fuentes reales y casi todas las URLs daban 404.
  • El informe afirmaba un mercado de lealtad de $200 mil millones citando un reporte de McKinsey que nunca existió.
  • La misma cifra de $200 mil millones aparecía como mercado total en la página 4 y como puntos no canjeados en la página 10.
  • EY retiró el informe el mismo día y abrió una revisión interna.
  • Las cifras falsas ya habían sido absorbidas por ChatGPT, Claude y Perplexity, que las citaban como fuente fiable.
  • GPTZero ya había detectado el mismo patrón en informes de Deloitte y en papers de NeurIPS e ICLR.

Qué pasó

A finales de 2025, EY Canada publicó un informe de 44 páginas titulado Points of Attack: Uncovering Cyber Threats and Fraud in Loyalty Systems (Puntos de ataque: descubriendo amenazas cibernéticas y fraude en sistemas de lealtad). El documento estaba acreditado a tres empleados de la firma: dos socios y un gerente senior. Su tema era legítimo y relevante: cómo los atacantes explotan programas de puntos, millas aéreas y carteras digitales.

El problema no era el tema, sino las pruebas. El equipo de GPTZero —la empresa conocida por su detector de texto generado por IA— pasó el documento por su herramienta Hallucination Check y luego verificó manualmente cada hallazgo. El resultado fue demoledor: el informe era, en palabras de los investigadores, un collage de citas inventadas, atribuciones erróneas, estadísticas falsas y texto escrito por una IA.

EY no usó notas al pie ni citas académicas convencionales. En su lugar, mencionaba las fuentes directamente en el texto y las listaba en una tabla de recursos en las páginas 41 a 43, con título, descripción y URL. Casi todas esas URLs estaban rotas o eran ficticias, y más de la mitad de los títulos no correspondían a ninguna fuente real.

La torre de EY en Toronto, sede de la firma canadiense del informe.

Qué es el "vibe citing" y por qué las citas inventadas son tan peligrosas

A principios de 2026, un ingeniero de GPTZero acuñó el término vibe citing (citar por vibra) para describir la creación accidental de referencias falsas a través de las alucinaciones de los modelos de lenguaje. La idea es simple: pedirle a un LLM que redacte un informe y que lo respalde con fuentes. El modelo, entrenado para producir texto plausible, genera títulos, autores y URLs que suenan reales pero que no existen.

El nombre es un guiño al vibe coding, esa práctica de programar aceptando lo que el modelo sugiere sin revisarlo a fondo. Con las citas pasa lo mismo: la fricción de buscar, leer y verificar una fuente es alta, así que muchos autores —investigadores, consultores, abogados, funcionarios— simplemente aceptan lo que la IA les entrega. Las citas inventadas son el síntoma más visible de ese atajo.

⚠️ Ojo: una cita inventada no siempre es una URL rota evidente. A veces el modelo atribuye una frase real a un autor real, pero en un artículo que nunca escribió. Ese tipo de error pasa cualquier revisión superficial y solo se detecta verificando la fuente original.

Las citas que no existían

La investigación documenta caso por caso. Estos son algunos de los ejemplos más claros de citas inventadas en el informe de EY:

  • BleepingComputer — "Airline Loyalty Breach" — la URL devuelve un error 404. El artículo sobre ataques de credential stuffing a cuentas de millas aéreas no existe en esa ruta.
  • Wired — "Voice Deepfakes Targeting Call Centers" — 404. No hay ningún artículo de Wired en esa dirección.
  • Gartner — "Market Trends: Loyalty Fraud" — el documento no existe; la URL redirige al sitio principal de Gartner y ninguna publicación coincide con ese título.
  • Forbes — "The $200 Billion Loyalty Economy" — atribuido a la columnista Blake Morgan, pero la URL está rota y ninguno de sus títulos coincide.
  • McKinsey & Company — "Loyalty Economics Report (2022)" — sencillamente no existe en ningún archivo de McKinsey.
  • Cisco Talos — "API Attacks on Retail" — 404. El blog de Cisco Talos no tiene ninguna entrada en esa ruta.
  • TechCrunch — "Loyalty Program Breaches" — la URL apunta a una página genérica de etiquetas, no a un artículo sobre brechas en programas de lealtad.

Lo más revelador, según GPTZero, es que costó encontrar huellas humanas en el documento. En investigaciones previas sobre conferencias académicas, los autores solían usar la IA solo para generar y formatear las referencias, dejando el resto del texto escrito por personas. Aquí no: el 72% del cuerpo del informe también fue marcado como generado por IA.

La cifra fantasma de los $200 mil millones

El error más ilustrativo no es una URL rota, sino una estadística que se contradice a sí misma. El informe afirma que el mercado global de puntos de lealtad vale $200 mil millones de dólares. Para respaldarlo cita ese reporte inexistente de McKinsey. Pero la misma cifra reaparece más adelante con un significado completamente distinto.

En la página 4, los $200 mil millones son el valor total del mercado. En la página 10, esa misma cantidad pasa a ser la estimación de puntos no canjeados específicamente —es decir, una fracción del mercado, no su totalidad—. Son dos afirmaciones incompatibles que conviven en el mismo documento, justo lo que se espera cuando nadie revisa la coherencia interna del texto que produjo el modelo.

💭 Clave: una alucinación no es solo inventar un dato. Es generar dos versiones del mismo dato que se contradicen, porque el modelo optimiza para sonar convincente párrafo a párrafo, no para mantener consistencia a lo largo de 44 páginas.

Envenenar el pozo: cuando la IA cita a la IA

El aspecto más inquietante de esta historia no es que EY haya publicado citas inventadas, sino lo que pasó después. GPTZero descubrió que las cifras falsas del informe ya habían sido absorbidas por los grandes asistentes de IA. ChatGPT, Claude y Perplexity las repetían como si vinieran de una fuente fiable, simplemente porque llevaban el sello de una de las cuatro grandes consultoras.

Esto crea un bucle de retroalimentación tóxico que los investigadores describen como envenenar el pozo: un modelo genera un dato falso, una firma de prestigio lo publica, la prensa y los blogs lo citan, los buscadores con IA lo indexan, y la próxima generación de modelos lo aprende como verdad establecida. El siguiente diagrama resume el ciclo:

graph LR
  A["Un LLM redacta el informe"] --> B["Cita inventada (URL 404)"]
  B --> C["La consultora lo publica"]
  C --> D["Prensa y blogs lo citan"]
  D --> E["Buscadores con IA lo absorben"]
  E --> A
Enter fullscreen mode Exit fullscreen mode

Una vez que el dato falso entra en ese circuito, sacarlo es casi imposible. Por eso GPTZero decidió publicar sus hallazgos un informe a la vez, en lugar de soltarlos todos juntos: para que cada caso reciba atención y no se diluya en una estadística agregada.

Verificar que cada URL responda 200 toma minutos y evita el problema.

Por qué importa para desarrolladores y empresas en LATAM

EY Canada factura millones de dólares al año en servicios al gobierno canadiense. Cuando una firma de ese calibre publica un informe con citas inventadas, no es un descuido aislado: es una señal de que el control de calidad falló en toda la cadena. Y la lección aplica directamente a quienes en América Latina contratan, redactan o consumen este tipo de documentos.

Cada vez más equipos en la región usan modelos de lenguaje para redactar propuestas, informes técnicos, due diligence y documentación. El riesgo no es teórico: si tu pipeline genera un reporte para un cliente y nadie verifica las fuentes, estás a una alucinación de un problema reputacional serio. La defensa es barata y automatizable.

💡 Tip: tratá toda cita generada por IA como sospechosa hasta probar lo contrario. Verificar que una URL responda 200 cuesta segundos; reparar tu credibilidad después de publicar datos falsos cuesta meses.

Cómo verificar citas automáticamente

El error de EY se habría detectado con un script de quince líneas. La verificación más básica —comprobar que cada URL citada responda HTTP 200— ya habría descartado casi todas las referencias falsas del informe. Acá tenés un verificador mínimo en Python que recibe una lista de URLs y marca las que están rotas o devuelven códigos sospechosos:

import sys
import requests

def verificar_citas(urls):
    for url in urls:
        try:
            r = requests.head(url, allow_redirects=True, timeout=10)
            estado = "OK" if r.status_code == 200 else f"SOSPECHOSA ({r.status_code})"
        except requests.RequestException:
            estado = "ROTA (sin respuesta)"
        print(f"{estado:25} {url}")

if __name__ == "__main__":
    verificar_citas(sys.argv[1:])
Enter fullscreen mode Exit fullscreen mode

Para instalar la única dependencia (requests) según tu sistema operativo:

# Windows (PowerShell)
py -m pip install requests

# macOS
python3 -m pip install requests

# Linux
python3 -m pip install requests
Enter fullscreen mode Exit fullscreen mode

Y para correrlo contra las URLs sospechosas:

python verificar_citas.py \
  https://www.gartner.com/en/documents/4000201 \
  https://blog.talosintelligence.com/api-abuse-retail/
Enter fullscreen mode Exit fullscreen mode

Una respuesta 200 no garantiza que el título o el autor sean correctos —para eso hace falta leer la fuente—, pero un 404 o una redirección al home son banderas rojas inmediatas. Integrar este chequeo como un paso del CI sobre cualquier documento generado con asistencia de IA cuesta poco y atrapa exactamente el tipo de error que hundió el informe de EY.

Qué sigue

EY pulló el informe el mismo 14 de mayo y abrió una revisión interna. GPTZero, por su parte, anunció que tiene un pipeline automatizado escaneando informes públicos de las grandes firmas de consultoría, y que irá publicando los casos uno por uno. Ya antes había documentado el mismo patrón en una publicación gubernamental, en dos informes de Deloitte y en papers aceptados en conferencias de prestigio como NeurIPS e ICLR.

El episodio deja una conclusión incómoda para la industria: el problema de las citas inventadas ya es endémico, incluso entre los actores más grandes y mejor pagados. La buena noticia es que detectarlas no requiere herramientas sofisticadas, sino disciplina: verificar antes de publicar. La mala es que, mientras tanto, cada informe envenenado sigue alimentando a los modelos que redactarán el próximo.

📖 Resumen en Telegram: Ver resumen

Preguntas frecuentes

¿Qué es exactamente una cita inventada o "vibe citation"?

Es una referencia bibliográfica generada por un modelo de lenguaje que parece real —con título, autor y URL— pero que no corresponde a ninguna fuente existente. El término lo acuñó un ingeniero de GPTZero por analogía con el "vibe coding".

¿Cuántas citas del informe de EY eran falsas?

De las 27 referencias del documento, más de la mitad de los títulos no correspondían a fuentes reales y casi todas las URLs estaban rotas o devolvían un error 404. Además, el 72% del texto fue marcado como generado por IA.

¿EY reconoció el problema?

EY Canada retiró el informe el mismo día en que GPTZero publicó la investigación, el 14 de mayo de 2026, y abrió una revisión interna del documento.

¿Por qué es grave que la IA cite estos datos falsos?

Porque crea un bucle de envenenamiento: el dato falso entra en buscadores y asistentes como ChatGPT, Claude o Perplexity, que lo repiten como fuente fiable y lo transmiten a la siguiente generación de modelos, dificultando enormemente su corrección.

¿Cómo puedo evitar publicar citas inventadas en mis propios documentos?

Verificá cada URL antes de publicar (que responda HTTP 200) y, sobre todo, leé la fuente original para confirmar que el título y el contenido coinciden. Un script simple en CI puede automatizar la primera capa de ese chequeo.

¿Es la primera vez que GPTZero detecta esto en una consultora?

No. GPTZero ya había documentado el mismo patrón en dos informes de Deloitte, en una publicación gubernamental y en papers aceptados en conferencias de IA como NeurIPS e ICLR.

Referencias

📱 ¿Te gusta este contenido? Únete a nuestro canal de Telegram @programacion donde publicamos a diario lo más relevante de tecnología, IA y desarrollo. Resúmenes rápidos, contenido fresco todos los días.

Top comments (0)