Doxing automatizado: cuando la inteligencia artificial se convierte en el mayor enemigo de la privacidad

Análisis

Manuel Travezaño
Analista Táctico en Unidad de Ciberinteligencia en la Policía de Perú. Cuenta con formación especializada en Ciberinteligencia, Ethical Hacking, Forensic Lab, Network Security Specialist, etc., además de un Diplomado en Métodos Estadísticos en Análisis de Inteligencia realizado en LISA Institute.

Lo que antes era territorio exclusivo de hackers y analistas especializados, hoy está al alcance de cualquiera con acceso a un chatbot. Manuel Travezaño, profesor del Curso Avanzado de Analista SOCMINT y del Curso de Experto en OSINT de LISA Institute, advierte que la inteligencia artificial generativa ha abierto una puerta que nadie pidió: la exposición masiva de datos personales en cuestión de segundos, sin advertencias y sin frenos.

La inteligencia artificial (IA) generativa ha transformado drásticamente la manera en que procesamos e investigamos información. Sin embargo, esta revolución tecnológica ha abierto una peligrosa brecha de seguridad. No se trata de un riesgo teórico: la base de datos AI Incident Database registra un crecimiento exponencial y alarmante de incidentes problemáticos relacionados con la IA, pasando de casos aislados hace una década a un récord de 392 incidentes críticos sólo en 2025. Esta estadística abarca desde ciberataques impulsados por IA y accidentes fatales con robots hasta chatbots implicados en tragedias personales. 

Gráfico «Problematic AI incidents» mostrando la escalada hasta los 392 casos en 2025. Fuente: AI Incident Database / The Independent] 

Dentro de esta creciente ola de vulnerabilidades, destaca una amenaza silenciosa pero de impacto masivo: el «doxing con inteligencia artificial» y la manipulación de grandes modelos de lenguaje (LLM). Lo que antes requería horas de investigación meticulosa por parte de analistas o ciberdelincuentes, hoy es ejecutado en cuestión de segundos por chatbots comerciales y motores de búsqueda vitaminados con IA. 

La amenaza digital: doxing y el daño colateral

Las amenazas digitales derivadas del mal uso de estos grandes modelos de lenguaje (LLM), las cuales operan bajo problemáticas críticas que exponen a las personas:

  • Ataques por «envenenamiento» (data poisoning) y fraude masivo: los ciberdelincuentes han descubierto cómo manipular los resultados de la IA inyectando sus propios números telefónicos en los sistemas impulsados por LLM. Un informe reciente de la compañía de telecomunicaciones Virgin Media O2 reveló que millones de ciudadanos han recibido números falsos de servicio al cliente a través de herramientas de IA. Al hacerse pasar por marcas de confianza, los atacantes logran robar datos, perpetrar fraudes y atraer a las víctimas hacia estafas elaboradas. 
  • La falsa confianza: los usuarios tienden a confiar ciegamente en las respuestas rápidas y estructuradas de los chatbots, omitiendo la verificación en las fuentes oficiales de las empresas.
  • Daño colateral y acoso ciego: Personas inocentes están sufriendo las consecuencias de las «alucinaciones» de la IA. Un caso documentado por The New York Post y The Independent revelaron cómo un usuario común comenzó a recibir llamadas masivas de extraños buscando abogados, cerrajeros y diseñadores. La IA de Google había tomado su número de teléfono personal y lo estaba utilizando como «marcador de posición» para negocios locales, provocando una disrupción total en su vida diaria.

➡️ Te puede interesar: La inteligencia artificial en el Informe de Seguridad Nacional 2025: amenazas y respuestas

«Los criminales saben que la gente quiere una respuesta rápida cuando busca ayuda […], lo que pone a las personas en riesgo de llamar a un delincuente en vez de a una empresa confiable.«Murray Mackenzie, Director de Prevención de Fraude de Virgin Media O2 (Vía The Independent).

Caso práctico: perfilamiento instantáneo mediante el «Modo IA»

Para ilustrar la magnitud de esta vulnerabilidad desde una perspectiva de Ciberinteligencia Táctica, he documentado y analizado un caso real de exposición de datos utilizando primero el entorno de búsqueda tradicional sobre la obtención de información personal de una ciudadana.

A través del «Modo IA», el buscador logra perfilar de manera automática a una ciudadana (Albina Apaza xxxxxx). El sistema consolida en un resumen perfectamente estructurado su historial educativo en un instituto local, su ocupación como trabajadora independiente y su ubicación geográfica exacta. Todo esto, basándose en el rastreo automatizado de sus perfiles públicos en plataformas como LinkedIn y Facebook.

Sin embargo, el riesgo crítico de seguridad perimetral se materializa en la interacción conversacional. Al formularle al chatbot una pregunta directa y sencilla: «¿Podrías decirme su número telefónico?», la IA cruza la información estructurada con la no estructurada. El sistema asocia a la ciudadana con una antigua ficha de negocio en Google Maps y revela de manera explícita su número celular exacto (933 919 XXX).

Este caso práctico es un modelo explicativo claro y alarmante de cómo cualquier individuo, sin ser un cibercriminal avanzado ni poseer conocimientos en SOCMINT, puede utilizar la inteligencia artificial convencional para vulnerar la privacidad de un objetivo, perfilarlo y obtener una vía de contacto directo en menos de cinco segundos.

El origen: años de extracción de datos sin control

El problema de fondo no es simplemente un error de programación en los algoritmos de OpenAI, Gemini, Deepseek o Google. Como señala la firma de privacidad ClearNym, esto es «el resultado de años de prácticas desenfrenadas de intermediación de datos que se cruzan con la IA generativa«.

➡️ Te puede interesar: Armas del futuro: ¿la inteligencia artificial definirá la seguridad y la defensa del siglo XXI?

Durante más de una década, diversas organizaciones han extraído discretamente números de teléfono, direcciones y relaciones familiares de bases de datos públicas. Esta amalgama masiva de información fue vendida e inyectada en los conjuntos de entrenamiento de aprendizaje automático. Hoy, esa misma información regresa empaquetada como respuestas rápidas para millones de usuarios.

La asimetría en la defensa es evidente. Mientras que en los buscadores tradicionales un ciudadano puede apelar al «derecho al olvido«, los modelos de Inteligencia Artificial carecen de un mecanismo sencillo para «desaprender» un dato específico una vez que ha sido integrado en sus redes neuronales.

La ciberinteligencia moderna nos exige replantear nuestra huella digital. Ya no basta con tener perfiles «privados»; si un directorio comercial antiguo o un foro contiene nuestra información, la Inteligencia Artificial lo encontrará, lo procesará y, ante la pregunta correcta, lo entregará a completos desconocidos.

Aprovecho la oportunidad para compartirles que, dentro de unos días, se realizará el lanzamiento de nuestro curso Experto en SOCMINT – Nivel 02. En esta formación avanzada, no solo abordaremos a fondo la protección de datos personales, sino también cómo aplicar metodologías de búsqueda estratégica en redes sociales. El objetivo es poner a su alcance una serie de metodologías innovadoras que integran la inteligencia artificial generativa para la optimización en la toma de decisiones. Como propuesta de alto valor práctico, el curso incluirá un entorno de laboratorio exclusivo mediante la descarga de una máquina virtual plenamente preconfigurada para análisis SOCMINT.

➡️​ Si quieres adentrarte en el mundo de la Inteligencia, te recomendamos los siguientes programas formativos:

Dejar respuesta:

Por favor, introduce tu comentario!
Introduce tu nombre aquí