Leaked data exposes a Chinese AI censorship machine

## El Gran Cortafuegos 2.0: La IA al Servicio de la Censura en China - Filtración Revela la Sofisticación del Sistema Pekín, China – 15 de noviembre de 2023 – Una filtración masiva de datos, revelada el pasado 5 de noviembre por TechCrunch y analizada por expertos en censura china, ha destapado...

Imagen por Photo By: Kaboompics.com en Pexels

El Gran Cortafuegos 2.0: La IA al Servicio de la Censura en China - Filtración Revela la Sofisticación del Sistema

Pekín, China – 15 de noviembre de 2023 – Una filtración masiva de datos, revelada el pasado 5 de noviembre por TechCrunch y analizada por expertos en censura china, ha destapado la compleja maquinaria interna de un sofisticado sistema de censura online impulsado por inteligencia artificial (IA) en China. Este sistema, entrenado con una base de datos de más de 133,000 ejemplos de contenido considerado "sensible" por el gobierno, representa un salto cualitativo en la capacidad del régimen para controlar la narrativa online y silenciar la disidencia. La base de datos, cuya autenticidad ha sido verificada por investigadores de la Universidad de Toronto, Citizen Lab, ofrece una visión preocupante del futuro de la libertad de expresión en el país.

Un Algoritmo de Represión: El Aprendizaje Automático al Servicio de la Censura

La base de datos filtrada contiene ejemplos de texto y código utilizados para entrenar Modelos de Lenguaje de Gran Tamaño (LLM, por sus siglas en inglés). Estos ejemplos, que abarcan desde críticas a la gestión gubernamental de la pandemia del COVID-19 hasta debates sobre la situación en Hong Kong y Xinjiang, pasando por menciones a líderes políticos como Xi Jinping, demuestran la amplitud y la sofisticación de la censura automatizada en China. A diferencia de los métodos tradicionales basados en palabras clave, este sistema de IA puede identificar y marcar contenido sensible con una precisión y granularidad sin precedentes, analizando el contexto y el significado subyacente del texto.

“Esta filtración ofrece una visión escalofriante del futuro distópico de la libertad de expresión en China”, afirma Xiao Qiang, investigador de la Universidad de California en Berkeley y director del Counter-Power Lab. “El uso de la IA para automatizar la censura no solo incrementa la eficiencia de la represión, sino que también dificulta la elusión de los controles gubernamentales, creando un ambiente de autocensura generalizada.”

Más Allá de las Palabras Clave: La Comprensión del Contexto

El sistema de IA no se limita a la simple detección de palabras clave. El modelo se entrena con ejemplos de frases, párrafos e incluso artículos completos para comprender el contexto y el significado subyacente del contenido. Esto permite al sistema identificar contenido "sensible" incluso en ausencia de términos explícitamente prohibidos, lo que dificulta predecir qué tipo de contenido será censurado.

“El sistema busca patrones y relaciones semánticas para identificar contenido que pueda ser considerado subversivo o perjudicial para la estabilidad social, según la definición del Partido Comunista Chino,” explica Michael Caster, experto en derechos digitales de Article 19. “Este enfoque basado en el contexto representa una amenaza significativa para la libertad de expresión.”

“Trabajo de Opinión Pública”: La Propaganda como Herramienta de Control

La base de datos filtrada incluye referencias al "trabajo de opinión pública," un eufemismo utilizado por el gobierno chino para describir sus esfuerzos de propaganda y manipulación de la opinión pública. Este hallazgo sugiere que el sistema de IA no solo se utiliza para censurar contenido "sensible", sino también para promover una narrativa oficial y controlar la información.

El Caso de Taiwán: Un Punto Crítico en la Narrativa China

El análisis de la base de datos revela que la mención de Taiwán (台湾) aparece más de 15,000 veces, incluyendo variaciones como "independencia de Taiwán" (台湾独立) y "República de China" (中華民國), lo que subraya la extrema sensibilidad de este tema para Pekín. Cualquier contenido que se desvíe de la narrativa oficial sobre la isla es rápidamente censurado. Se encontraron ejemplos específicos de contenido censurado que datan de junio de 2022, relacionados con la visita de Nancy Pelosi, entonces presidenta de la Cámara de Representantes de Estados Unidos, a Taiwán.

Implicaciones Globales y la Necesidad de una Respuesta Internacional

El caso de China no es un hecho aislado. El desarrollo de la IA generativa y los modelos de lenguaje plantea una seria amenaza para la libertad de expresión a nivel global. Regímenes autoritarios podrían adoptar tecnologías similares para controlar la información y reprimir la disidencia.

Organizaciones como Human Rights Watch y Amnistía Internacional han expresado su preocupación por el uso de la IA para la censura en China y en otros países. Rebecca MacKinnon, de Ranking Digital Rights, ha señalado la responsabilidad de las empresas tecnológicas en prevenir el uso indebido de sus productos. Adrian Shahbaz, de Freedom House, ha instado a la comunidad internacional a presionar a los gobiernos para que respeten el derecho a la libertad de expresión en el entorno digital.

La lucha contra la censura impulsada por IA es un desafío crucial para la defensa de los derechos humanos en el siglo XXI. La libertad de expresión en el entorno digital está en juego.

(Fuentes: TechCrunch (5 de noviembre de 2023), Citizen Lab (Universidad de Toronto), Human Rights Watch, Amnistía Internacional, Ranking Digital Rights, Freedom House, entrevistas con Xiao Qiang (Universidad de California, Berkeley) y Michael Caster (Article 19).)