Por qué el aprendizaje automático no es una fórmula mágica

Cuando comenzó el levantamiento sirio hace casi 10 años, comenzaron a aparecer en las redes sociales videos tomados por ciudadanos de ataques contra ellos, como ataques químicos y bombas de barril. Si bien los investigadores internacionales de derechos humanos no pudieron ingresar al país, las personas en el terreno documentaron y compartieron lo que estaba sucediendo. Sin embargo, pronto, los videos y las fotos de las atrocidades de la guerra se eliminaron de las plataformas de redes sociales, una tendencia que ha continuado hasta el día de hoy. La académica Ashoka Hadi al-Khatib, fundadora de Syrian Archives and Mnemonic, trabaja para salvaguardar estos documentos audiovisuales para que estén disponibles como prueba para abogados, investigadores de derechos humanos, historiadores, fiscales y periodistas. A raíz de las filtraciones de Facebook, que están llamando la atención necesaria sobre el tema de la moderación de contenido y los derechos humanos, Konstanze Frischen de Ashoka se puso al día con Hadi.

Constance Frischen: Hadi, revisa y graba imágenes y videos que muestran posibles violaciones de derechos humanos, y se asegura de que los fiscales y periodistas puedan usarlos más adelante para investigar crímenes de lesa humanidad. ¿Cómo y por qué empezaste este trabajo?

Hadi al Khatib: Soy de Hama, una ciudad al norte de Damasco en Siria, donde tuvo lugar el primer levantamiento contra el gobierno sirio en 1982, y miles de personas murieron a manos del ejército sirio. Desafortunadamente, en ese momento, había muy poca documentación de lo que había sucedido. Al crecer, cuando mi familia hablaba de estos incidentes, hablaban en voz muy baja o evitaban el tema cuando les hacía preguntas. Dijeron: «cuidado, hasta las paredes tienen oídos». En 2011, durante el segundo gran levantamiento contra el gobierno sirio, la situación fue muy diferente. Inmediatamente vimos una gran cantidad de material audiovisual en las redes sociales: videos y fotos capturados por personas que primero presenciaron protestas pacíficas y luego violencia contra los manifestantes. La gente quería asegurarse de que los crímenes que presenciaron fueran documentados, a diferencia de lo que sucedió en Hama en 1982. Mi trabajo es asegurar que estos documentos capturados por personas que arriesgaron sus vidas no se pierdan y sean accesibles en el futuro.

Costos: Con la gente que publica esto en las redes sociales a gran escala, mucha gente podría estar pensando: “Está todo ahí, entonces, ¿por qué necesito que alguien más lo archive? »

al-Khatib: Si, buena pregunta. Cuando trabajamos con periodistas, fotógrafos y ciudadanos de todo el mundo, la mayoría de ellos ven las redes sociales como un lugar donde pueden archivar sus documentos de forma segura. Piensan: ‘Tenemos los archivos. Está en las redes sociales, Dropbox o Google Drive ‘. Pero no es seguro allí: una vez que estos medios se cargan en las plataformas de redes sociales, perdemos el control de ellos. Desde marzo de 2011 hasta que fundé los Archivos Sirios en 2014, las imágenes se eliminaron a gran escala, y lo siguen siendo hasta ahora, debido a las políticas de moderación de contenido de la plataforma de redes sociales. Empeoró después de 2017, cuando empresas de redes sociales como YouTube comenzaron a utilizar el aprendizaje automático para detectar automáticamente contenido que mostraba violencia.

Costos: ¿Por qué cree que se está eliminando material de las plataformas de redes sociales?

al-Kathib: Porque el algoritmo de aprendizaje automático que desarrollaron no diferencia realmente entre un video que muestra contenido extremista o contenido gráfico y un video que documenta una violación de derechos humanos. Todos se detectan y eliminan automáticamente.

Costos: Aunque tiene buenas intenciones, ¿el aprendizaje automático no puede manejar la complejidad?

al-Khatib: Exactamente. El uso del aprendizaje automático es muy peligroso para la documentación de los derechos humanos, no solo en Siria, sino en todo el mundo. Las plataformas de redes sociales deberían invertir más en inteligencia humana, y no solo en inteligencia artificial, para tomar decisiones inteligentes.

Costos: Syrian Archives, una de las organizaciones que fundó, ha archivado más de 3,5 millones de registros de contenido digital. ¿Cómo funciona en la práctica? ¿Cómo conciliar el aprendizaje automático y el trabajo manual?

al-Khatib: El primer paso es monitorear fuentes, ubicaciones y palabras clave específicas alrededor de eventos actuales o históricos. Una vez que se descubre el contenido, nos aseguramos de guardarlo automáticamente, lo más rápido posible. Siempre es nuestra prioridad. Cada uno de los 3,5 millones de registros que hemos recopilado son de plataformas de redes sociales, sitios web o aplicaciones como Telegram. Los archivamos todos de tal manera que garanticemos la disponibilidad, accesibilidad y autenticidad de estos documentos. Estamos utilizando el aprendizaje automático con el proyecto VFRAME para ayudarnos a descubrir qué tenemos en los archivos que es más relevante para las investigaciones de derechos humanos, los informes periodísticos o la creación de archivos legales dentro de este gran grupo de medios. Luego verificamos manualmente el lugar, la fecha y la hora. También verificamos cualquier tipo de objeto que podamos ver en el video, y nos aseguramos de que podamos vincularlo a otras piezas de medios archivados y corroborarlo con otro tipo de evidencia, para construir un «incidente verificado». También utilizamos la cadena de bloques para sellar los materiales con el tiempo, con una empresa externa llamada Enigio. Queremos proporcionar accesibilidad segura y a largo plazo a los documentos y autenticarlos de una manera que demuestre que no hemos manipulado el material durante el proceso de archivo.

Costos: El aprendizaje automático es excelente para analizar grandes conjuntos de datos, pero luego se debe usar el juicio humano y el conocimiento profundo de la historia, la política y la región.

al-Khatib: Exactamente. El conocimiento del contexto, el idioma y la historia es vital para la verificación. Se trata de un proceso manual en el que los investigadores utilizan determinadas herramientas y técnicas para verificar la ubicación, fecha y hora de cada grabación y asegurarse de que estén agrupadas en incidentes. Estos incidentes también se agrupan en colecciones para formar una mejor comprensión del patrón de violencia y su impacto en las personas.

Costos: Estos hallazgos pueden, a su vez, ser explotados: usted proporciona los resultados de sus investigaciones a gobiernos y fiscales. ¿Cuál fue el impacto?

al-Khatib: Sabemos que cualquier responsabilidad legal va a llevar mucho tiempo. Uno de los principales casos legales en los que estamos trabajando actualmente se refiere al uso de armas químicas en Siria. Nos centramos en dos incidentes en dos lugares de Siria, Eastern Ghouta (2013) y Khan Sheikhoun (2017), donde vimos los mayores usos de armas químicas (es decir, gas Sarin) en la historia reciente. Presentamos una denuncia ante los fiscales de Alemania, Francia y Suecia en colaboración con el Centro Sirio para los Medios de Comunicación y la Libertad de Expresión, defensores de los derechos civiles y la Open Society Justice Initiative. Parte de esa presentación fue evidencia de los medios verificada y recopilada por los archivos sirios. Nuestras investigaciones sobre la cadena de suministro de productos químicos sirios han dado lugar a la condena de tres empresas belgas que violaron las sanciones de la Unión Europea, una auditoría interna del sistema aduanero belga, investigaciones parlamentarias en varios países, un cambio en las leyes suizas sobre exportaciones para reflejar las sanciones de la Unión Europea. leyes sobre productos químicos específicos y la presentación de quejas instando a los gobiernos alemán y belga a iniciar investigaciones sobre los envíos adicionales a Siria.

Costos: Guau. Permítanme volver a la eliminación automática de contenido en las plataformas de redes sociales: cuando eso sucede, es decir, cuando se elimina la evidencia de las atrocidades del gobierno, eso abre ventanas de oportunidad para que actores como el gobierno sirio inunden las redes sociales con otras imágenes positivas. , y así obtener las noticias?

al-Khatib: Si absolutamente. Durante los últimos 10 años, hemos visto este tipo de propaganda informativa proveniente de todos los lados del conflicto en Siria. Y nuestro papel dentro de este entorno de información es contrarrestar la desinformación archivando, recopilando y verificando material visual para reconstruir lo que realmente sucedió y garantizar que esta reconstrucción se base en hechos. Y lo hacemos de forma transparente, para que todos puedan ver nuestra metodología y las herramientas que utilizamos.

Costos: ¿Cómo están reaccionando las grandes empresas de redes sociales? ¿Los ve como colaborativos o distantes?

al-Khatib: Muchas organizaciones de la sociedad civil de todo el mundo se han comprometido con empresas de redes sociales y les han pedido que inviertan más recursos en este tema. Hasta ahora nada ha cambiado. El uso del aprendizaje automático aún está en curso. Todavía se está eliminando una gran cantidad de contenido relacionado con la documentación de derechos humanos. Pero ha habido un compromiso y una colaboración absolutos a lo largo de los años, especialmente desde 2017. Hemos trabajado con YouTube, por ejemplo, para restaurar algunos de los canales que se han eliminado, así como miles de videos publicados por organizaciones de defensa. Derechos humanos y medios creíbles En Siria. . Pero, lamentablemente, gran parte de esta documentación aún se está eliminando. Las filtraciones de Facebook revelan que la compañía estaba al tanto del problema, pero continúa utilizando el aprendizaje automático, borrando el historial y la memoria de personas de todo el mundo.

Costos: ¿Cómo se asegura el bienestar de los humanos involucrados en la recopilación y clasificación de contenido violento y traumático?

al-Khatib: Esta es una pregunta muy importante. Necesitamos asegurarnos de que existe un sistema de apoyo para todos los investigadores que revisan este contenido: asistencia práctica de psicólogos que comprenden todos los desafíos y alivian algunos. Estamos implementando protocolos para que los investigadores tengan acceso a los expertos. También se están realizando esfuerzos técnicos. Por ejemplo, estamos trabajando con el aprendizaje automático para mezclar las imágenes desde el principio, de modo que los investigadores no vean las imágenes gráficas directamente en sus pantallas. Esto es algo en lo que queremos trabajar más.

Costos: ¿Qué te da esperanza?

al-Khatib: La voluntad de quienes se enfrentan directamente a la violencia y de los familiares de las víctimas. Ya sea en Siria o en otros países, todavía tienen que asumir la responsabilidad que merecen, pero lo que sea, lo piden, luchan por ello. Esto es lo que me da esperanza: trabajar con ellos, agregar valor al vincular la documentación con la justicia y la rendición de cuentas, y utilizar este proceso para reconstruir el futuro del país nuevamente.

Hadi al Khatib (@Keep_Twitter) es el fundador de Archivos sirios y su organización paraguas Mnemotécnico.

Esta conversación ha sido condensada y editada. Mira el conversación completa & navegar más Conocimientos sobre tecnología y humanidad.

Artículo anterior6 consejos de planificación fiscal de fin de año para 2021
Artículo siguienteLas compañías de préstamos para estudiantes pueden ser engañosas sobre la condonación de préstamos, advierten los abogados

Dejar respuesta

Please enter your comment!
Please enter your name here