Filtro automático para copyright: ¿un riesgo para la libertad en la Red?

Hace ya unos años que se debate sobre la reforma del derecho de autor de la Unión Europea. Además del artículo 11, donde se trata el derecho afín para editoriales de prensa, el artículo 13 también ha sido muy polémico pues trata de obligar a las plataformas de Internet a utilizar filtros automáticos de copyright. Si bien los defensores de esta reforma consideran al filtro un elemento fundamental para garantizar los derechos de autor de películas, música y textos, los más escépticos temen que se produzca un debilitamiento de la cibercultura y una disminución del derecho a la libertad de expresión, con consecuencias imprevisibles.

¿Qué son realmente estos filtros automáticos de copyright y cómo funcionan? ? ¿Se llevará a cabo esta reforma?

Filtros automáticos de copyright: próximamente, una realidad

Todo indica que, con una alta probabilidad, el ampliamente discutido artículo 13 en torno al filtro automático de copyright acabará por aplicarse. Aprobado el texto final para la reforma del derecho de autor en la UE por los representantes del Parlamento, la Comisión y los Estados miembros de la UE, toca ahora al Parlamento Europeo discutirlo y aprobarlo, si bien no se esperan demasiadas sorpresas. Dado que las tres instituciones han convenido en esta versión del documento, sería inusual que ahora el Parlamento la rechazara. Esto, sin embargo, no impide a los sectores más críticos de la reforma seguir encontrando argumentos en contra de los filtros de copyright y, además de peticiones de firmas online, también planean llevar la protesta a las calles de la Unión.

La discusión sobre la reforma europea de los derechos de autor hasta hoy

Los filtros automáticos de copyright han estado focalizando el debate legislativo en la Unión Europea, porque podrían desempeñar un rol central en el marco de los derechos de autor en el mercado interior digital. El pasado mes de julio de 2018 el Parlamento Europeo rechazó un borrador de la ley que volvió a presentarse a votación el 12 de septiembre, esta vez con algunas modificaciones. En esta nueva versión las condiciones solo aplicarían a los grandes proveedores, liberando a los de menor envergadura, así como a las enciclopedias digitales como Wikipedia, de la obligación de pasar examen a sus contenidos.

En el contexto que nos ocupa, el artículo 13 del borrador es especialmente relevante, aun cuando ni en él ni en otro lugar del documento se menciona explícitamente al filtro automático de copyright. El nuevo borrador no indica a los propietarios y gestores de páginas web cómo han de garantizar el mantenimiento de los derechos de autor. No obstante, los críticos y los observadores excluyen de facto cualquier otra posibilidad que no sea –tal y como el propio borrador de ley indica– la siguiente: las plataformas han de examinar todo el contenido antes de publicarlo para excluir cualquier infracción de los derechos de autor y, debido al enorme volumen de datos que esto implica, se hace necesario utilizar un filtro automático.

Aprobado en esta nueva votación por el Parlamento Europeo con 438 votos a favor (226 en contra y 39 abstenciones), el borrador se sometió a debate en el denominado Trilog, donde los representantes del Parlamento, enviados de las Comisiones de la UE y el Consejo de los Estados miembros se reunieron para acordar la versión final del texto de la reforma. El mismo día de la votación, la Comisión Europea presentó otra directriz diferente en la que también tienen un papel central los filtros automáticos: en el contexto de la lucha contra el terrorismo, las plataformas en Internet estarían obligadas en el futuro a comprobar si el contenido que publican muestra indicios de propaganda terrorista. Lo que esta propuesta no contiene es una excepción para pequeños operadores o plataformas de código abierto. Por lo que, en última instancia, con esta normativa sí sería necesaria la implementación universal de los filtros automáticos de copyright.

¿Qué es un filtro automático para copyright?

Un filtro automático de copyright es un programa informático automatizado encargado de escanear los datos cuando se suben a la Red antes de su publicación en una plataforma. Con esto se pretende comprobar que cumplen con determinados criterios. Si el programa detecta que algunos de los contenidos subidos no concuerdan con las reglas prestablecidas, este lo bloquea, impide al usuario abrir la información o adapta el contenido para que no infrinja ninguna de las normas. Los filtros pueden instalarse en páginas web o en aplicaciones individuales, aunque también pueden ser utilizados por los proveedores de hosting o por los suministradores de Internet del usuario. Pueden utilizarse, entre otros, con los siguientes fines:

  • reducir contenido de ideología extremista o pensamiento criminal,
  • limitar las denuncias falsas, los insultos y el acoso cibernético,
  • filtrado de contenido pornográfico y apología a la violencia,
  • identificación de material protegido por derechos de autor,
  • podría aplicarse censura en caso de uso ilícito

Este último punto es una de las cosas por las que, en la actualidad, se debate sobre reformar la directiva sobre los derechos de autor en la Unión Europea e incluir el filtro automático de copyright.

¿Cómo funcionan los filtros para copyright?

Para poder gestionar un filtro son necesarios dos componentes: una base de datos y funciones hash. Por un lado, la base de datos es indispensable pues contiene todos los datos no aceptados. En el caso de la reforma planteada por la UE, la base de datos estaría formada por todo el material protegido por derechos de autor que se almacenaría como funciones hash.

Hecho

Las funciones hash o funciones de resumen unidireccionales consisten en cadenas cortas de letras y cifras, generadas por una función matemática a partir de una entrada. Aunque con una misma entrada se produce siempre una misma función hash, no es posible acceder a la información de entrada a partir de la función. Las funciones hash se usan, por ejemplo, para el almacenamiento de contraseñas.

El algoritmo se encarga de comparar las funciones de resumen del material protegido con los datos que se suben y, en caso de encontrar alguna superposición, impide la carga del archivo. No obstante, los filtros no solo están activos para identificar material idéntico o muy similar al almacenado en la base de datos, pues a través de métodos relacionados con el machine learning también son capaces de reconocer componentes individuales en una imagen, en una película, en una pieza de música o en un texto. Además, gracias al aprendizaje automático los filtros pueden reconocer elementos no almacenados en la base de datos. Si el algoritmo aprende a reconocer qué apariencia tiene un gato a partir de las imágenes de este animal guardadas en una base de datos, podrá identificar a un gato en cualquier otra imagen no almacenada.

¿Dónde se usan estos filtros en la actualidad?

La obligación de introducir de forma generalizada el filtro automático para copyright supondría un paso importante. No obstante, las grandes empresas de Internet usan esta tecnología desde hace años para poder comprobar las ingentes cantidades de datos que se suben a diario a las plataformas.

YouTube

Content ID, el filtro automático de la plataforma de video de YouTube, comprueba si los videos subidos cumplen los derechos de autor. En caso de que se detecte algún contenido que los infrinja, los propietarios de los derechos de autor tienen tres posibilidades:

  • Bloquear el video: se elimina y ya no se puede acceder a él.
  • Obtener ingresos: delante del vídeo en cuestión se pone publicidad cuyos ingresos van a parar al titular de los derechos.
  • Hacer un seguimiento: se informa continuamente al autor o poseedor de los derechos de la cifra de visitas y otros datos.

Con este sistema se intenta evitar la difusión no autorizada de películas, series, canciones o videoclips. Según YouTube la actividad del algoritmo requeriría el trabajo de 180 000 personas.

Facebook

La red social por antonomasia recurre a estos filtros para identificar comentarios, imágenes o videos violentos, no aptos para menores o de naturaleza ofensiva antes de que se publiquen. Para poder luchar contra contenido terrorista o extremista, Facebook, Twitter, Microsoft y YouTube tienen acceso a una misma base de datos que se gestiona en colaboración con la Europol, es decir, la Oficina Europea de Policía.

Microsoft OneDrive

El servicio de alojamiento analiza automáticamente los archivos cuando se cargan en la nube. Entre otras cosas este proceso, llamado PhotoDNA, sirve para luchar contra la pornografía infantil.

ResearchGate

La red social para investigadores tuvo que introducir un filtro por presiones de los editores y autores de los textos. Con esta tecnología se pretende identificar segundas publicaciones no autorizadas o plagios. El algoritmo decide si las publicaciones se ofrecen a todos los usuarios, si se presentan solo a algunos  grupos o si directamente deben elimarse.

¿Por qué se critica a los filtros automáticos de copyright?

Aunque en un principio estos filtros pueden ser vistos con buenos ojos por contribuir en la lucha contra la pornografía infantil, las posiciones extremistas y las infracciones de los derechos de autor, su uso también conlleva algunos riesgos considerables. Los detractores de la implantación de la nueva reforma de los derechos de autor advierten de que los filtros de copyright son susceptibles de errores y manipulación y pueden contribuir a la supresión de material no censurable.

Susceptible a errores y manipulación

Con la puesta en práctica de estos filtros se ha demostrado que los algoritmos están lejos de no cometer ningún error. En primer lugar, es relativamente fácil engañar al algoritmo para poder pasar por el filtro material protegido. Aunque lo que resulta más preocupante es que los mismos programas informáticos censuren contenido que no infrinja derechos de autor, por ejemplo, al no diferenciar que ciertas parodias, remixes o páginas de inicio sí están protegidas. Los detractores también hablan de una restricción de la libertad artística y predicen el final de la cultura meme, pues fenómenos de Internet, como este mencionado, se basan a menudo en utilizar contenido protegido por los derechos de autor en un nuevo contexto, modificarlo y ponerlo de nuevo a disposición en la Red.

Sin olvidar que también es posible que sujetos con intenciones fraudulentas reclamen la posesión de los derechos de autor de cierto contenido (a pesar de no tenerlos) y los introduzcan en una base de datos. La distribución de contenido, que en realidad no está protegido por ningún derecho, no sería posible hasta que se aclarasen los hechos.

Posibilidad de censura

Los filtros automáticos de copyright generan una infraestructura que también se puede usar para el control estatal de la información y la censura. Además, en las manos equivocadas, esta tecnología podría contribuir a limitar la libertad de expresión y la libertad de prensa. Y es que, si las bases de datos en vez de proveerse del material protegido, se llenasen de contenido con críticas al gobierno, los filtros interceptarían esta información al ser subida por los usuarios, impidiendo su publicación en la Red. De hecho, esta aplicación se puede observar en la actualidad en China, pues en el uso de Internet intervienen este tipo de filtros.

¿Cuál es el debate actual de los filtros de copyright?

La reforma que se pretende realizar en la directiva sobre los derechos de autor de la UE ha provocado que el público conozca con mayor profundidad en qué consisten los filtros de carga, aunque son especialmente los titulares de derechos, como editores, distribuidores de películas y la industria musical, los que piden una mayor protección de las obras protegidas en los canales de distribución digital. También requieren bloquear la distribución no autorizada de este material, como ya ocurre en portales como YouTube.

Pero, por otro lado, también hay activistas de Internet, activistas civiles, asociaciones , gestores de Wikipedia y voces dentro del ámbito político, que se oponen a la implantación de este filtro. Aunque están a favor del objetivo de la ley, este es, la protección de la propiedad intelectual, advierten que los filtros de protección de copyright no son en absoluto la solución: van más allá del objetivo, no están del todo preparados desde un punto de vista técnico y suponen un peligro para la libertad de expresión.

Por favor, ten en cuenta el aviso legal relativo a este artículo.