Filtro automático para copyright: ¿un riesgo para la libertad en la Red?

Hace ya unos años que se debate sobre la reforma del derecho de autor de la Unión Europea. Además del derecho afín para editoriales de prensa, el artículo 17 (antes artículo 13) también ha sido muy polémico, pues trata de obligar a las plataformas de Internet a utilizar filtros automáticos de copyright. Si bien los defensores de esta reforma consideran al filtro un elemento fundamental para garantizar los derechos de autor de películas, música y textos, los más escépticos temen que se produzca un debilitamiento de la cibercultura y una disminución del derecho a la libertad de expresión, con consecuencias imprevisibles. ¿Qué son realmente estos filtros automáticos de copyright y cómo funcionan? ¿Se llevará a cabo esta reforma?

La Unión Europea aprueba los filtros automáticos de copyright

Pese al desacuerdo masivo y las protestas, el Parlamento Europeo ha aprobado el 26 de marzo de 2019 la entrada en vigor de la reforma de los Derechos de autor. Poco antes, los contrarios a la reforma intentaron en vano influir en la opinión de los parlamentarios por medio de acciones públicas de protesta en las que se reunieron en múltiples manifestaciones repartidas por todo el territorio europeo durante el fin de semana anterior a las votaciones, que finalmente resultaron en 384 votos a favor, 274 en contra y 36 abstenciones.

Con este resultado, también se aprueba el polémico artículo 17, dedicado al filtrado de contenido y que aún se conoce por su antigua denominación como artículo 13. Si bien la directiva no prescribe de forma explícita la aplicación de estos filtros automáticos, en la realidad las formulaciones no dejan mucho margen a otras opciones. En ella se exige que los gestores de las plataformas comprueben, antes de publicar cualquier contenido de vídeo, música o texto, si infringe los Derechos de autor. Si a partir de ahora no lo hacen, se convierten en responsables de las infracciones. Lo que sería practicable en plataformas manejables a mano, es completamente utópico en plataformas de la envergadura de YouTube.

Eso sí, la directiva admite una exención para enciclopedias digitales, Wikipedia a la cabeza, u otras ofertas de orientación educativa, plataformas para el desarrollo de software de código abierto y servicios con menos de tres años de vigencia o con un volumen de negocio anual por debajo de los diez millones de euros.

Queda por ver cuál será la estrategia de grandes proveedores como Google o Facebook. Formalmente la reforma aún ha de aprobarse en el Consejo Europeo, aunque no se esperan sorpresas, dado que se trata de un puro formalismo legal. La cita tendrá lugar a comienzos de abril. Después deberá aplicarse en los Derechos nacionales. Los Estados miembro de la UE tendrán dos años de plazo para asumir la reforma en su propia legislación.

La discusión sobre la reforma europea de los derechos de autor hasta hoy

Los filtros automáticos de copyright han estado focalizando el debate legislativo en la Unión Europea, porque podrían desempeñar un rol central en el marco de los derechos de autor en el mercado interior digital. El pasado mes de julio de 2018 el Parlamento Europeo rechazó un borrador de la ley que volvió a presentarse a votación el 12 de septiembre, esta vez con algunas modificaciones. En esta nueva versión las condiciones solo aplicarían a los grandes proveedores, liberando a los de menor envergadura, así como a las enciclopedias digitales como Wikipedia, de la obligación de pasar examen a sus contenidos.

En el contexto que nos ocupa, el artículo 13 del borrador (que en la versión final pasó a convertirse en el artículo 17) es especialmente relevante, aun cuando ni en él ni en otro lugar del documento se menciona explícitamente al filtro automático de copyright. El nuevo borrador no indica a los propietarios y gestores de páginas web cómo han de garantizar el mantenimiento de los derechos de autor. No obstante, los críticos y los observadores excluyen de facto cualquier otra posibilidad que no sea –tal y como el propio borrador de ley indica– la siguiente: las plataformas han de examinar todo el contenido antes de publicarlo para excluir cualquier infracción de los derechos de autor y, debido al enorme volumen de datos que esto implica, se hace necesario utilizar un filtro automático.

Aprobado en una nueva votación por el Parlamento Europeo con 438 votos a favor (226 en contra y 39 abstenciones), el borrador se sometió a debate en el denominado Trilog, donde los representantes del Parlamento, enviados de las Comisiones de la UE y el Consejo de los Estados miembros se reunieron para acordar la versión final del texto de la reforma. El mismo día de la votación, la Comisión Europea presentó otra directriz diferente en la que también pueden tener un papel central los filtros automáticos: en el contexto de la lucha contra el terrorismo, las plataformas en Internet estarían obligadas en el futuro a comprobar si el contenido que publican muestra indicios de propaganda terrorista. Lo que esta propuesta no contiene es una excepción para pequeños operadores o plataformas de código abierto. Por lo que, en última instancia, con esta normativa sí sería necesaria la implementación universal de los filtros automáticos de copyright.

¿Qué es un filtro automático para copyright?

Un filtro automático de copyright es un programa informático automatizado encargado de escanear los datos cuando se suben a la Red antes de su publicación en una plataforma. Con esto se pretende comprobar que cumplen con determinados criterios. Si el programa detecta que algunos de los contenidos subidos no concuerdan con las reglas prestablecidas, este lo bloquea, impide al usuario abrir la información o adapta el contenido para que no infrinja ninguna de las normas. Los filtros pueden instalarse en páginas web o en aplicaciones individuales, aunque también pueden ser utilizados por los proveedores de hosting o por los suministradores de Internet del usuario. Pueden utilizarse, entre otros, con los siguientes fines:

  • reducir contenido de ideología extremista o pensamiento criminal,
  • limitar las denuncias falsas, los insultos y el acoso cibernético,
  • filtrado de contenido pornográfico y apología a la violencia,
  • identificación de material protegido por derechos de autor,
  • podría aplicarse censura en caso de uso ilícito

Este último punto es una de las cosas por las que, en la actualidad, se debate sobre reformar la directiva sobre los derechos de autor en la Unión Europea e incluir el filtro automático de copyright.

¿Cómo funcionan los filtros para copyright?

Para poder gestionar un filtro son necesarios dos componentes: una base de datos y funciones hash. Por un lado, la base de datos es indispensable pues contiene todos los datos no aceptados. En el caso de la reforma planteada por la UE, la base de datos estaría formada por todo el material protegido por derechos de autor que se almacenaría como funciones hash.

Hecho

Las funciones hash o funciones de resumen unidireccionales consisten en cadenas cortas de letras y cifras, generadas por una función matemática a partir de una entrada. Aunque con una misma entrada se produce siempre una misma función hash, no es posible acceder a la información de entrada a partir de la función. Las funciones hash se usan, por ejemplo, para el almacenamiento de contraseñas.

El algoritmo se encarga de comparar las funciones de resumen del material protegido con los datos que se suben y, en caso de encontrar alguna superposición, impide la carga del archivo. No obstante, los filtros no solo están activos para identificar material idéntico o muy similar al almacenado en la base de datos, pues a través de métodos relacionados con el machine learning también son capaces de reconocer componentes individuales en una imagen, en una película, en una pieza de música o en un texto. Además, gracias al aprendizaje automático los filtros pueden reconocer elementos no almacenados en la base de datos. Si el algoritmo aprende a reconocer qué apariencia tiene un gato a partir de las imágenes de este animal guardadas en una base de datos, podrá identificar a un gato en cualquier otra imagen no almacenada.

¿Dónde se usan estos filtros en la actualidad?

La obligación de introducir de forma generalizada el filtro automático para copyright supondría un paso importante. No obstante, las grandes empresas de Internet usan esta tecnología desde hace años para poder comprobar las ingentes cantidades de datos que se suben a diario a las plataformas.

YouTube

Content ID, el filtro automático de la plataforma de video de YouTube, comprueba si los videos subidos cumplen los derechos de autor. En caso de que se detecte algún contenido que los infrinja, los propietarios de los derechos de autor tienen tres posibilidades:

  • Bloquear el video: se elimina y ya no se puede acceder a él.
  • Obtener ingresos: delante del vídeo en cuestión se pone publicidad cuyos ingresos van a parar al titular de los derechos.
  • Hacer un seguimiento: se informa continuamente al autor o poseedor de los derechos de la cifra de visitas y otros datos.

Con este sistema se intenta evitar la difusión no autorizada de películas, series, canciones o videoclips. Según YouTube la actividad del algoritmo requeriría el trabajo de 180 000 personas.

Facebook

La red social por antonomasia recurre a estos filtros para identificar comentarios, imágenes o videos violentos, no aptos para menores o de naturaleza ofensiva antes de que se publiquen. Para poder luchar contra contenido terrorista o extremista, Facebook, Twitter, Microsoft y YouTube tienen acceso a una misma base de datos que se gestiona en colaboración con la Europol, es decir, la Oficina Europea de Policía.

Microsoft OneDrive

El servicio de alojamiento analiza automáticamente los archivos cuando se cargan en la nube. Entre otras cosas este proceso, llamado PhotoDNA, sirve para luchar contra la pornografía infantil.

ResearchGate

La red social para investigadores tuvo que introducir un filtro por presiones de los editores y autores de los textos. Con esta tecnología se pretende identificar segundas publicaciones no autorizadas o plagios. El algoritmo decide si las publicaciones se ofrecen a todos los usuarios, si se presentan solo a algunos  grupos o si directamente deben elimarse.

¿Por qué se critica a los filtros automáticos de copyright?

Aunque en un principio estos filtros pueden ser vistos con buenos ojos por contribuir en la lucha contra la pornografía infantil, las posiciones extremistas y las infracciones de los derechos de autor, su uso también conlleva algunos riesgos considerables. Los detractores de la implantación de la nueva reforma de los derechos de autor advierten de que los filtros de copyright son susceptibles de errores y manipulación y pueden contribuir a la supresión de material no censurable.

Susceptible a errores y manipulación

Con la puesta en práctica de estos filtros se ha demostrado que los algoritmos están lejos de no cometer ningún error. En primer lugar, es relativamente fácil engañar al algoritmo para poder pasar por el filtro material protegido. Aunque lo que resulta más preocupante es que los mismos programas informáticos censuren contenido que no infrinja derechos de autor, por ejemplo, al no diferenciar que ciertas parodias, remixes o páginas de inicio sí están protegidas. Los detractores también hablan de una restricción de la libertad artística y predicen el final de la cultura meme, pues fenómenos de Internet, como este mencionado, se basan a menudo en utilizar contenido protegido por los derechos de autor en un nuevo contexto, modificarlo y ponerlo de nuevo a disposición en la Red.

Sin olvidar que también es posible que sujetos con intenciones fraudulentas reclamen la posesión de los derechos de autor de cierto contenido (a pesar de no tenerlos) y los introduzcan en una base de datos. La distribución de contenido, que en realidad no está protegido por ningún derecho, no sería posible hasta que se aclarasen los hechos.

Posibilidad de censura

Los filtros automáticos de copyright generan una infraestructura que también se puede usar para el control estatal de la información y la censura. Además, en las manos equivocadas, esta tecnología podría contribuir a limitar la libertad de expresión y la libertad de prensa. Y es que, si las bases de datos en vez de proveerse del material protegido, se llenasen de contenido con críticas al gobierno, los filtros interceptarían esta información al ser subida por los usuarios, impidiendo su publicación en la Red. De hecho, esta aplicación se puede observar en la actualidad en China, pues en el uso de Internet intervienen este tipo de filtros.

¿Cuál es el debate actual de los filtros de copyright?

La reforma que se pretende realizar en la directiva sobre los derechos de autor de la UE ha provocado que el público conozca con mayor profundidad en qué consisten los filtros de carga, aunque son especialmente los titulares de derechos, como editores, distribuidores de películas y la industria musical, los que piden una mayor protección de las obras protegidas en los canales de distribución digital. También requieren bloquear la distribución no autorizada de este material, como ya ocurre en portales como YouTube.

Pero, por otro lado, también hay activistas de Internet, activistas civiles, asociaciones , gestores de Wikipedia y voces dentro del ámbito político, que se oponen a la implantación de este filtro. Aunque están a favor del objetivo de la ley, este es, la protección de la propiedad intelectual, advierten que los filtros de protección de copyright no son en absoluto la solución: van más allá del objetivo, no están del todo preparados desde un punto de vista técnico y suponen un peligro para la libertad de expresión.

Por favor, ten en cuenta el aviso legal relativo a este artículo.