De todas las novedades jurídicas que aporta la generación de Inteligencia Artificial en nuestros días, una de los más complicadas de resolver y, sin lugar a duda, una de los más apasionantes, es encontrar el límite entre creación artificial y creación humana.
Ese margen frágil e inestable, está generando ríos de tinta con la llegada de los nuevos modelos de LLMS que son capaces, por medio de sencillos prompts, de producir “obras de arte” con una calidad sorprendente, incluso para los propios profesionales de la materia.
Que la jurisprudencia y la legislación internacional es antropocentrista —en cuanto defiende y valora tan solo las obras generadas por el ser humano, o aquellas partes de las obras que han sido generadas por el ser humano—, resulta evidente.
Que hay una protección internacional ante las obras de creación humana, incluso a la hora de registrarlas, también. Prueba de ello son las sentencias y los registros que se rechazan por no encontrar en algunas obras vestigios de autoría suficientes.
Pero el verdadero problema no surge a la hora de presentar un registro en una oficina de propiedad intelectual, ni en una entidad de gestión de derechos.
Estas entidades cuentan con protocolos que —más o menos completos y acertados—, deciden qué material es de autoría humana, híbrida o exclusivamente artificial.
El problema surge antes, en el momento de la creación. En ese instante en que prende la chispa creativa y se plasma en un pentagrama en forma de canción, en un folio en forma de ensayo antropológico o en un lienzo en forma de imagen con estilo abstracto.
MIGRACIÓN CREATIVA AL ENTORNO DIGITAL
Tengamos en cuenta que hoy la partitura, el folio y el lienzo han migrado al entorno digital. Ya no aportan textura, peso ni olor; no estimulan otro sentido que la vista y el oído.
La experiencia de trazar un garabato con una pluma sobre papel verjurado es, para la inmensa mayoría, una rareza. El soporte de la creación se ha desmaterializado y la fijación del resultado sucede en la pantalla, mediante editores de partituras, de texto o de imagen, que concentran el gesto creativo en archivos y metadatos, pero no en material tangible.
Word, Photoshop y ProTools son los nuevos pinceles con los que los autores generan bocetos perfectos, redactan manuscritos sin tachones y componen maquetas impecables. Pero esa perfección tiene un precio, quedarnos sin versiones, manuscritos ni bocetos del trabajo.
Se debilita así la imputación creativa, se complica la cadena de titularidad y se pierde material crítico para la investigación, la docencia y la memoria del oficio.
La buena noticia es que estas mismas herramientas permiten hacer visible una completa trazabilidad si se configuran bien para hacer control de versiones, guardado incremental, exportación de historial de cambios, captura de metadatos (fecha, autor, plugins, fuentes) y, cuando media IA, registro de prompts y ediciones. Así, los “pinceles digitales” no solo sirven para lograr un resultado perfecto, sino también para documentar el proceso, protegiendo la autoría y enriqueciendo el legado creativo.
DICCIONARIO DE IA Y PROPIEDAD INTELECTUAL
En medio del laberinto conceptual abierto por la inteligencia artificial, surge un léxico técnico y un ecosistema de categorías que conviene dominar para comprender un escenario de cambios vertiginosos.
No se trata solo de nuevos conceptos, sino de marcos operativos que, reubicados por la IA, inciden en la creación, la autoría y la circulación de obras.
Para ordenar ese terreno y ofrecer criterios de creación y decisión, presentamos a continuación un Diccionario de IA y Propiedad Intelectual, concebido como guía de referencia para navegar entre datos, modelos, licencias y evidencias de trazabilidad.
La figura del autor deja de identificarse solo con la inspiración, para asumir la arquitectura del proceso dentro de la dinámica creativa que nos presenta la IA. Debe decidir fuentes legítimas, dirigir sistemas, revisar salidas y dejar rastro verificable.
Esta “autoría expandida” exige supervisión humana significativa y provenance robusta como base probatoria y como práctica de diligencia profesional. Sin trazabilidad, la opacidad técnica aminora la originalidad reclamable y erosiona la cadena de titularidad.
En suma, el autor debe tener una completa competencia técnica para tomar decisiones que protejan el valor creativo de su obra en un entorno híbrido. El conocimiento de estos conceptos permite al autor crear en hibridación con mayor consistencia, ya sea en el momento de la creación o a la hora de proceder al registro de la obra.
En el diccionario, analizamos los conceptos clave de IA y Propiedad Intelectual (PI) desde una perspectiva técnico-jurídica y orientada a cumplimiento.
Analizamos la distinción input/output y su encaje en TDM conforme a las excepciones DSM; el estatuto jurídico de datasets, modelos fundacionales y APIs (licencias, restricciones y cláusulas no-training); y los requisitos de originalidad/fijación para sostener autoría y titularidad en obras asistidas.
Definimos HITL y la trazabilidad probatoria (bitácoras/prompt-logs, control de versiones con sello temporal y metadatos de procedencia C2PA, vinculables a ISWC/ISRC/IPI), e integramos privacidad, sesgos, gobernanza y gestión colectiva.
Todo para que el autor se situé en un escenario del que forma parte y, también, para que reivindique sus derechos, conozca sus usos y proyecte su creación en un ecosistema digital justo, transparente y sostenible.
Clasificamos los conceptos en cinco categorías para lograr una comprensión más nítida del conjunto:
- Datos, modelos y recursos
- Ciclo de vida y control humano
- Documentación, trazabilidad y pruebas
- Personas, organización y competencias
- Marco jurídico relevante
1. Datos, modelos y recursos
Este punto delimita los insumos estructurales del ecosistema de IA y su traducción jurídico-económica. El análisis se centra en la licitud del origen y las licencias aplicables (datasets, open source), las condiciones de uso de modelos y APIs (restricciones, no-training, PI sobre resultados), y los efectos sobre autoría, titularidad y cumplimiento (privacidad, trazabilidad, atribución).
Por su parte, la open-RBV se incorpora como criterio estratégico para aprovechar recursos abiertos sin comprometer la gobernanza de la PI.
• Datasets: Conjuntos estructurados de datos utilizados para entrenar y probar sistemas de IA. Su relevancia en PI radica en la necesidad de verificar licencias, derechos de autor y privacidad antes de su uso.
• Modelos fundacionales o modelos de base (foundation models): Sistemas de IA genéricos entrenados en grandes volúmenes de datos, capaces de adaptarse a múltiples tareas. En PI plantean problemas de atribución y licitud de los datos de entrenamiento.
• APIs: Interfaces de programación que permiten interconectar varias aplicaciones, las cuales pueden ser modelos de IA. El acceso y condiciones de uso (licencias, límites de explotación y PI sobre resultados) resultan jurídicamente relevantes.
• Open source: Modelos, datasets o herramientas liberadas bajo licencias abiertas. Requieren evaluar compatibilidad de licencias y el alcance de las cláusulas de PI.
• Open Resource-Based View (open-RBV): Enfoque estratégico que entiende los recursos abiertos (datos, software y modelos) como ventajas competitivas para la innovación, pero siempre bajo reglas claras de atribución, licencias y PI.
• RAG (Retrieval-Augmented Generation): Técnica que optimiza la salida de un LLM, combinando generación con revisión de bases de datos internas o externas para basar respuestas en fuentes verificables. Implica gestión de licencias y confidencialidad del repositorio consultado.
• Embeddings / Bases de datos vectoriales: Representaciones numéricas de textos, audio o imágenes almacenadas en BBDD vectoriales para búsquedas por similitud. En PI tenemos riesgo de reconstrucción o fuga de obras protegidas si se indexa sin autorización.
• Fine-tuning / LoRA / Adapters; (Ajuste fino / Low Rank Adaption / Adaptadores): Son métodos para adaptar modelos preentrenados a tareas específicas, mediante entrenamiento adicional completo o parcial. Requiere delimitar la titularidad de los pesos resultantes y la compatibilidad de licencias del modelo base.
• Dataset cards / Data statements: Fichas que documentan origen, composición, permisos y sesgos de un conjunto de datos. Facilitan probar licitud del entrenamiento y trazabilidad.
• OpenRAIL (Open & Responsible AI licenses ) / Licencias responsables de IA: Licencias abiertas con condiciones de uso y salvaguardas (p. ej., prohibición de ciertos fines). Clarifican derechos sobre pesos y salidas, y obligaciones del usuario.
2. Ciclo de vida y control humano
• TDM (Text and Data Mining): Técnica de extracción de información y patrones a partir de grandes volúmenes de textos o datos. En la UE está regulada por las “excepciones DSM”, que permiten ciertos usos sin autorización, pero con reservas de derecho explícitas por parte de los titulares.
• Input: Conjunto de materiales de entrada (datos, textos, obras protegidas) usados para entrenar o generar resultados. Su uso está condicionado por excepciones legales y reservas de derechos.
• Output: Resultados generados por la IA. En PI, el debate central gira en torno a autoría (¿es humana o no?), titularidad, remuneración y posible gestión colectiva.
• HITL (Human-In-The-Loop): Modelo de supervisión humana en todo el ciclo de la IA (antes, durante y después). Es clave para acreditar originalidad, responsabilidad y trazabilidad en obras con asistencia de IA.
• Provenance (procedencia/trazabilidad de origen): Conjunto de metadatos verificables que acreditan de dónde provienen los datos y cómo se transformaron. Incluye logs, sellos temporales, hashes y estándares como C2PA.
• RLHF / RLAIF (Aprendizaje por Refuerzo con Retroalimentación Humana / Aprendizaje por Refuerzo con Retroalimentación de IA): Técnicas para entrenar modelos de lenguaje (LLMs) permitiéndoles generar respuestas alineadas con los valores y preferencias humanas. Aporta evidencia de control humano efectivo.
• Alineación (alignment): Conjunto de técnicas para ajustar la conducta del modelo a políticas y valores definidos. Reduce riesgo de outputs ilícitos (difamación, copia sustancial) y mejora la gobernanza.
• Evaluaciones / Red teaming: Pruebas de ataques simulados a sistemas de IA para detectar fallos, sesgos y vías de evasión. Es un instrumento de control interno de suma importancia para verificar la consistencia del sistema.
• Prompt injection / Jailbreaks: Cibertaques que inducen al modelo a ignorar salvaguardas o revelar información. Requieren controles técnicos y procedimentales para evitar exfiltración de contenido protegido o confidencial.
• Leakage (data/output leakage): Revelación de datos de entrenamiento, inputs o contenidos protegidos a través del modelo. Impacta en secretos empresariales, privacidad y derechos de autor.
• Filtros de seguridad / Moderación: Capas que bloquean o marcan contenidos potencialmente ilícitos o dañinos. Mecanismo preventivo que mitiga responsabilidad y refuerza políticas de uso aceptable.
3. Documentación, trazabilidad y pruebas
• Bitácoras / Prompt logs: Registros escritos o automatizados de las instrucciones dadas a un sistema de IA, junto con sus resultados y revisiones. Son pruebas para acreditar control humano y sustentar autoría.
• Control de versiones: Sellado temporal y huellas criptográficas (hashes) que permiten demostrar evolución de borradores hasta la fijación final. Garantizan autenticidad y originalidad frente a disputas.
• C2PA/Content Credentials (Coalition for Content Provenance and Authenticity/Coalición para la procedencia y autenticidad del contenido): Estándar abierto que adjunta/firma metadatos verificables sobre origen, herramientas y ediciones de un contenido. Facilita trazabilidad, autenticidad y auditoría; interoperable con identificadores (ISWC, ISRC, IPI/CAE).
• Pérdida de atribución autoral: Riesgo de no poder atribuir una obra a un autor humano por opacidad o automatización excesiva. Puede impedir alcanzar el umbral de originalidad exigido por el derecho de autor.
• Watermarking (marca de agua): Inserción de señales rastreables en contenidos generados para facilitar su identificación. Puede ser visible o invisible. Útil para etiquetado de AIGC. No sustituye la provenance verificable.
• Fingerprinting / Perceptual hash: Huellas robustas (hash único) que permiten reconocer obras, aunque sufran transformaciones. Es una herramienta clave para detección de copias y matching automatizado (p. ej., en audio).
• ROPA (Record of Processing Activities / Registro de Actividades de Tratamiento): Inventario RGPD (Reglamento General de Protección de Datos) de operaciones con datos, finalidades y bases jurídicas. Acredita legalidad de flujos de datos en entrenamiento y uso.
• DPIA (Data Protection Impact Assessment / Evaluación de Impacto en Protección de Datos): Análisis formal de riesgos y medidas para tratamientos de alto riesgo. Documento relevante cuando intervienen datos personales.
• Identificadores persistentes (DOI, ISWC, ISRC, IPI/CAE): Códigos estándar que vinculan obras, grabaciones y titulares con metadatos fiables. Facilitan gestión colectiva, licencias y reporting.
- DOI (Digital Object Identifier): Es un identificador único y permanente asignado a un objeto digital (artículo, libro, partitura, dataset, grabación, tesis, etc.). Está gestionado por la DOI Foundation .
- ISWC (International Standard Musical Work Code / Código Internacional Normalizado de Obras Musicales): Es un identificador único para obras musicales (no para grabaciones). Sirve para identificar de manera inequívoca una obra musical en sistemas de gestión colectiva de derechos de auto.
- ISRC (International Standard Recording Code / Código Internacional Normalizado de Grabaciones): Es un identificador único para grabaciones sonoras y audiovisuales, no para la obra musical en sí, sino para una interpretación o fonograma concreto. Cada ISRC es permanente incluso si se publica en distintos formatos, soportes o álbumes.
- IPI (Interested Party Information / Internacional de Parte Interesada): Identifica a una persona u organización con número único que tenga derechos de autor en una sociedad de gestión colectiva. Lo otorga la CISAC a autores, compositores, editores y titulares de derechos.
- CAE (Compositeur, Auteur, Éditeur): Es un identificador antiguo, reemplazado por IPI, pero todavía visible en contratos y bases de datos previos al cambio.
4. Personas, organización y competencias
• Upskilling: Proceso de actualización de competencias (técnicas, normativas, metodológicas) para adaptarse a la IA. Incluye diseño de prompts, evaluación crítica de salidas y cumplimiento en PI.
• Rediseño de roles y flujos de trabajo: Transformación organizativa que implica protocolos de supervisión, salvaguardas de sesgos, privacidad en PI, y redefinición del papel del creador humano en entornos con IA.
• Talento “gig”: Profesionales freelance, contratados por proyecto (p. ej. prompt engineers, curadores de datos, anotadores). Su integración plantea cuestiones laborales y de titularidad sobre los outputs generados en contextos colaborativos.
• Data steward / Curator: Rol responsable de calidad, licencias y gobernanza de datos. Primera línea de control sobre licitud de fuentes y provenance.
• Product counsel: Asesoría jurídica integrada en el ciclo de vida del producto de IA. Traduce riesgos en cláusulas (no-train, garantías, indemnidades) y controles operativos. Una persona clave en la pirámide empresarial.
• DPO (Data Protection Officer / Delegado de Protección de Datos): Responsable de supervisar cumplimiento RGPD y coordinar DPIA/ROPA. Interlocutor clave entre privacidad y explotación de datos para IA.
• SOP (Standard Operating Procedure / Procedimiento Operativo Estándar): Es un documento o guía que describe paso a paso cómo se debe usar, entrenar, validar o auditar un sistema de IA. Son importantes para asegurar reproducibilidad, transparencia y cumplimiento normativo.
• Alianzas universidad-empresa: Colaboraciones para el desarrollo de IA que deben incluir acuerdos claros sobre titularidad de resultados, licencias de uso y explotación de la PI.
5. Marco jurídico relevante
• Excepciones DSM: Limitaciones al derecho de autor introducidas por la Directiva (UE) 2019/790. Regulan la minería de textos y datos y armonizan usos permitidos en la UE, equilibrando innovación y protección de titulares.
• Derecho sui generis de bases de datos: Protección de la inversión sustancial en la obtención/verificación/presentación de contenidos (impacto en datasets y scraping) conforme a la Directiva 96/9/CE.
• InfoSoc (armonización de derechos exclusivos y límites): Marco de reproducción, comunicación pública y copias técnicas/temporales en el entorno digital según la Directiva 2001/29/CE.
• Reglamento de IA (AI Act): Reglas armonizadas para IA, obligaciones de transparencia/documentación y marcado de contenido sintético; Reglamento (UE) 2024/1689.
• RGPD (protección de datos personales): Bases jurídicas y principios aplicables al entrenamiento/validación con datos personales; Reglamento (UE) 2016/679.
• Secretos empresariales: Protección de know-how, weights y datasets propietarios frente a adquisición/uso/divulgación ilícitos; Directiva (UE) 2016/943 (protección de los conocimientos técnicos y la información empresarial no divulgados).
• Data Act (acceso y uso de datos): Regula el acceso y uso equitativo de los datos (personales y no personales) generados por dispositivos conectados; Reglamento (UE) 2023/2854.
• DSA (Digital Services Act / Ley de Servicios Digitales): Crea un marco único en la UE para los servicios digitales, generando transparencia en la moderación de contenidos; Reglamento (UE) 2022/2065.
• Gestión colectiva: Gobernanza de entidades y licencias multiterritoriales de música online: Regula tanto el funcionamiento de las entidades de gestión colectiva como la concesión de licencias multiterritoriales de música. Directiva 2014/26/UE.
• Texto Refundido de la Ley de Propiedad Intelectual PI (TRLPI): Norma central de propiedad intelectual en España. Autoría, derechos morales, derechos afines, límites y excepciones, obra por encargo y cesiones TRDL 1/1996.
• Competencia desleal / passing off: Actos de confusión, imitación y explotación de reputación ajena en la Ley 3/1991 (Ley de Competencia Desleal) y en la Directiva 2005/29/CE (prácticas comerciales desleales B2C).
• Derechos de imagen y voz (España): Autorización para clonación/uso de voice likeness y protección frente a intromisiones; Ley Orgánica 1/1982 de protección civil del derecho al honor, a la intimidad personal y familiar y a la propia imagen.
CONCLUSIONES
El autor del Siglo XXI está supeditado a usar las herramientas digitales que configuran su oficio, pero debe gobernarlas con criterio. Saber elegir fuentes y licencias, ejercer control humano efectivo, documentar la trazabilidad (logs, versiones, C2PA) y pactar contratos claros.
Todo para que su firma siga siendo legible, defendible y remunerada en un ecosistema híbrido. El debate decisivo ya no es si la IA “crea”, sino cómo el humano dirige, selecciona y fija.
La frontera entre lo artificial y lo humano deja de ser una abstracción para convertirse en un hecho demostrable mediante control humano eficaz, trazabilidad y contratos bien diseñados.
Planteamos una regla operativa básica para la creación en el siglo XXI: autoría expandida con evidencia, provenance por diseño, licencias claras del input, cláusulas de uso y de no-entrenamiento, y revisión crítica del output.
Con esa arquitectura, la pregunta “¿de quién es la obra?” obtiene una respuesta defendible en registros, en el mercado e incluso ante los tribunales.
Si alineamos cultura técnica y cultura jurídica, la creación híbrida no diluye al autor: lo hace legible, trazable y remunerable.