Compartir a través de


Detección de material protegido

La API de texto de material protegido marca contenido textual conocido (por ejemplo, letras de canciones, artículos, recetas y contenido web seleccionados) que podrían generar modelos de lenguaje grandes.

La API de código de material protegido marca el contenido de código protegido (de repositorios conocidos de GitHub, incluidas bibliotecas de software, código fuente, algoritmos y otro contenido de programación propietario) que podrían generar modelos de lenguaje grandes.

Precaución

El analizador o indexador de código del servicio de seguridad de contenido solo está actualizado hasta el 6 de noviembre de 2021. No se detectará el código que se agregó a GitHub después de esta fecha. Use su propia discreción al usar Material protegido para código para detectar cuerpos recientes de código.

Al detectar y evitar la visualización de material protegido, las organizaciones pueden garantizar el cumplimiento de las leyes de propiedad intelectual, mantener la originalidad del contenido y proteger su reputación.

En esta guía se proporcionan detalles sobre los tipos de contenido que detecta la API de material protegido.

Escenarios de usuario

Plataformas de generación de contenido para escritura creativa

  • Escenario: una plataforma de generación de contenidos que utiliza IA generativa para la escritura creativa (por ejemplo, entradas de blog, relatos, textos de marketing) integra la función Material protegido para texto para evitar la generación de contenidos que coincidan estrechamente con material protegido por derechos de autor conocido.
  • Usuario: administradores de plataformas y creadores de contenido.
  • Acción: la plataforma usa la seguridad del contenido de Azure AI para examinar el contenido generado por IA antes de proporcionarlo a los usuarios. Si el texto generado coincide con el material protegido, el contenido se marca y se bloquea o revisa.
  • Resultado: la plataforma evita posibles infracciones de derechos de autor y garantiza que todo el contenido generado sea original y conforme a las leyes de propiedad intelectual.

Creación automatizada de contenido en redes sociales

  • Escenario: una agencia de marketing digital usa inteligencia artificial generativa para automatizar la creación de contenido en redes sociales. La agencia integra la característica Material protegido para texto para evitar la publicación de contenido generado por IA que incluye texto con derechos de autor, como letras de canciones o extractos de libros.
  • Usuario: vendedores digitales y administradores de redes sociales.
  • Acción: la agencia emplea Seguridad del contenido de Azure AI para comprobar si todo el contenido de las redes sociales generado por IA coincide con una base de datos de material protegido. El contenido que coincide se marca para la revisión o se bloquea la publicación.
  • Resultado: la agencia mantiene el cumplimiento de las leyes de copyright y evita riesgos de reputación asociados con la publicación de contenido no autorizado.

Redacción de noticias asistidas por IA

  • Escenario: un medio de noticias usa inteligencia artificial generativa para ayudar a los periodistas a redactar artículos e informes. Para asegurarse de que el contenido no replica involuntariamente artículos de noticias protegidos u otro material protegido con derechos de autor, la salida utiliza la característica Material protegido para texto.
  • Usuario: periodistas, editores y responsables de cumplimiento.
  • La salida de noticias integra Seguridad del contenido de Azure AI en su flujo de trabajo de creación de contenidos. Los borradores generados por IA se analizan automáticamente en busca de contenido protegido antes de someterlos a revisión editorial.
  • Resultado: la salida de noticias evita infracciones accidentales de derechos de autor y mantiene la integridad y originalidad de su informe.

Plataformas de aprendizaje electrónico que utilizan la IA para generar contenidos

  • Escenario: una plataforma de aprendizaje electrónico emplea inteligencia artificial generativa para generar contenido educativo, como resúmenes, cuestionarios y texto explicativo. La plataforma utiliza la característica Material protegido para texto para asegurarse de que el contenido generado no incluye material protegido de libros de texto, artículos o documentos académicos.
  • Usuario: creadores de contenido educativo y responsables de cumplimiento.
  • Acción: la plataforma integra la característica para examinar los materiales educativos generados por la inteligencia artificial. Si algún contenido coincide con el material académico protegido conocido, se marca para revisión o se quita automáticamente.
  • Resultado: la plataforma mantiene la calidad del contenido educativo y cumple con las leyes de copyright, evitando el uso de material protegido en los recursos de aprendizaje generados por la inteligencia artificial.

Generadores de recetas con tecnología de inteligencia artificial

  • Escenario: un sitio web de alimentos y recetas usa inteligencia artificial generativa para generar nuevas recetas basadas en las preferencias del usuario. Para evitar generar contenido que coincida con recetas protegidas de libros o sitios web famosos, el sitio web integra la característica Material protegido para texto.
  • Usuario: administradores de contenido y administradores de plataforma.
  • Acción: el sitio web usa la seguridad del contenido de Azure AI para comprobar las recetas generadas por IA en una base de datos de contenido protegido conocido. Si una receta generada coincide con una protegida, se marca y se revisa o se bloquea.
  • Resultado: el sitio web garantiza que todas las recetas generadas por IA sean originales, lo que reduce el riesgo de infracción de derechos de autor.

Ejemplos de texto de material protegido

Consulte esta tabla para obtener más información sobre las principales categorías de detección de texto de material protegido. Las cuatro categorías se aplican cuando se llama a la API.

Category Ámbito Considerado aceptable Considerado perjudicial
Recetas Contenido con derechos de autor relacionados con recetas.

Otros textos perjudiciales o confidenciales quedan fuera del ámbito de esta tarea, a menos que se crucen con recetas que perjudiquen los derechos de propiedad intelectual.
  • Vínculos a páginas web que contienen información sobre recetas
  • Cualquier contenido de recetas que no estén protegidas por derechos de propiedad intelectual o de autor, o que lo estén en escasa medida:
    • Listas de ingredientes
    • Instrucciones básicas para combinar y cocinar ingredientes
  • Rechazo o negativa a proporcionar contenido protegido por derechos de autor:
    • Cambio de tema para evitar compartir contenidos protegidos por derechos de autor
    • Negativa a compartir contenido protegido por derechos de autor
    • Proporcionar información que no responde
  • Otro contenido literario en una receta
    • Anécdotas, historias o comentarios personales sobre la receta (40 caracteres o más)
    • Nombres creativos para la receta que no se limiten al nombre conocido del plato, o un simple resumen descriptivo del plato que indique cuál es el ingrediente principal (40 caracteres o más)
    • Descripciones creativas de los ingredientes o de los pasos para combinar o cocinar los ingredientes, incluidas las descripciones que contengan más información de la necesaria para crear el plato, se basen en una redacción imprecisa o contengan blasfemias (40 caracteres o más)
  • Métodos para acceder al contenido protegido por derechos de autor:
    • Cómo saltarse los muros de pago para acceder a las recetas
Contenido web Todos los sitios web que tienen webmd.com como nombre de dominio URL. Solo se centra en los problemas de contenido protegido por derechos de autor en torno al contenido web seleccionado.

Otros textos perjudiciales o confidenciales quedan fuera del ámbito de esta tarea, a menos que se crucen con los contenidos web perjudiciales seleccionados.
  • Vínculos a páginas web
  • Fragmentos cortos o fragmentos de contenido web seleccionado siempre que:
    • Sean relevantes para la consulta del usuario
    • Tengan menos de 200 caracteres
  • Contenido sustancial del contenido web seleccionado
    • Secciones de respuesta de más de 200 caracteres que tienen una similitud sustancial con un bloque de texto del contenido web seleccionado
    • Extractos del contenido web seleccionado que tienen más de 200 caracteres
    • Citas del contenido web seleccionado que tienen más de 200 caracteres
  • Métodos para acceder al contenido protegido por derechos de autor:
    • Formas de saltarse los muros de pago o las protecciones DRM para acceder a contenidos web seleccionados protegidos por derechos de autor
Noticias Solo se centran en cuestiones de contenido protegido por derechos de autor en torno a noticias.

Otros textos perjudiciales o confidenciales quedan fuera del ámbito de esta tarea, a menos que se crucen con noticias perjudiciales para la propiedad intelectual.
  • Vínculos a páginas web que hospedan noticias o información sobre noticias, revistas o artículos de blog siempre y cuando:
    • Tengan permisos legítimos
    • Tengan cobertura de noticias con licencia
    • Sean plataformas autorizadas
  • Vínculos a páginas web autorizadas que contienen reproductores de audio y vídeo insertados siempre que:
    • Tengan permisos legítimos
    • Tengan cobertura de noticias con licencia
    • Sean plataformas de streaming autorizadas
    • Sean canales oficiales de YouTube
  • Extractos breves, como titulares o pies de foto de artículos de noticias, siempre que:
    • Sean relevantes para la consulta del usuario
    • No sean una parte sustancial del artículo
    • No sean todo el artículo
  • Resumen de artículos de noticias siempre y cuando:
    • Sean relevantes para la consulta del usuario
    • Sean breves y objetivos
    • No copie ni parafrasee una parte sustancial del artículo
    • Se cite claramente y visiblemente como resumen
  • Análisis, crítica, o revisión de artículos de noticias siempre y cuando:
    • Sean relevantes para la consulta del usuario
    • Sean breves y objetivos
    • No copie ni parafrasee una parte sustancial del artículo
    • Se cite claramente y visiblemente como un análisis, crítica o revisión
  • Cualquier contenido de noticias que no esté protegido por derechos de propiedad intelectual o de autor:
    • Noticias, revistas o blogs de dominio público
    • Noticias, revistas o blogs cuyos derechos de autor han expirado, han sido cedidos o nunca han existido
  • Rechazo o negativa a proporcionar contenido protegido por derechos de autor:
    • Cambio de tema para evitar el uso compartido de contenido protegido por derechos de autor
    • Negativa a compartir contenido protegido por derechos de autor
    • Proporcionar información que no responde
  • Vínculos a PDF o cualquier otro archivo que contenga el texto completo de artículos de noticias, revistas o blogs, a menos que:
    • Se obtengan de plataformas autorizadas con permisos legítimos y licencias
  • Contenido de noticias
    • Más de 200 caracteres tomados textualmente de cualquier artículo de noticias
    • Más de 200 caracteres sustancialmente similares a un bloque de texto de cualquier artículo de noticias
    • Acceso directo a artículos de noticias, revistas o blog que estén detrás de los muros de pago
  • Métodos para acceder al contenido protegido por derechos de autor:
    • Pasos para descargar noticias de un sitio web no autorizado
    • Formas de saltarse los muros de pago o las protecciones DRM para acceder a noticias o vídeos protegidos por derechos de autor
Lyrics Solo se centra en cuestiones de contenido protegido por derechos de autor en torno a canciones.

Otros textos perjudiciales o confidenciales quedan fuera del ámbito de esta tarea, a menos que se crucen con canciones perjudiciales para la propiedad intelectual.
  • Vínculos a páginas web que contienen información sobre canciones como:
    • Letras de las canciones
    • Acordes o tablaturas de la música asociada
    • Análisis o reseñas de la canción o música
  • Vínculos a páginas web autorizadas que contienen reproductores de audio y vídeo insertados siempre que:
    • Tengan permisos legítimos
    • Tengan música con licencia
    • Sean plataformas de streaming autorizadas
    • Sean canales oficiales de YouTube
  • Fragmentos cortos o fragmentos de texto de las canciones siempre y cuando:
    • Sean relevantes para la consulta del usuario
    • No sean una parte sustancial de las letras
    • No sean las letras completas
    • No sean más de 11 palabras largas
  • Fragmentos cortos o fragmentos de acordes o tablaturas de las canciones siempre y cuando:
    • Sean relevantes para la consulta del usuario
    • No sean una parte sustancial de los acordes o tablaturas
    • No sean los acordes o tablaturas completos
  • Cualquier contenido de canciones que no tengan protección de propiedad intelectual o derechos de autor:
    • Canciones, letras, acordes o tablaturas que se encuentran en el dominio público
    • Canciones, letras, acordes o tablaturas cuyos derechos de autor han expirado, han sido cedidos o nunca han existido
  • Rechazo o negativa a proporcionar contenido protegido por derechos de autor:
    • Cambio de tema para evitar el uso compartido de contenido protegido por derechos de autor
    • Negativa a compartir contenido protegido por derechos de autor
    • Proporcionar información que no responde
  • Letras de una canción
    • Letras completas
    • Parte sustancial de las letras
    • Parte de las letras que contienen más de 11 palabras
  • Acordes o tablaturas de una canción
    • Acordes o tablaturas completos
    • Parte sustancial de los acordes o tablaturas
  • Vínculos a páginas web que contienen reproductores de audio y vídeo insertados que:
    • No tengan permisos legítimos
    • No tengan música con licencia
    • No sean plataformas de streaming autorizadas
    • No sean canales oficiales de YouTube
  • Métodos para acceder al contenido protegido por derechos de autor:
    • Pasos para descargar canciones de un sitio web no autorizado
    • Formas de saltarse los muros de pago o las protecciones DRM para acceder a canciones o vídeos protegidos por derechos de autor

Pasos siguientes

Siga el inicio rápido para empezar a usar Seguridad del contenido de Azure AI para detectar material protegido.