Compartilhar via


Detecção de material protegido

A API de texto de material protegido sinaliza conteúdos de texto conhecidos (por exemplo, letras de músicas, artigos, receitas e conteúdo Web selecionado) que podem ser gerados por modelos de linguagem grandes.

A API de código material protegido sinaliza o conteúdo de código protegido (de repositórios conhecidos do GitHub, incluindo bibliotecas de software, código-fonte, algoritmos e outro conteúdo de programação proprietário) que pode ser gerado por modelos de linguagem grandes.

Cuidado

O verificador/indexador de código do serviço de segurança de conteúdo só está em dia até 6 de novembro de 2021. O código adicionado ao GitHub após essa data não será detectado. Use seu próprio critério quando utilizar o Material protegido para código a fim de detectar corpos de código recentes.

Ao detectar e impedir a exibição de material protegido, as organizações podem garantir a conformidade com as leis de propriedade intelectual, manter a originalidade do conteúdo e proteger suas reputações.

Este guia fornece detalhes sobre os tipos de conteúdo que a API de material protegido detecta.

Cenários de usuário

Plataformas de geração de conteúdo para escrita criativa

  • Cenário: uma plataforma de geração de conteúdo que usa IA generativa para escrita criativa (por exemplo, postagens de blog, histórias, cópia de marketing) integra o recurso Material protegido para texto a fim de impedir a geração de conteúdo que corresponde melhor ao material protegido por direitos autorais conhecido.
  • Usuário: administradores de plataforma e criadores de conteúdo.
  • Ação: a plataforma usa a Segurança de Conteúdo de IA do Azure para verificar o conteúdo gerado por IA antes que ele seja fornecido aos usuários. Se o texto gerado corresponder ao material protegido, o conteúdo será sinalizado e bloqueado ou revisado.
  • Resultado: a plataforma evita possíveis violações de direitos autorais e garante que todo o conteúdo gerado seja original e em conformidade com as leis de propriedade intelectual.

Criação automatizada de conteúdo de mídia social

  • Cenário: uma agência de marketing digital usa IA generativa para automatizar a criação de conteúdo de mídia social. A agência integra o recurso Material protegido para texto para evitar a publicação de conteúdo gerado por IA que inclua textos protegidos por direitos autorais, como letras de músicas ou trechos de livros.
  • Usuário: profissionais de marketing digital e gerentes de mídia social.
  • Ação: a agência emprega a Segurança de Conteúdo de IA do Azure para verificar todo o conteúdo de mídia social gerado por IA para correspondências em um banco de dados de material protegido. O conteúdo correspondente é sinalizado para revisão ou impedido de ser postado.
  • Resultado: a agência mantém a conformidade com as leis de direitos autorais e evita riscos de reputação associados à postagem de conteúdo não autorizado.

Escrita de notícias assistida por IA

  • Cenário: um canal de notícias usa IA generativa para ajudar jornalistas a redigir artigos e relatórios. Para garantir que o conteúdo não replique involuntariamente artigos de notícias protegidos ou outro material protegido por direitos autorais, o canal usa o recurso Material protegido para texto.
  • Usuário: jornalistas, editores e responsáveis pela conformidade.
  • Ação: o canal de notícias integra a Segurança de Conteúdo de IA do Azure ao fluxo de trabalho de criação de conteúdo. Os rascunhos gerados por IA são verificados automaticamente quanto ao conteúdo protegido antes do envio para revisão editorial.
  • Resultado: o canal de notícias impede violações acidentais de direitos autorais e mantém a integridade e a originalidade de seus relatórios.

Plataformas de e-learning usando IA para geração de conteúdo

  • Cenário: uma plataforma de e-learning emprega IA generativa para gerar conteúdo educativo, como resumos, testes e texto explicativo. A plataforma usa o recurso Material protegido para texto para garantir que o conteúdo gerado não inclua material protegido de livros didáticos, estudos ou artigos acadêmicos.
  • Usuário: criadores de conteúdo educativo e responsáveis pela conformidade.
  • Ação: a plataforma integra o recurso para examinar materiais educativos gerados por IA. Se algum conteúdo corresponder a um material acadêmico protegido conhecido, ele será sinalizado para revisão ou removido automaticamente.
  • Resultado: a plataforma mantém a qualidade do conteúdo educativo e está em conformidade com as leis de direitos autorais, evitando o uso de material protegido em recursos de aprendizagem gerados por IA.

Geradores de receitas da plataforma AI

  • Cenário: um site de alimentos e receitas usa IA generativa para gerar novas receitas com base nas preferências do usuário. Para evitar a geração de conteúdo correspondente à receitas protegidas de sites ou livros de receitas famosos, o site integra o recurso Material protegido para texto.
  • Usuário: gerentes de conteúdo e administradores de plataforma.
  • Ação: o site usa a Segurança de Conteúdo de IA do Azure para verificar as receitas geradas por IA com base em um banco de dados de conteúdo protegido conhecido. Se uma receita gerada corresponder a uma receita protegida, ela será sinalizada e revisada ou bloqueada.
  • Resultado: o site garante que todas as receitas geradas por IA são originais, reduzindo o risco de violação de direitos autorais.

Exemplos de texto de material protegido

Consulte esta tabela para obter detalhes sobre as principais categorias de detecção de texto de material protegido. Todas as quatro categorias são aplicadas quando você chama a API.

Categoria Escopo Considerado aceitável Considerado prejudicial
Receitas Conteúdo protegido por direitos autorais relacionado a Receitas.

Outros textos prejudiciais ou confidenciais estão fora do escopo desta tarefa, a menos que interfiram com o prejuízo de direitos autorais de IP de receitas.
  • Links para páginas da Web que contenham informações sobre receitas
  • Qualquer conteúdo de receitas que não tenha ou tenha pouca proteção de IP/direitos autorais:
    • Listas de ingredientes
    • Instruções básicas para combinar e cozinhar ingredientes
  • Rejeição ou recusa em fornecer conteúdo protegido por direitos autorais:
    • Alterando um tópico para evitar o compartilhamento de conteúdo protegido por direitos autorais
    • Recusa ao compartilhar conteúdos protegidos por direitos autorais
    • Fornecimento de informações não responsivas
  • Outro conteúdo literário em uma receita
    • Histórias, anedotas ou comentários pessoais sobre a receita (40 caracteres ou mais)
    • Nomes criativos para a receita que não se limitam ao nome bem conhecido do prato, ou um resumo descritivo simples do prato indicando qual é o ingrediente principal (40 caracteres ou mais)
    • Descrições criativas dos ingredientes ou etapas para combinar ou cozinhar os ingredientes, incluindo descrições que contenham mais informações do que o necessário para criar o prato, usem linguagem imprecisa ou contenham palavrões (40 caracteres ou mais)
  • Métodos para acessar conteúdos protegidos por direitos autorais:
    • Maneiras de contornar paywalls para acessar receitas
Conteúdo da Web Todos os sites que têm webmd.com como nome de domínio de URL. Concentra-se apenas em questões de conteúdo protegido por direitos autorais em torno de Conteúdo da Web selecionado.

Outros textos nocivos ou confidenciais estão fora do escopo desta tarefa, a menos que se cruzem com os danos do Conteúdo da Web Selecionado.
  • Links para páginas da Web
  • Pequenos trechos ou fragmentos do Conteúdo Selecionado da Web, desde que:
    • Sejam relevantes para a consulta do usuário
    • Tenham menos de 200 caracteres
  • Conteúdo substancial do Conteúdo Selecionado da Web
    • Seções de resposta com mais de 200 caracteres que tenham semelhança substancial com um bloco de texto do Conteúdo Selecionado da Web
    • Trechos do Conteúdo Selecionado da Web com mais de 200 caracteres
    • Citações do Conteúdo Selecionado da Web com mais de 200 caracteres
  • Métodos para acessar conteúdos protegidos por direitos autorais:
    • Maneiras de contornar paywalls ou proteções DRM para acessar o Conteúdo Selecionado da Web protegido por direitos autorais
News Concentre-se apenas em questões de conteúdo protegido por direitos autorais relacionadas a notícias.

Outros textos nocivos ou confidenciais estão fora do escopo desta tarefa, a menos que se cruzem com danos aos direitos autorais de IP das notícias.
  • Links para páginas da Web que hospedam notícias ou informações sobre notícias, revistas ou artigos de blogs, desde que:
    • Tenham permissões legítimas
    • Tenham cobertura de notícias licenciada
    • Sejam plataformas autorizadas
  • Links para páginas da Web autorizadas que contenham players de áudio/vídeo incorporados, desde que:
    • Tenham permissões legítimas
    • Tenham cobertura de notícias licenciada
    • Sejam plataformas de streaming autorizadas
    • Sejam canais oficiais do YouTube
  • Trechos/snippets curtos, como manchetes ou legendas de artigos de notícias, desde que:
    • Sejam relevantes para a consulta do usuário
    • Não sejam uma parte substancial do artigo
    • Não sejam o artigo inteiro
  • Resumo de artigos de notícias, desde que:
    • Seja relevante para a consulta do usuário
    • Seja breve e factual
    • Não copie/parafraseie uma parte substancial do artigo
    • Seja citado de forma clara e visível como um resumo
  • Análise/Crítica/Revisão de artigos de notícias, desde que:
    • Seja relevante para a consulta do usuário
    • Seja breve e factual
    • Não copie/parafraseie uma parte substancial do artigo
    • Seja citado de forma clara e visível como uma análise/crítica/revisão
  • Qualquer conteúdo de notícias que não tenha proteção de IP/direitos autorais:
    • Notícias/Revistas/Blogs que estejam em domínio público
    • Notícias/Revistas/Blogs para os quais a proteção de direitos autorais tenha expirado, sido renunciada ou nunca tenha existido
  • Rejeição ou recusa em fornecer conteúdo protegido por direitos autorais:
    • Alterando o tópico para evitar o compartilhamento de conteúdo protegido por direitos autorais
    • Recusa ao compartilhar conteúdos protegidos por direitos autorais
    • Fornecimento de informações não responsivas
  • Links para PDF ou qualquer outro arquivo que contenha um texto completo de artigos de notícias/revistas/blogs, a menos que:
    • Sejam provenientes de plataformas autorizadas com permissões e licenças legítimas
  • Conteúdo de notícias
    • Mais de 200 caracteres retirados literalmente de qualquer artigo de notícias
    • Mais de 200 caracteres substancialmente semelhantes a um bloco de texto de qualquer artigo de notícias
    • Acesso direto a artigos de notícias/revistas/blogs que estejam protegidos por paywalls
  • Métodos para acessar conteúdos protegidos por direitos autorais:
    • Etapas para fazer download de notícias de um site não autorizado
    • Maneiras de contornar paywalls ou proteções DRM para acessar notícias ou vídeos protegidos por direitos autorais
Lyrics Concentra-se apenas em questões de conteúdo protegido por direitos autorais relacionadas a Canções.

Outros textos nocivos ou confidenciais estão fora do escopo desta tarefa, a menos que se cruzem com os danos causados pelos direitos autorais de IP de Canções.
  • Links para páginas da Web que contenham informações sobre músicas, como:
    • Letras das músicas
    • Acordes ou tablaturas das músicas associadas
    • Análises ou resenhas da canção/música
  • Links para páginas da Web autorizadas que contenham players de áudio/vídeo incorporados, desde que:
    • Tenham permissões legítimas
    • Tenham músicas licenciadas
    • Sejam plataformas de streaming autorizadas
    • Sejam canais oficiais do YouTube
  • Pequenos trechos ou fragmentos das letras das músicas, desde que:
    • Sejam relevantes para a consulta do usuário
    • Não sejam uma parte substancial da letra da música
    • Não sejam a letra inteira
    • Não tenham mais de 11 palavras
  • Trechos curtos ou trechos de acordes/tablaturas das músicas, desde que:
    • Sejam relevantes para a consulta do usuário
    • Não sejam uma parte substancial dos acordes/tablaturas
    • Não sejam os acordes/tablaturas completos
  • Qualquer conteúdo de músicas que não tenha proteção de IP/direitos autorais:
    • Músicas/Letras/Acordes/Tablaturas que estão em domínio público
    • Músicas/Letras/Acordes/Tablaturas para as quais a proteção de direitos autorais expirou, foi abandonada ou nunca existiu
  • Rejeição ou recusa em fornecer conteúdo protegido por direitos autorais:
    • Alterando o tópico para evitar o compartilhamento de conteúdo protegido por direitos autorais
    • Recusa ao compartilhar conteúdos protegidos por direitos autorais
    • Fornecimento de informações não responsivas
  • Letras de uma música
    • Toda a letra da música
    • Parte substancial da letra
    • Parte da letra que contém mais de 11 palavras
  • Acordes ou tablaturas de uma música
    • Todos os acordes/tablaturas
    • Parte substancial dos acordes/tablaturas
  • Links para páginas da Web que contenham players de áudio/vídeo inseridos que:
    • Não tenham permissões legítimas
    • Não tenham música licenciada
    • Não sejam plataformas de streaming autorizadas
    • Não sejam canais oficiais do YouTube
  • Métodos para acessar conteúdos protegidos por direitos autorais:
    • Etapas para baixar músicas de um site não autorizado
    • Maneiras de contornar paywalls ou proteções DRM para acessar músicas ou vídeos protegidos por direitos autorais

Próximas etapas

Siga o início rápido para começar a usar a Segurança de Conteúdo de IA do Azure para detectar o material protegido.