API:erna för identifiering av skyddat material söker igenom utdata från stora språkmodeller för att identifiera och flagga känt skyddat material. API:erna är utformade för att hjälpa organisationer att förhindra generering av innehåll som nära matchar upphovsrättsskyddad text eller kod.
API:et för skyddad materialtext flaggar känt textinnehåll (till exempel låttexter, artiklar, recept och valt webbinnehåll) som kan matas ut av stora språkmodeller.
API:et för skyddad materialkod flaggar skyddat kodinnehåll (från kända GitHub-lagringsplatser, inklusive programvarubibliotek, källkod, algoritmer och annat upphovsrättsskyddat programmeringsinnehåll) som kan matas ut av stora språkmodeller.
Varning
Innehållssäkerhetstjänstens kodskanner/indexerare är endast aktuell till och med den 6 november 2021. Kod som lades till i GitHub efter det här datumet identifieras inte. Använd ditt eget omdöme när du använder skyddat material för kod för att identifiera de senaste kodkropparna.
Genom att identifiera och förhindra visning av skyddat material kan organisationer säkerställa efterlevnad av lagar om immateriella rättigheter, upprätthålla innehållets originalitet och skydda deras rykte.
Den här guiden innehåller information om vilka typer av innehåll som det skyddade material-API:et identifierar.
Plattformar för innehållsgenerering för kreativt skrivande
Scenario: En plattform för innehållsgenerering som använder generativ AI för kreativt skrivande (till exempel blogginlägg, berättelser, marknadsföringskopiering) integrerar funktionen Skyddat material för text för att förhindra att innehåll skapas som nära matchar känt upphovsrättsskyddat material.
Användare: Plattformsadministratörer och innehållsskapare.
Åtgärd: Plattformen använder Azure AI Content Safety för att skanna AI-genererat innehåll innan det tillhandahålls till användare. Om den genererade texten matchar skyddat material flaggas innehållet och blockeras eller revideras.
Resultat: Plattformen undviker potentiella intrång i upphovsrätten och ser till att allt genererat innehåll är original och följer immaterialrättslagstiftningen.
Automatiserat skapande av innehåll på sociala medier
Scenario: En digital marknadsföringsbyrå använder generativ AI för att automatisera skapandet av innehåll på sociala medier. Byrån integrerar funktionen Skyddat material för text för att undvika publicering av AI-genererat innehåll som innehåller upphovsrättsskyddad text, till exempel sångtexter eller utdrag från böcker.
Användare: Digitala marknadsförare och chefer för sociala medier.
Åtgärd: Byrån använder Azure AI Content Safety för att kontrollera allt AI-genererat innehåll på sociala medier efter matchningar mot en databas med skyddat material. Innehåll som matchar flaggas för revision eller blockeras från att publiceras.
Resultat: Byrån upprätthåller efterlevnaden av upphovsrättslagar och undviker ryktesrisker i samband med publicering av obehörigt innehåll.
AI-assisterad nyhetsskrivning
Scenario: En nyhetskanal använder generativ AI för att hjälpa journalister att skriva artiklar och rapporter. För att säkerställa att innehållet inte oavsiktligt replikerar skyddade nyhetsartiklar eller annat upphovsrättsskyddat material använder uttaget funktionen Skyddat material för text.
Användare: Journalister, redaktörer och efterlevnadsansvariga.
Åtgärd: Nyhetskanalen integrerar Azure AI Content Safety i arbetsflödet för att skapa innehåll. AI-genererade utkast genomsöks automatiskt efter skyddat innehåll innan de skickas in för redaktionell granskning.
Resultat: Nyhetskanalen förhindrar oavsiktliga upphovsrättsöverträdelser och upprätthåller integriteten och originaliteten i sin rapportering.
E-utbildningsplattformar med AI för innehållsgenerering
Scenario: En e-utbildningsplattform använder generativ AI för att generera utbildningsinnehåll, till exempel sammanfattningar, frågesporter och förklarande text. Plattformen använder funktionen Skyddat material för text för att säkerställa att det genererade innehållet inte innehåller skyddat material från läroböcker, artiklar eller akademiska artiklar.
Användare: Skapare av utbildningsinnehåll och efterlevnadsansvariga.
Åtgärd: Plattformen integrerar funktionen för att skanna AI-genererat utbildningsmaterial. Om något innehåll matchar känt skyddat akademiskt material flaggas det för revision eller tas bort automatiskt.
Resultat: Plattformen upprätthåller kvaliteten på utbildningsinnehållet och följer upphovsrättslagarna, vilket undviker användning av skyddat material i AI-genererade utbildningsresurser.
AI-baserade receptgeneratorer
Scenario: En webbplats för livsmedel och recept använder generativ AI för att generera nya recept baserat på användarpreferenser. För att undvika att generera innehåll som matchar skyddade recept från kända kokböcker eller webbplatser integrerar webbplatsen funktionen Skyddat material för text.
Användare: Innehållshanterare och plattformsadministratörer.
Åtgärd: Webbplatsen använder Azure AI Content Safety för att kontrollera AI-genererade recept mot en databas med känt skyddat innehåll. Om ett genererat recept matchar ett skyddat recept flaggas det och ändras eller blockeras.
Resultat: Webbplatsen säkerställer att alla AI-genererade recept är ursprungliga, vilket minskar risken för intrång i upphovsrätten.
Plattformar för programvaruutveckling
Scenario: En plattform för programutveckling som använder generativ AI för att hjälpa utvecklare att skriva kod integrerar funktionen Skyddat material för kod för att förhindra generering av kod som replikerar material från befintliga GitHub-lagringsplatser.
Användare: Plattformsadministratörer, utvecklare.
Åtgärd: Plattformen använder Azure AI Content Safety för att skanna AI-genererad kod. Om någon kod matchar skyddat material flaggas den för granskning, reviderad eller blockerad.
Resultat: Plattformen säkerställer att all AI-genererad kod är original och följer licensavtal, vilket minskar riskerna för juridiska och efterlevnadsrelaterade.
Automatiserade verktyg för kodskrivning
Scenario: Ett utvecklingsteam använder generativ AI för att automatisera delar av kodskrivningen. Teamet integrerar funktionen Skyddat material för kod för att förhindra oavsiktlig användning av kodfragment som matchar innehåll från befintliga GitHub-lagringsplatser, inklusive öppen källkod med restriktiva licenser.
Användare: Programvaruutvecklare, DevOps-team.
Åtgärd: Azure AI Content Safety kontrollerar den genererade koden mot känt material från GitHub-lagringsplatser. Om en matchning hittas flaggas koden och revideras innan den införlivas i projektet.
Resultat: Teamet undviker potentiellt intrång i upphovsrätten och ser till att den AI-genererade koden följer lämpliga licenser.
AI-assisterad kodgranskning
Scenario: Ett programvaruföretag integrerar VERKTYG för AI-assisterad kodgranskning i sin utvecklingsprocess. För att undvika att införa skyddad kod från GitHub eller externa bibliotek använder företaget funktionen Skyddat material för kod.
Åtgärd: Företaget genomsöker all AI-genererad kod efter matchningar mot skyddat material från GitHub-lagringsplatser innan den slutliga kodgranskningen och distributionen.
Resultat: Företaget förhindrar inkludering av skyddat material i sina projekt, upprätthållande av efterlevnad av immaterialrättslagar och interna standarder.
AI-genererad kod för utbildningsplattformar
Scenario: En e-utbildningsplattform använder generativ AI för att generera exempelkod för programmeringskurser och kurser. Plattformen integrerar funktionen Skyddat material för kod för att säkerställa att genererade exempel inte duplicerar kod från befintliga GitHub-lagringsplatser eller andra utbildningskällor.
Åtgärd: Azure AI Content Safety kontrollerar alla AI-genererade kodexempel för skyddat innehåll. Matchningar flaggas, granskas och revideras.
Resultat: Plattformen upprätthåller integriteten och originaliteten i sitt utbildningsinnehåll samtidigt som den följer upphovsrättslagar.
AI-baserade kodningsassistenter
Scenario: Ett kodningsassistentverktyg som drivs av generativ AI hjälper utvecklare genom att generera kodförslag. För att säkerställa att inga förslag inkräktar på kod från GitHub-lagringsplatser använder assistentverktyget funktionen Skyddat material för kod.
Användare: Utvecklare, verktygsadministratörer.
Åtgärd: Verktyget söker igenom alla kodförslag efter skyddat material från GitHub innan det presenteras för utvecklare. Om ett förslag matchar skyddad kod flaggas det och visas inte.
Resultat: Kodningsassistenten ser till att alla kodförslag är fria från skyddat innehåll, vilket främjar originalitet och minskar juridiska risker.
Genom att integrera funktionen Skyddat material för kod kan organisationer hantera risker som är kopplade till AI-genererad kod, upprätthålla efterlevnad av immaterialrättslagar och säkerställa originaliteten i deras kodutdata.
Exempel på skyddad materialtext
I den här tabellen finns information om de viktigaste kategorierna av skyddad materialtextidentifiering. Alla fyra kategorierna tillämpas när du anropar API:et.
Kategori
Omfattning
Anses acceptabelt
Anses vara skadligt
Recept
Upphovsrättsskyddat innehåll som är relaterat till recept.
Annan skadlig eller känslig text ligger utanför omfånget för den här uppgiften, såvida den inte överlappar receptens IP-upphovsrättsskada.
Länkar till webbsidor som innehåller information om recept
Allt innehåll från recept som inte har något eller lågt IP-/upphovsrättsskydd:
Listor över ingredienser
Grundläggande instruktioner för att kombinera och tillagningsingredienser
Avvisande eller vägran att tillhandahålla upphovsrättsskyddat innehåll:
Ändra ett ämne för att undvika att dela upphovsrättsskyddat innehåll
Vägran att dela upphovsrättsskyddat innehåll
Tillhandahålla information som inte svarar
Annat litterärt innehåll i ett recept
Matchande anekdoter, berättelser eller personliga kommentarer om receptet (40 tecken eller mer)
Kreativa namn för receptet som inte är begränsade till det välkända namnet på maträtten, eller en vanlig beskrivande sammanfattning av skålen som anger vad den primära ingrediensen är (40 tecken eller mer)
Kreativa beskrivningar av ingredienser eller steg för att kombinera eller laga ingredienser, inklusive beskrivningar som innehåller mer information än vad som behövs för att skapa skålen, förlita sig på oprecis formulering eller innehålla svordomar (40 tecken eller mer)
Metoder för att få åtkomst till upphovsrättsskyddat innehåll:
Sätt att kringgå paywalls för att komma åt recept
Webbinnehåll
Alla webbplatser som har webmd.com som url-domännamn. Fokuserar bara på frågor om upphovsrättsskyddat innehåll kring valt webbinnehåll.
Annan skadlig eller känslig text ligger utanför omfånget för den här uppgiften, såvida den inte korsar den valda webbinnehållsskadan.
Länkar till webbsidor
Korta utdrag eller kodfragment av valt webbinnehåll så länge som:
De är relevanta för användarens fråga
De är färre än 200 tecken
Väsentligt innehåll i valt webbinnehåll
Svarsavsnitt som är längre än 200 tecken och som har betydande likheter med ett textblock från det valda webbinnehållet
Utdrag från valt webbinnehåll som är längre än 200 tecken
Citattecken från markerat webbinnehåll som är längre än 200 tecken
Metoder för att få åtkomst till upphovsrättsskyddat innehåll:
Sätt att kringgå betalväggar eller DRM-skydd för att få åtkomst till upphovsrättsskyddat valt webbinnehåll
Nyheter
Fokusera bara på frågor om upphovsrättsskyddat innehåll kring Nyheter.
Annan skadlig eller känslig text ligger utanför omfånget för den här uppgiften, såvida den inte korsar nyhets-IP Copyright-skada.
Länkar till webbsidor som är värdar för nyheter eller information om nyheter, tidskrifter eller bloggartiklar så länge:
De har legitima behörigheter
De har licensierad nyhetsbevakning
De är auktoriserade plattformar
Länkar till auktoriserade webbsidor som innehåller inbäddade ljud-/videospelare så länge:
De har legitima behörigheter
De har licensierad nyhetsbevakning
De är auktoriserade strömningsplattformar
De är officiella YouTube-kanaler
Korta utdrag/kodfragment som rubriker eller bildtexter från nyhetsartiklar så länge som:
De är relevanta för användarens fråga
De är inte en väsentlig del av artikeln
De är inte hela artikeln
Sammanfattning av nyhetsartiklar så länge:
Det är relevant för användarens fråga
Det är kort och sakligt
Den kopierar/parafraserar inte en väsentlig del av artikeln
Det anges tydligt och synligt som en sammanfattning
Analys/kritik/granskning av nyhetsartiklar så länge:
Det är relevant för användarens fråga
Det är kort och sakligt
Den kopierar/parafraserar inte en väsentlig del av artikeln
Det anges tydligt och synligt som en analys/kritik/granskning
Nyhetsinnehåll som inte har något IP-/upphovsrättsskydd:
Nyheter/tidskrifter/bloggar som är offentliga
Nyheter/tidskrifter/bloggar för vilka upphovsrättsskyddet har förflutit, överlämnats eller aldrig funnits
Avvisande eller vägran att tillhandahålla upphovsrättsskyddat innehåll:
Ändra ämne för att undvika att dela upphovsrättsskyddat innehåll
Vägran att dela upphovsrättsskyddat innehåll
Tillhandahålla information som inte svarar
Länkar till pdf eller någon annan fil som innehåller fulltext i nyhets-/tidnings-/bloggartiklar, såvida inte:
De kommer från auktoriserade plattformar med legitima behörigheter och licenser
Nyhetsinnehåll
Mer än 200 tecken tagna ordagrant från någon nyhetsartikel
Mer än 200 tecken liknar ett textblock från alla nyhetsartiklar
Direktåtkomst till nyheter/magasin/bloggartiklar som ligger bakom betalväggar
Metoder för att få åtkomst till upphovsrättsskyddat innehåll:
Steg för att ladda ned nyheter från en obehörig webbplats
Sätt att kringgå betalväggar eller DRM-skydd för att få åtkomst till upphovsrättsskyddade nyheter eller videor
Sångtext
Fokuserar bara på frågor om upphovsrättsskyddat innehåll kring Låtar.
Annan skadlig eller känslig text ligger utanför omfånget för den här uppgiften, såvida den inte korsar Songs IP Copyright harm.
Länkar till webbsidor som innehåller information om låtar som:
Låttexter av låtarna
Ackord eller flikar i den associerade musiken
Analys eller recensioner av låten/musiken
Länkar till auktoriserade webbsidor som innehåller inbäddade ljud-/videospelare så länge:
De har legitima behörigheter
De har licensierat musik
De är auktoriserade strömningsplattformar
De är officiella YouTube-kanaler
Korta utdrag eller kodfragment från låtarnas texter så länge som:
De är relevanta för användarens fråga
De är inte en väsentlig del av texten
De är inte hela texten
De är inte mer än 11 ord långa
Korta utdrag eller kodfragment från ackord/flikar i låtarna så länge som:
De är relevanta för användarens fråga
De är inte en väsentlig del av ackorden/flikarna
De är inte hela ackorden/flikarna
Allt innehåll från låtar som inte har något IP-/upphovsrättsskydd:
Sånger/texter/ackord/flikar som finns i den offentliga domänen
Sånger/texter/ackord/flikar för vilka upphovsrättsskyddet har förflutit, överlämnats eller aldrig funnits
Avvisande eller vägran att tillhandahålla upphovsrättsskyddat innehåll:
Ändra ämne för att undvika att dela upphovsrättsskyddat innehåll
Vägran att dela upphovsrättsskyddat innehåll
Tillhandahålla information som inte svarar
Text av en låt
Hela texten
En betydande del av texten
En del av texter som innehåller mer än 11 ord
Ackord eller flikar i en låt
Hela ackord/flikar
Väsentlig del av ackorden/flikarna
Länkar till webbsidor som innehåller inbäddade ljud-/videospelare som:
Har inte legitima behörigheter
Har inte licensierad musik
Är inte auktoriserade strömningsplattformar
Är inte officiella YouTube-kanaler
Metoder för att få åtkomst till upphovsrättsskyddat innehåll:
Steg för att ladda ned låtar från en obehörig webbplats
Sätt att kringgå betalväggar eller DRM-skydd för att få åtkomst till upphovsrättsskyddade låtar eller videor
Gå vidare
Följ snabbstarten för att komma igång med Azure AI Content Safety för att identifiera skyddat material.