Identifiering av skyddat material

Artikel
01/22/2025

API:erna för identifiering av skyddat material söker igenom utdata från stora språkmodeller för att identifiera och flagga känt skyddat material. API:erna är utformade för att hjälpa organisationer att förhindra generering av innehåll som nära matchar upphovsrättsskyddad text eller kod.

API:et för skyddad materialtext flaggar känt textinnehåll (till exempel låttexter, artiklar, recept och valt webbinnehåll) som kan matas ut av stora språkmodeller.

API:et för skyddad materialkod flaggar skyddat kodinnehåll (från kända GitHub-lagringsplatser, inklusive programvarubibliotek, källkod, algoritmer och annat upphovsrättsskyddat programmeringsinnehåll) som kan matas ut av stora språkmodeller.

Varning

Innehållssäkerhetstjänstens kodskanner/indexerare är endast aktuell till och med 6 april 2023. Kod som lades till i GitHub efter det här datumet identifieras inte. Använd ditt eget omdöme när du använder skyddat material för kod för att identifiera de senaste kodkropparna.

Genom att identifiera och förhindra visning av skyddat material kan organisationer säkerställa efterlevnad av lagar om immateriella rättigheter, upprätthålla innehållets originalitet och skydda deras rykte.

Den här guiden innehåller information om vilka typer av innehåll som det skyddade material-API:et identifierar.

Plattformar för innehållsgenerering för kreativt skrivande

Scenario: En plattform för innehållsgenerering som använder generativ AI för kreativt skrivande (till exempel blogginlägg, berättelser, marknadsföringskopiering) integrerar funktionen Skyddat material för text för att förhindra att innehåll skapas som nära matchar känt upphovsrättsskyddat material.
Användare: Plattformsadministratörer och innehållsskapare.
Åtgärd: Plattformen använder Azure AI Content Safety för att skanna AI-genererat innehåll innan det tillhandahålls till användare. Om den genererade texten matchar skyddat material flaggas innehållet och blockeras eller revideras.
Resultat: Plattformen undviker potentiella intrång i upphovsrätten och ser till att allt genererat innehåll är original och följer immaterialrättslagstiftningen.

Scenario: En digital marknadsföringsbyrå använder generativ AI för att automatisera skapandet av innehåll på sociala medier. Byrån integrerar funktionen Skyddat material för text för att undvika publicering av AI-genererat innehåll som innehåller upphovsrättsskyddad text, till exempel sångtexter eller utdrag från böcker.
Användare: Digitala marknadsförare och chefer för sociala medier.
Åtgärd: Byrån använder Azure AI Content Safety för att kontrollera allt AI-genererat innehåll på sociala medier efter matchningar mot en databas med skyddat material. Innehåll som matchar flaggas för revision eller blockeras från att publiceras.
Resultat: Byrån upprätthåller efterlevnaden av upphovsrättslagar och undviker ryktesrisker i samband med publicering av obehörigt innehåll.

AI-assisterad nyhetsskrivning

Scenario: En nyhetskanal använder generativ AI för att hjälpa journalister att skriva artiklar och rapporter. För att säkerställa att innehållet inte oavsiktligt replikerar skyddade nyhetsartiklar eller annat upphovsrättsskyddat material använder uttaget funktionen Skyddat material för text.
Användare: Journalister, redaktörer och efterlevnadsansvariga.
Åtgärd: Nyhetskanalen integrerar Azure AI Content Safety i arbetsflödet för att skapa innehåll. AI-genererade utkast genomsöks automatiskt efter skyddat innehåll innan de skickas in för redaktionell granskning.
Resultat: Nyhetskanalen förhindrar oavsiktliga upphovsrättsöverträdelser och upprätthåller integriteten och originaliteten i sin rapportering.

E-utbildningsplattformar med AI för innehållsgenerering

Scenario: En e-utbildningsplattform använder generativ AI för att generera utbildningsinnehåll, till exempel sammanfattningar, frågesporter och förklarande text. Plattformen använder funktionen Skyddat material för text för att säkerställa att det genererade innehållet inte innehåller skyddat material från läroböcker, artiklar eller akademiska artiklar.
Användare: Skapare av utbildningsinnehåll och efterlevnadsansvariga.
Åtgärd: Plattformen integrerar funktionen för att skanna AI-genererat utbildningsmaterial. Om något innehåll matchar känt skyddat akademiskt material flaggas det för revision eller tas bort automatiskt.
Resultat: Plattformen upprätthåller kvaliteten på utbildningsinnehållet och följer upphovsrättslagarna, vilket undviker användning av skyddat material i AI-genererade utbildningsresurser.

AI-baserade receptgeneratorer

Scenario: En webbplats för livsmedel och recept använder generativ AI för att generera nya recept baserat på användarpreferenser. För att undvika att generera innehåll som matchar skyddade recept från kända kokböcker eller webbplatser integrerar webbplatsen funktionen Skyddat material för text.
Användare: Innehållshanterare och plattformsadministratörer.
Åtgärd: Webbplatsen använder Azure AI Content Safety för att kontrollera AI-genererade recept mot en databas med känt skyddat innehåll. Om ett genererat recept matchar ett skyddat recept flaggas det och ändras eller blockeras.
Resultat: Webbplatsen säkerställer att alla AI-genererade recept är ursprungliga, vilket minskar risken för intrång i upphovsrätten.

Exempel på skyddad materialtext

I den här tabellen finns information om de viktigaste kategorierna av skyddad materialtextidentifiering. Alla fyra kategorierna tillämpas när du anropar API:et.

Kategori	Omfattning	Anses acceptabelt	Anses vara skadligt
Recept	Upphovsrättsskyddat innehåll som är relaterat till recept. Annan skadlig eller känslig text ligger utanför omfånget för den här uppgiften, såvida den inte överlappar receptens IP-upphovsrättsskada.	Länkar till webbsidor som innehåller information om recept Allt innehåll från recept som inte har något eller lågt IP-/upphovsrättsskydd: Listor över ingredienser Grundläggande instruktioner för att kombinera och tillagningsingredienser Avvisande eller vägran att tillhandahålla upphovsrättsskyddat innehåll: Ändra ett ämne för att undvika att dela upphovsrättsskyddat innehåll Vägran att dela upphovsrättsskyddat innehåll Tillhandahålla information som inte svarar	Annat litterärt innehåll i ett recept Matchande anekdoter, berättelser eller personliga kommentarer om receptet (40 tecken eller mer) Kreativa namn för receptet som inte är begränsade till det välkända namnet på maträtten, eller en vanlig beskrivande sammanfattning av skålen som anger vad den primära ingrediensen är (40 tecken eller mer) Kreativa beskrivningar av ingredienser eller steg för att kombinera eller laga ingredienser, inklusive beskrivningar som innehåller mer information än vad som behövs för att skapa skålen, förlita sig på oprecis formulering eller innehålla svordomar (40 tecken eller mer) Metoder för att få åtkomst till upphovsrättsskyddat innehåll: Sätt att kringgå paywalls för att komma åt recept
Webbinnehåll	Alla webbplatser som har `webmd.com` som url-domännamn. Fokuserar bara på frågor om upphovsrättsskyddat innehåll kring valt webbinnehåll. Annan skadlig eller känslig text ligger utanför omfånget för den här uppgiften, såvida den inte korsar den valda webbinnehållsskadan.	Länkar till webbsidor Korta utdrag eller kodfragment av valt webbinnehåll så länge som: De är relevanta för användarens fråga De är färre än 200 tecken	Väsentligt innehåll i valt webbinnehåll Svarsavsnitt som är längre än 200 tecken och som har betydande likheter med ett textblock från det valda webbinnehållet Utdrag från valt webbinnehåll som är längre än 200 tecken Citattecken från markerat webbinnehåll som är längre än 200 tecken Metoder för att få åtkomst till upphovsrättsskyddat innehåll: Sätt att kringgå betalväggar eller DRM-skydd för att få åtkomst till upphovsrättsskyddat valt webbinnehåll
Nyheter	Fokusera bara på frågor om upphovsrättsskyddat innehåll kring Nyheter. Annan skadlig eller känslig text ligger utanför omfånget för den här uppgiften, såvida den inte korsar nyhets-IP Copyright-skada.	Länkar till webbsidor som är värdar för nyheter eller information om nyheter, tidskrifter eller bloggartiklar så länge: De har legitima behörigheter De har licensierad nyhetsbevakning De är auktoriserade plattformar Länkar till auktoriserade webbsidor som innehåller inbäddade ljud-/videospelare så länge: De har legitima behörigheter De har licensierad nyhetsbevakning De är auktoriserade strömningsplattformar De är officiella YouTube-kanaler Korta utdrag/kodfragment som rubriker eller bildtexter från nyhetsartiklar så länge som: De är relevanta för användarens fråga De är inte en väsentlig del av artikeln De är inte hela artikeln Sammanfattning av nyhetsartiklar så länge: Det är relevant för användarens fråga Det är kort och sakligt Den kopierar/parafraserar inte en väsentlig del av artikeln Det anges tydligt och synligt som en sammanfattning Analys/kritik/granskning av nyhetsartiklar så länge: Det är relevant för användarens fråga Det är kort och sakligt Den kopierar/parafraserar inte en väsentlig del av artikeln Det anges tydligt och synligt som en analys/kritik/granskning Nyhetsinnehåll som inte har något IP-/upphovsrättsskydd: Nyheter/tidskrifter/bloggar som är offentliga Nyheter/tidskrifter/bloggar för vilka upphovsrättsskyddet har förflutit, överlämnats eller aldrig funnits Avvisande eller vägran att tillhandahålla upphovsrättsskyddat innehåll: Ändra ämne för att undvika att dela upphovsrättsskyddat innehåll Vägran att dela upphovsrättsskyddat innehåll Tillhandahålla information som inte svarar	Länkar till pdf eller någon annan fil som innehåller fulltext i nyhets-/tidnings-/bloggartiklar, såvida inte: De kommer från auktoriserade plattformar med legitima behörigheter och licenser Nyhetsinnehåll Mer än 200 tecken tagna ordagrant från någon nyhetsartikel Mer än 200 tecken liknar ett textblock från alla nyhetsartiklar Direktåtkomst till nyheter/magasin/bloggartiklar som ligger bakom betalväggar Metoder för att få åtkomst till upphovsrättsskyddat innehåll: Steg för att ladda ned nyheter från en obehörig webbplats Sätt att kringgå betalväggar eller DRM-skydd för att få åtkomst till upphovsrättsskyddade nyheter eller videor
Sångtext	Fokuserar bara på frågor om upphovsrättsskyddat innehåll kring Låtar. Annan skadlig eller känslig text ligger utanför omfånget för den här uppgiften, såvida den inte korsar Songs IP Copyright harm.	Länkar till webbsidor som innehåller information om låtar som: Låttexter av låtarna Ackord eller flikar i den associerade musiken Analys eller recensioner av låten/musiken Länkar till auktoriserade webbsidor som innehåller inbäddade ljud-/videospelare så länge: De har legitima behörigheter De har licensierat musik De är auktoriserade strömningsplattformar De är officiella YouTube-kanaler Korta utdrag eller kodfragment från låtarnas texter så länge som: De är relevanta för användarens fråga De är inte en väsentlig del av texten De är inte hela texten De är inte mer än 11 ord långa Korta utdrag eller kodfragment från ackord/flikar i låtarna så länge som: De är relevanta för användarens fråga De är inte en väsentlig del av ackorden/flikarna De är inte hela ackorden/flikarna Allt innehåll från låtar som inte har något IP-/upphovsrättsskydd: Sånger/texter/ackord/flikar som finns i den offentliga domänen Sånger/texter/ackord/flikar för vilka upphovsrättsskyddet har förflutit, överlämnats eller aldrig funnits Avvisande eller vägran att tillhandahålla upphovsrättsskyddat innehåll: Ändra ämne för att undvika att dela upphovsrättsskyddat innehåll Vägran att dela upphovsrättsskyddat innehåll Tillhandahålla information som inte svarar	Text av en låt Hela texten En betydande del av texten En del av texter som innehåller mer än 11 ord Ackord eller flikar i en låt Hela ackord/flikar Väsentlig del av ackorden/flikarna Länkar till webbsidor som innehåller inbäddade ljud-/videospelare som: Har inte legitima behörigheter Har inte licensierad musik Är inte auktoriserade strömningsplattformar Är inte officiella YouTube-kanaler Metoder för att få åtkomst till upphovsrättsskyddat innehåll: Steg för att ladda ned låtar från en obehörig webbplats Sätt att kringgå betalväggar eller DRM-skydd för att få åtkomst till upphovsrättsskyddade låtar eller videor

Gå vidare

Följ snabbstarten för att komma igång med Azure AI Content Safety för att identifiera skyddat material.

Identifiera skyddat material

Dela via

Identifiering av skyddat material

Användarscenarier

Plattformar för innehållsgenerering för kreativt skrivande

AI-assisterad nyhetsskrivning

E-utbildningsplattformar med AI för innehållsgenerering

AI-baserade receptgeneratorer

Plattformar för programvaruutveckling

Automatiserade verktyg för kodskrivning

AI-assisterad kodgranskning

AI-genererad kod för utbildningsplattformar

AI-baserade kodningsassistenter

Exempel på skyddad materialtext

Gå vidare

Feedback

Ytterligare resurser

Dela via

Identifiering av skyddat material

Användarscenarier

Plattformar för innehållsgenerering för kreativt skrivande

Automatiserat skapande av innehåll på sociala medier

AI-assisterad nyhetsskrivning

E-utbildningsplattformar med AI för innehållsgenerering

AI-baserade receptgeneratorer

Exempel på skyddad materialtext

Gå vidare

Feedback

Ytterligare resurser