Kommentera datakällor i Azure Data Catalog
Viktigt!
Azure Data Catalog drogs tillbaka den 15 maj 2024.
För datakatalogfunktioner använder du Microsoft Purview-tjänsten , som erbjuder enhetlig datastyrning för hela din dataegendom.
Introduktion
Microsoft Azure Data Catalog är en fullständigt hanterad molntjänst som fungerar som ett system för registrering och identifieringssystem för företagsdatakällor. Med andra ord handlar Data Catalog om att hjälpa människor att identifiera, förstå och använda datakällor och hjälpa organisationer att få mer värde från sina befintliga data. När en datakälla registreras med Data Catalog kopieras och indexeras dess metadata av tjänsten, men artikeln slutar inte där. Med Data Catalog kan användarna tillhandahålla sina egna beskrivande metadata , till exempel beskrivningar och taggar, för att komplettera metadata som extraherats från datakällan och göra datakällan mer begriplig för fler personer.
Anteckningar och crowdsourcing
Alla har en åsikt. Och det här är bra. Data Catalog identifierar att olika användare har olika perspektiv på företagsdatakällor och att vart och ett av dessa perspektiv kan vara värdefullt. Föreställ dig följande scenario:
- Systemadministratören känner till servicenivåavtalet för de servrar eller tjänster som är värdar för datakällan.
- Databasadministratören känner till säkerhetskopieringsschemat för varje databas och de tillåtna ETL-bearbetningsfönstren.
- Systemägaren känner till processen för användare att begära åtkomst till datakällan.
- Dataförvaltaren vet hur tillgångarna och attributen i datakällan mappar till företagsdatamodellen.
- Analytikern vet hur data används i samband med de affärsprocesser som de stöder.
Var och en av dessa perspektiv är värdefull, och Data Catalog använder en crowdsourcing-metod för metadata som gör att var och en kan fångas in och användas för att ge en fullständig bild av registrerade datakällor. Varje användare kan lägga till och redigera sina egna anteckningar i datakatalogportalen, samtidigt som de kan visa anteckningar som tillhandahålls av andra användare.
Olika typer av anteckningar
Data Catalog stöder följande typer av anteckningar:
Annotation | Kommentar |
---|---|
Användarvänligt namn | Egna namn kan anges på datatillgångsnivå för att göra datatillgångarna lättare att förstå. Egna namn är mest användbara när det underliggande objektnamnet är kryptiskt, förkortat eller på annat sätt inte meningsfullt för användarna. |
beskrivning | Beskrivningar kan anges på datatillgångs- och attribut-/kolumnnivåerna. Beskrivningar är korta textanteckningar i fritt format som beskriver användarens perspektiv på datatillgången eller dess användning. |
Taggar (användartaggar) | Taggar kan anges på datatillgångs- och attribut-/kolumnnivåerna. Användartaggar är användardefinierade etiketter som kan användas för att kategorisera datatillgångar eller attribut. |
Taggar (ordlistetaggar) | Taggar kan anges på datatillgångs- och attribut-/kolumnnivåerna. Ordlistetaggar är centralt definierade ordlistetermer som kan användas för att kategorisera datatillgångar eller attribut med hjälp av en vanlig företagstaxonomi. Mer information finns i Så här konfigurerar du en företagsordlista för hanterade taggar |
Experter | Experter kan tillhandahållas på datatillgångsnivå. Experter identifierar användare eller grupper med expertperspektiv på data och kan fungera som kontaktpunkter för användare som identifierar de registrerade datakällorna och har frågor som inte besvaras av de befintliga anteckningarna. |
Begär åtkomst | Information om begärandeåtkomst kan anges på datatillgångsnivå. Den här informationen gäller för användare som upptäcker en datakälla som de ännu inte har behörighet att komma åt. Användare kan ange e-postadressen till den användare eller grupp som beviljar åtkomst, URL:en för den process eller det verktyg som användarna behöver för att få åtkomst eller ange själva processen som text. |
Dokumentation | Dokumentation kan tillhandahållas på datatillgångsnivå. Tillgångsdokumentation är rtf-information som kan innehålla länkar och bilder, och som kan ge all information som inte förmedlas via beskrivningar och taggar. |
Kommentera flera tillgångar
Användare kan välja flera datatillgångar i datakatalogportalen och kommentera alla valda tillgångar i en enda åtgärd. Anteckningar gäller för alla valda tillgångar, vilket gör det enkelt att välja och tillhandahålla en konsekvent beskrivning och uppsättningar taggar och experter för relaterade datatillgångar.
Kommentar
Taggar och experter kan också tillhandahållas när du registrerar datatillgångar med datakatalogens registreringsverktyg för datakällor.
När flera tabeller och vyer har valts visas endast kolumner som alla valda datatillgångar har gemensamt i datakatalogportalen. På så sätt kan användarna ange taggar och beskrivningar för alla kolumner med samma namn för alla valda tillgångar.
Anteckningar och identifiering
Precis som metadata som extraheras från datakällan under registreringen läggs till i datakatalogens sökindex index indexeras även användardefinierade metadata. Det innebär att anteckningar inte bara gör det lättare för användarna att förstå de data de identifierar, anteckningar gör det också lättare för användare att identifiera de kommenterade datatillgångarna genom att söka med hjälp av de termer som passar dem.
Sammanfattning
Genom att registrera en datakälla med Data Catalog kan dessa data identifieras genom att strukturella och beskrivande metadata kopieras från datakällan till katalogtjänsten. När en datakälla har registrerats kan användarna ge anteckningar för att göra det enklare att identifiera och förstå från datakatalogportalen.