Delen via


Statistische functies in toewijzingsgegevensstroom

VAN TOEPASSING OP: Azure Data Factory Azure Synapse Analytics

Tip

Probeer Data Factory uit in Microsoft Fabric, een alles-in-één analyseoplossing voor ondernemingen. Microsoft Fabric omvat alles, van gegevensverplaatsing tot gegevenswetenschap, realtime analyses, business intelligence en rapportage. Meer informatie over het gratis starten van een nieuwe proefversie .

Gegevensstromen zijn beschikbaar in Zowel Azure Data Factory als Azure Synapse Pipelines. Dit artikel is van toepassing op toewijzingsgegevensstromen. Als u geen ervaring hebt met transformaties, raadpleegt u het inleidende artikel Gegevens transformeren met behulp van een toewijzingsgegevensstroom.

De volgende artikelen bevatten informatie over statistische functies die worden ondersteund door Azure Data Factory en Azure Synapse Analytics in toewijzingsgegevensstromen.

Lijst met statistische functies

De volgende functies zijn alleen beschikbaar in aggregaties, draai-, draai-, unpivot- en venstertransformaties.

Statistische functie Opdracht
caDistinctCount Hiermee haalt u het totaalaantal afzonderlijke waarden voor een kolom op. De optionele tweede parameter is het beheren van de schattingsfout.
Avg Hiermee haalt u het gemiddelde van de waarden van een kolom op.
avgIf Op basis van een criterium wordt het gemiddelde van de waarden van een kolom opgehaald.
verzamelen Verzamelt alle waarden van de expressie in de geaggregeerde groep in een matrix. Structuren kunnen tijdens dit proces worden verzameld en getransformeerd naar alternatieve structuren. Het aantal items is gelijk aan het aantal rijen in die groep en kan null-waarden bevatten. Het aantal verzamelde items moet klein zijn.
collectUnique Verzamelt alle waarden van de expressie in de geaggregeerde groep in een unieke matrix. Structuren kunnen tijdens dit proces worden verzameld en getransformeerd naar alternatieve structuren. Het aantal items is kleiner of gelijk aan het aantal rijen in die groep en kan null-waarden bevatten. Het aantal verzamelde items moet klein zijn.
count Hiermee haalt u het totaalaantal waarden op. Als de optionele kolom(en) is opgegeven, worden NULL-waarden in het aantal genegeerd.
countAll Hiermee haalt u het totale aantal waarden op, inclusief NULL's.
countDistinct Hiermee haalt u het totaalaantal afzonderlijke waarden van een set kolommen op.
countAllDistinct Hiermee haalt u het totaalaantal afzonderlijke waarden van een set kolommen op, inclusief NULL's.
countIf Op basis van een criterium wordt het totale aantal waarden opgehaald. Als de optionele kolom is opgegeven, worden NULL-waarden in het aantal genegeerd.
covariantiepopulatie Hiermee haalt u de covariantie van de populatie op tussen twee kolommen.
covariancePopulationIf Op basis van een criterium wordt de covariantie van de populatie van twee kolommen ophaalt.
covarianceSample Hiermee haalt u de covariantie van de steekproef van twee kolommen op.
covarianceSampleIf Op basis van een criterium wordt de covariantie van de steekproef van twee kolommen ophaalt.
eerste Hiermee haalt u de eerste waarde van een kolomgroep op. Als de tweede parameter ignoreNulls wordt weggelaten, wordt ervan uitgegaan dat deze onwaar is.
isDistinct Hiermee wordt gevonden of een kolom of set kolommen uniek is. Het telt niet null als een afzonderlijke waarde
Kurtosis Haalt de kurtosis van een kolom op.
kurtosisIf Op basis van een criterium haalt u de kurtosis van een kolom op.
laatste Hiermee haalt u de laatste waarde van een kolomgroep op. Als de tweede parameter ignoreNulls wordt weggelaten, wordt ervan uitgegaan dat deze onwaar is.
max Hiermee haalt u de maximumwaarde van een kolom op.
maxIf Op basis van een criterium wordt de maximumwaarde van een kolom opgehaald.
bedoelen Hiermee haalt u het gemiddelde van waarden van een kolom op. Hetzelfde als AVG.
meanIf Op basis van een criterium wordt het gemiddelde van waarden van een kolom opgehaald. Hetzelfde als avgIf.
min Hiermee haalt u de minimumwaarde van een kolom op.
minIf Op basis van een criterium wordt de minimumwaarde van een kolom opgehaald.
scheefheid Hiermee haalt u de scheefheid van een kolom op.
scheefheid Als Op basis van een criterium haalt u de scheefheid van een kolom op.
stddev Hiermee haalt u de standaarddeviatie van een kolom op.
stddevIf Op basis van een criterium wordt de standaarddeviatie van een kolom ophaalt.
stddevPopulation Hiermee haalt u de standaarddeviatie van de populatie van een kolom op.
stddevPopulationIf Op basis van een criterium wordt de standaarddeviatie van de populatie van een kolom ophaalt.
stddevSample Hiermee haalt u de standaarddeviatie van de steekproef van een kolom op.
stddevSampleIf Op basis van een criterium wordt de standaarddeviatie van de steekproef van een kolom ophaalt.
som Hiermee haalt u de geaggregeerde som van een numerieke kolom op.
sumDistinct Hiermee haalt u de geaggregeerde som van afzonderlijke waarden van een numerieke kolom op.
sumDistinctIf Op basis van criteria wordt de geaggregeerde som van een numerieke kolom opgeteld. De voorwaarde kan worden gebaseerd op elke kolom.
sumIf Op basis van criteria wordt de geaggregeerde som van een numerieke kolom opgeteld. De voorwaarde kan worden gebaseerd op elke kolom.
topN Hiermee haalt u de bovenste N-waarden voor deze kolom op.
variantie Hiermee haalt u de variantie van een kolom op.
variantieIf Op basis van een criterium haalt u de variantie van een kolom op.
variantieaantallen Hiermee haalt u de variantie van de populatie van een kolom op.
variantiePopulationIf Op basis van een criterium haalt u de variantie van de populatie van een kolom op.
variantieSample Hiermee haalt u de niet-bevooruitte variantie van een kolom op.
variantieSampleIf Op basis van een criterium haalt u de niet-bevooruitte variantie van een kolom op.