Rozwiązywanie problemów z modelowaniem

Ukończone

Modelowanie danych polega na tworzeniu relacji i zarządzaniu nimi w sposób umożliwiający efektywne wizualizowanie danych w formie zgodnej z wymogami firmy. Typową pułapką związaną z tworzeniem relacji są relacje okrężne.

Załóżmy na przykład, że tworzysz raporty dla zespołu sprzedaży i sprawdzasz relacje między tabelami. W słabo zaprojektowanym modelu semantycznym tabela 1 ma relację wiele-do-jednego z kolumną w tabeli 2, ale tabela 2 ma relację jeden do wielu z tabelą Table 3, która ma własną relację z tabelą 1. Tą siecią relacji trudno jest zarządzać, a ponadto utrudnia ona tworzenie wizualizacji, ponieważ nie jest jasne, jakie relacje istnieją w tym modelu. Dlatego umiejętność rozpoznawania relacji okrężnych jest ważna dla użyteczności danych.

Zależności relacji

Aby zrozumieć relacje okrężne, należy w pierwszej kolejności zrozumieć zależności.

Załóżmy na przykład, że tabela Sales (Sprzedaż) zawiera następującą kolumnę obliczeniową Total (Suma).

Sales['TotalCost'] = Sales['Quantity'] * Sales['Price']

TotalCost (Koszt całkowity) zależy od wartości Quantity (Ilość) i Price (Cena), dlatego zmiana ilości lub ceny spowoduje również zmianę wartości TotalCost. W tym przykładzie przedstawiono zależność kolumny od innych kolumn, ale zależności mogą też istnieć między miarami, tabelami, czy relacjami.

Weź pod uwagę następujące relacje między tabelami dSalesPerson (wymiar Sprzedawca), fSales (fakt Sprzedaż) i dCustomer (wymiar Klient). Zmiana parametru dCustomer spowoduje zmianę w przypadku sprzedaży fSales, co spowoduje zmiany w elemecie dSalesPerson. Te typy zależności mogą istnieć w ramach relacji.