Udostępnij za pośrednictwem


Podejmowanie zasad opartych na danych i wpływanie na podejmowanie decyzji

Modele uczenia maszynowego są zaawansowane w identyfikowaniu wzorców w danych i tworzeniu przewidywań. Ale oferują niewielkie poparcie dla szacowania, w jaki sposób rzeczywisty wynik zmienia się w obecności interwencji.

Praktycy coraz częściej koncentrują się na korzystaniu z danych historycznych w celu informowania o przyszłych decyzjach i interwencjach biznesowych. Na przykład, jak wpływ na przychody będzie miało wpływ, jeśli korporacja realizuje nową strategię cenową? Czy nowe leki poprawiłyby stan pacjenta, wszystkie inne równe?

Składnik wnioskowania przyczynowego pulpitu nawigacyjnego odpowiedzialnej sztucznej inteligencji odpowiada na te pytania, szacując wpływ funkcji na średni wynik zainteresowania w całej populacji lub kohorty oraz na poziomie indywidualnym. Pomaga również w konstruowaniu obiecujących interwencji poprzez symulowanie reakcji cech na różne interwencje i tworzenie zasad w celu określenia, które kohorty ludności skorzystałyby z interwencji. Zbiorczo te funkcje umożliwiają osobom podejmującym decyzje stosowanie nowych zasad i wprowadzanie rzeczywistych zmian.

Możliwości tego składnika pochodzą z pakietu EconML . Szacuje ona heterogeniczne skutki leczenia z danych obserwacyjnych za pośrednictwem podwójnej techniki uczenia maszynowego.

W razie potrzeby należy użyć wnioskowania przyczynowego:

  • Zidentyfikuj funkcje, które mają najbardziej bezpośredni wpływ na wynik zainteresowania.
  • Zdecyduj, jakie ogólne zasady leczenia mają podjąć, aby zmaksymalizować rzeczywisty wpływ na wynik zainteresowania.
  • Dowiedz się, w jaki sposób osoby z określonymi wartościami funkcji będą reagować na określone zasady leczenia.

W jaki sposób są generowane szczegółowe informacje wnioskowania przyczynowego?

Uwaga

Tylko dane historyczne są wymagane do generowania szczegółowych informacji przyczynowych. Skutki przyczynowe obliczone na podstawie cech leczenia są wyłącznie właściwością danych. Dlatego wytrenowany model jest opcjonalny podczas obliczania skutków przyczynowych.

Podwójne uczenie maszynowe to metoda szacowania efektów leczenia heterogenicznego, gdy istnieją wszystkie potencjalne elementy zakłócające/kontrole (czynniki, które jednocześnie miały bezpośredni wpływ na decyzję leczenia w zebranych danych i obserwowanym wyniku), ale istnieją jedno z następujących problemów:

  • Istnieje zbyt wiele, aby klasyczne podejścia statystyczne były stosowane. Oznacza to, że są one wielowymiarowe.
  • Ich wpływ na leczenie i wynik nie może być modelowany w sposób satymetryczny przez funkcje parametryczne. Oznacza to, że są nieparametryczne.

Możesz użyć technik uczenia maszynowego, aby rozwiązać oba problemy. Aby zapoznać się z przykładem, zobacz Chernozhukov2016.

Podwójne uczenie maszynowe zmniejsza problem, najpierw szacując dwa zadania predykcyjne:

  • Przewidywanie wyniku z kontrolek
  • Przewidywanie leczenia z kontrolek

Następnie metoda łączy te dwa modele predykcyjne w końcowym oszacowaniu etapu, aby utworzyć model efektu leczenia heterogenicznego. Takie podejście umożliwia użycie dowolnych algorytmów uczenia maszynowego dla dwóch zadań predykcyjnych przy zachowaniu wielu korzystnych właściwości statystycznych związanych z ostatecznym modelem. Te właściwości obejmują mały błąd średniokwadratowy, asymptotyczną normalność i konstrukcję interwałów ufności.

Jakie inne narzędzia zapewnia firma Microsoft w zakresie wnioskowania przyczynowego?

  • Projekt Azua udostępnia nowatorską strukturę, która koncentruje się na kompleksowej wnioskowaniu przyczynowej.

    Technologia DECI Azua (głębokie kompleksowe wnioskowanie przyczynowe) to pojedynczy model, który może jednocześnie wykonywać odkrycie przyczynowe i wnioskowanie przyczynowe. Użytkownik dostarcza dane, a model może wygenerować relacje przyczynowe między wszystkimi zmiennymi.

    Samo to podejście może zapewnić wgląd w dane. Umożliwia obliczanie metryk, takich jak efekt indywidualnego leczenia (ITE), średni efekt leczenia (ATE) i efekt leczenia warunkowego (CATE). Następnie możesz użyć tych obliczeń, aby podejmować optymalne decyzje.

    Struktura jest skalowalna dla dużych danych, zarówno pod względem liczby zmiennych, jak i liczby punktów danych. Może również obsługiwać brakujące wpisy danych z mieszanymi typami statystycznymi.

  • EconML obsługuje zaplecze składnika wnioskowania przyczynowego pulpitu nawigacyjnego odpowiedzialnego używania sztucznej inteligencji. Jest to pakiet języka Python, który stosuje techniki uczenia maszynowego do szacowania zdywidualizowanych odpowiedzi przyczynowych z danych obserwacyjnych lub eksperymentalnych.

    Zestaw metod szacowania w języku EconML reprezentuje najnowsze postępy w przyczynowym uczeniu maszynowym. Dzięki włączeniu poszczególnych kroków uczenia maszynowego do możliwych do interpretacji modeli przyczynowych metody te zwiększają niezawodność przewidywań warunkowych i przyspieszają analizę przyczynową dla szerokiego zestawu użytkowników.

  • DoWhy to biblioteka języka Python, która ma na celu wywołanie przyczynowego myślenia i analizy. DoWhy zapewnia czteroetapowy interfejs do wnioskowania przyczynowego, który koncentruje się na jawnym modelowaniu założeń przyczynowych i weryfikowaniu ich jak najwięcej.

    Kluczową cechą DoWhy jest jego najnowocześniejsze interfejs API refutation, który może automatycznie przetestować założenia przyczynowe dla dowolnej metody szacowania. Dzięki temu wnioskowanie jest bardziej niezawodne i dostępne dla osób niebędących ekspertami.

    DoWhy obsługuje szacowanie średniego wpływu przyczynowego na tylne drzwi, drzwi wejściowe, zmienną instrumentalną i inne metody identyfikacji. Obsługuje również szacowanie środowiska CATE za pośrednictwem integracji z biblioteką EconML.

Następne kroki