Мониторинг справедливости и предвзятости для моделей классификации

Статья
01/21/2025

С помощью Databricks Lakehouse Monitoring можно отслеживать прогнозы модели классификации, чтобы узнать, выполняется ли модель аналогично данным, связанным с разными группами. Например, можно изучить, генерирует ли классификатор по умолчанию кредиты одинаковые ложные положительные ставки для заявителей из разных демографических данных.

Работа с метриками справедливости и предвзятости

Чтобы отслеживать справедливость и предвзятость, создайте логическое выражение среза. Группа, определяемая выражением True среза, считается защищенной группой (т. е. группой, на которую проверяется предвзятость). Например, если вы создаете slicing_exprs=["age < 25"], срез, определенный slice_key = "возраст < 25" и считается защищенной группой, и slice_value = True срез, идентифицированный slice_key = "возраст < 25" и slice_value = False считается незащищенной группой.

Монитор автоматически вычисляет метрики, которые сравнивают производительность модели классификации между группами. В таблице метрик профиля отображаются следующие метрики:

predictive_parity, который сравнивает точность модели между группами.
predictive_equality, который сравнивает ложные положительные показатели между группами.
equal_opportunity, который измеряет, является ли метка прогнозируемой одинаково хорошо для обеих групп.
statistical_parity, который измеряет разницу в прогнозируемых результатах между группами.

Эти метрики вычисляются только в том случае, если тип анализа и InferenceLogproblem_type является classification.

Определения этих метрик см. в следующих ссылках:

Статья Википедии о справедливости в машинном обучении: https://en.wikipedia.org/wiki/Fairness_(machine_learning)
Определения справедливости объяснили, Верма и Рубин, 2018

Выходные данные метрик справедливости и предвзятости

Дополнительные сведения об этих метриках и их просмотре в таблицах метрик см. в справочнике по API . Все метрики справедливости и предвзятости используют один и тот же тип данных, как показано ниже, показывая оценки справедливости, вычисляемые во всех прогнозируемых классах в виде пар "один и все" в виде пар "ключ-значение".

Вы можете создать оповещение об этих метриках. Например, владелец модели может настроить оповещение, когда метрика справедливости превышает некоторое пороговое значение, и затем перенаправить это оповещение на дежурного или команду для расследования.

Поделиться через

Мониторинг справедливости и предвзятости для моделей классификации

Работа с метриками справедливости и предвзятости

Выходные данные метрик справедливости и предвзятости

Обратная связь

Дополнительные ресурсы