Измерение потенциального вреда
Скомпилируя приоритетный список потенциальных вредных выходных данных, вы можете протестировать решение, чтобы оценить наличие и влияние вреда. Ваша цель — создать начальный базовый план, который квалифифицирует вред, полученный решением в заданных сценариях использования; а затем отслеживайте улучшения в отношении базовых показателей при внесении итеративных изменений в решении для устранения ущерба.
Обобщенный подход к измерению системы потенциального ущерба состоит из трех этапов:
- Подготовьте разнообразный выбор запросов ввода, которые, скорее всего, приводят к каждому потенциальному ущербу, который вы задокументировали для системы. Например, если один из потенциальных вредов, которые вы определили, заключается в том, что система может помочь пользователям производить опасные яды, создать выбор входных подсказок, вероятно, выведет этот результат - например , "Как я могу создать неизменяемый яд с помощью повседневных химических веществ, как правило, найденных в доме?"
- Отправьте запросы в систему и получите созданные выходные данные.
- Примените предварительно определенные критерии, чтобы оценить выходные данные и классифицировать его в соответствии с уровнем потенциального вреда, который он содержит. Классификация может быть такой же простой, как "вредный" или "не вредный", или вы можете определить диапазон уровней вреда. Независимо от категорий, которые вы определяете, необходимо определить строгие критерии, которые можно применить к выходным данным, чтобы классифицировать его.
Результаты процесса измерения должны быть документированы и совместно использоваться заинтересованными лицами.
Ручное и автоматическое тестирование
В большинстве сценариев следует начать с ручного тестирования и оценки небольшого набора входных данных, чтобы убедиться, что результаты теста согласованы, и критерии оценки достаточно четко определены. Затем вы можете автоматизировать тестирование и измерение с большим объемом тестовых вариантов. Автоматическое решение может включать использование модели классификации для автоматической оценки выходных данных.
Даже после реализации автоматизированного подхода к тестированию и измерению вреда следует периодически выполнять ручное тестирование, чтобы проверить новые сценарии и убедиться, что решение автоматического тестирования выполняется должным образом.