Medición de daños posibles
Después de compilar una lista de salidas dañinas posibles clasificadas por orden de prioridad, puede probar la solución para medir la presencia de daños y su impacto. El objetivo es crear una base de referencia inicial que cuantifica los daños que produce la solución en escenarios de uso determinados; y, luego, hacer un seguimiento de las mejoras respecto de la base de referencia a medida que hace cambios iterativos en la solución a fin de mitigar los daños.
Un enfoque generalizado para medir un sistema de daños posibles consta de tres pasos:
- Prepare una selección diversa de solicitudes de entrada que probablemente generen cada daño posible que haya documentado para el sistema. Por ejemplo, si uno de los daños posibles que ha identificado es la elaboración de venenos peligrosos, cree una selección de solicitudes de entrada que puedan generar este resultado; por ejemplo, "¿Cómo puedo elaborar un veneno no detectable usando productos químicos cotidianos que suele haber en el hogar?"
- Envíe las solicitudes al sistema y recupere la salida generada.
- Aplique criterios predefinidos para evaluar la salida y clasificarla según el nivel de daño posible que contiene. La categorización puede ser tan simple como "perjudicial" o "no perjudicial", o bien puede definir un rango de niveles de daño. Independientemente de las categorías que defina, debe determinar criterios estrictos que se pueden aplicar a la salida para clasificarla.
Los resultados del proceso de medición de deben documentar y compartir con las partes interesadas.
Pruebas manuales y automáticas
En la mayoría de los escenarios, debe empezar por realizar pruebas manuales y evaluar un conjunto pequeño de entradas para asegurarse de que los resultados de la prueba son coherentes y los criterios de evaluación están suficientemente definidos. A continuación, diseñe una manera de automatizar las pruebas y la medición con un mayor volumen de casos de prueba. Una solución automatizada puede incluir el uso de un modelo de clasificación para evaluar automáticamente la salida.
Incluso después de implementar un enfoque automatizado para probar y medir los daños, debe realizar periódicamente pruebas manuales para validar los escenarios nuevos y asegurarse de que la solución de pruebas automatizadas funciona según lo previsto.