Krok 4. Ocena jakości weryfikacji koncepcji

Artykuł
01/23/2025

przepływ pracy z wyróżnionym krokiem oceny

Zobacz repozytorium GitHub, aby zapoznać się z przykładowym kodem w tej sekcji.

Oczekiwany czas: 5–60 minut. Czas różni się w zależności od liczby pytań w zestawie oceny. W przypadku 100 pytań ocena trwa około 5 minut.

Przegląd i oczekiwany wynik

W tym kroku użyto właśnie wyselekcjonowanego zestawu ewaluacyjnego, aby ocenić aplikację Proof of Concept i ustalić wyjściową jakość, koszty i opóźnienie. Wyniki oceny są używane przez następny krok, aby zidentyfikować główną przyczynę problemów z jakością.

Ocena jest przeprowadzana przy użyciu Mosaic AI Agent Evaluation i rozpatrując kompleksowo wszystkie aspekty jakości, kosztów i opóźnień opisanych w sekcji dotyczącej metryk tego samouczka.

Zagregowane metryki i ocena poszczególnych pytań w zestawie oceny są rejestrowane w usłudze MLflow. Aby uzyskać szczegółowe informacje, zobacz Dane wyjściowe oceny.

Wymagania

Zestaw ewaluacyjny jest dostępny.
Wszystkie wymagania z poprzednich kroków.

Instrukcje

Otwórz notes w wybranym katalogu WERYFIKACJI 05_evaluate_poc_quality koncepcji, a następnie kliknij pozycję Uruchom wszystko.
Sprawdź wyniki oceny w notesie lub przy użyciu biblioteki MLflow. Jeśli wyniki spełniają wymagania dotyczące jakości, możesz przejść bezpośrednio do pozycji Wdrażanie i monitorowanie. Ponieważ aplikacja weryfikacji koncepcji jest oparta na usłudze Databricks, jest gotowa do wdrożenia w skalowalnym, gotowym do produkcji interfejsie API REST.

Następny krok

Korzystając z tej podstawowej oceny jakości weryfikacji koncepcji, zidentyfikuj główne przyczyny wszelkich problemów z jakością i iteracyjne rozwiązywanie tych problemów w celu ulepszenia aplikacji. Zobacz Krok 5. Zidentyfikuj główną przyczynę problemów z jakością.

< poprzedni: Krok 3. Zbierz zestaw oceny

Dalej: Krok 5. Wcięcie głównych przyczyn problemów z jakością >

Udostępnij za pośrednictwem

Krok 4. Ocena jakości weryfikacji koncepcji

Przegląd i oczekiwany wynik

Wymagania

Instrukcje

Następny krok

Opinia

Dodatkowe zasoby