Κοινή χρήση μέσω


Μοντέλο εκμάθησης μηχανής στο Microsoft Fabric

Ένα μοντέλο εκμάθησης μηχανής είναι ένα αρχείο που έχει εκπαιδευτεί για να αναγνωρίζει συγκεκριμένους τύπους μοτίβων. Εκπαιδεύετε ένα μοντέλο σε ένα σύνολο δεδομένων και του παρέχετε έναν αλγόριθμο που χρησιμοποιεί για να εξηγήσει περισσότερα και να μάθει από αυτό το σύνολο δεδομένων. Μετά την εκπαίδευση του μοντέλου, μπορείτε να το χρησιμοποιήσετε για να αιτιολόγησετε δεδομένα που δεν είδε ποτέ πριν και να κάνετε προβλέψεις σχετικά με αυτά τα δεδομένα.

Στη MLflow, ένα μοντέλο εκμάθησης μηχανής μπορεί να περιλαμβάνει πολλές εκδόσεις μοντέλου. Εδώ, κάθε έκδοση μπορεί να αντιπροσωπεύει μια επανάληψη μοντέλου. Σε αυτό το άρθρο, θα μάθετε πώς να αλληλεπιδράτε με μοντέλα εκμάθησης μηχανής για την παρακολούθηση και σύγκριση εκδόσεων μοντέλου.

Δημιουργία μοντέλου εκμάθησης μηχανής

Στο MLflow, τα μοντέλα εκμάθησης μηχανής περιλαμβάνουν μια τυπική μορφή συσκευασίας. Αυτή η μορφή επιτρέπει τη χρήση αυτών των μοντέλων σε διάφορα κατάντη εργαλεία, συμπεριλαμβανομένων συμπερασμάτων δέσμης στο Apache Spark. Η μορφή ορίζει μια σύμβαση για την αποθήκευση ενός μοντέλου σε διαφορετικές "γεύσεις" που μπορούν να κατανοήσουν διαφορετικά κατάντη εργαλεία.

Μπορείτε να δημιουργήσετε απευθείας ένα μοντέλο εκμάθησης μηχανής από το περιβάλλον εργασίας χρήστη Fabric. Το API MLflow μπορεί επίσης να δημιουργήσει απευθείας το μοντέλο.

Για να δημιουργήσετε ένα μοντέλο εκμάθησης μηχανής από το περιβάλλον εργασίας χρήστη, μπορείτε να κάνετε τα εξής:

  1. Δημιουργήστε έναν νέο χώρο εργασίας επιστήμης δεδομένων ή επιλέξτε έναν υπάρχοντα χώρο εργασίας επιστήμης δεδομένων.

  2. Από την αναπτυσσόμενη λίστα + Νέο , επιλέξτε Μοντέλο για να δημιουργήσετε ένα κενό μοντέλο στον χώρο εργασίας σας επιστήμης δεδομένων.

    Screenshot showing the New drop-down menu.

  3. Μετά τη δημιουργία του μοντέλου, μπορείτε να αρχίσετε να προσθέτετε εκδόσεις μοντέλου για να παρακολουθείτε τα μετρικά και τις παραμέτρους εκτέλεσης. Καταχωρήστε ή αποθηκεύστε εκτελέσεις πειραμάτων σε ένα υπάρχον μοντέλο.

Μπορείτε επίσης να δημιουργήσετε ένα πείραμα εκμάθησης μηχανής απευθείας από την εμπειρία σύνταξης με το mlflow.register_model() API. Εάν δεν υπάρχει ένα καταχωρημένο μοντέλο εκμάθησης μηχανής με το δεδομένο όνομα, το API το δημιουργεί αυτόματα.

import mlflow

model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")

print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))

Διαχείριση εκδόσεων σε ένα μοντέλο εκμάθησης μηχανής

Ένα μοντέλο εκμάθησης μηχανής περιέχει μια συλλογή εκδόσεων μοντέλου για απλοποιημένη παρακολούθηση και σύγκριση. Μέσα σε ένα μοντέλο, ένας επιστήμονας δεδομένων μπορεί να περιηγηθεί σε διάφορες εκδόσεις μοντέλων για να εξερευνήσει τις υποκείμενες παραμέτρους και τα μετρικά. Οι επιστήμονες δεδομένων μπορούν επίσης να κάνουν συγκρίσεις σε όλες τις εκδόσεις μοντέλου για να προσδιορίσουν εάν νεότερα μοντέλα μπορεί να αποδώσουν καλύτερα αποτελέσματα.

Παρακολούθηση μοντέλων εκμάθησης μηχανής

Μια έκδοση μοντέλου εκμάθησης μηχανής αντιπροσωπεύει ένα μεμονωμένο μοντέλο που έχει καταχωρηθεί για παρακολούθηση.

Screenshot showing the details screen of a model.

Κάθε έκδοση του μοντέλου περιλαμβάνει τις ακόλουθες πληροφορίες:

  • Ώρα δημιουργίας: Ημερομηνία και ώρα δημιουργίας μοντέλου.
  • Όνομα εκτέλεσης: Το αναγνωριστικό για τις εκτελέσεις πειραμάτων που χρησιμοποιούνται για τη δημιουργία αυτής της συγκεκριμένης έκδοσης μοντέλου.
  • Hyperparameters: Οι υπερπαραμετήρες αποθηκεύονται ως ζεύγη κλειδιού-τιμής. Αμφότερα τα κλειδιά και οι τιμές είναι συμβολοσειρές.
  • Μετρικά: Εκτελέστε τα μετρικά που έχουν αποθηκευτεί ως ζεύγη κλειδιού-τιμής. Η τιμή είναι αριθμητική.
  • Σχήμα μοντέλου/Υπογραφή: Μια περιγραφή των εισόδων και εξόδων μοντέλου.
  • Αρχεία που έχουν καταγραφεί: Συνδεδεμένα αρχεία σε οποιαδήποτε μορφή. Για παράδειγμα, μπορείτε να καταγράψετε εικόνες, περιβάλλον, μοντέλα και αρχεία δεδομένων.

Σύγκριση και φιλτράρισμα μοντέλων εκμάθησης μηχανής

Για να συγκρίνετε και να αξιολογήσετε την ποιότητα των εκδόσεων μοντέλου εκμάθησης μηχανής, μπορείτε να συγκρίνετε τις παραμέτρους, τα μετρικά και τα μετα-δεδομένα μεταξύ των επιλεγμένων εκδόσεων.

Οπτική σύγκριση μοντέλων εκμάθησης μηχανής

Μπορείτε να συγκρίνετε οπτικά εκτελέσεις σε ένα υπάρχον μοντέλο. Η οπτική σύγκριση επιτρέπει εύκολη περιήγηση μεταξύ και ταξινόμηση σε πολλές εκδόσεις.

Screenshot showing a list of runs for comparison.

Για να συγκρίνετε εκτελέσεις, μπορείτε να κάνετε τα εξής:

  1. Επιλέξτε ένα υπάρχον μοντέλο εκμάθησης μηχανής που περιέχει πολλές εκδόσεις.
  2. Επιλέξτε την καρτέλα Προβολή και, στη συνέχεια, μεταβείτε στην προβολή λίστας μοντέλου. Μπορείτε επίσης να επιλέξετε Προβολή λίστας μοντέλων απευθείας από την προβολή λεπτομερειών.
  3. Μπορείτε να προσαρμόσετε τις στήλες εντός του πίνακα. Αναπτύξτε το τμήμα παραθύρου Προσαρμογή στηλών . Από εκεί, μπορείτε να επιλέξετε τις ιδιότητες, τα μετρικά και τα υπερπαραμέτρους που θέλετε να δείτε.
  4. Τέλος, μπορείτε να επιλέξετε πολλές εκδόσεις, για να συγκρίνετε τα αποτελέσματά τους, στο τμήμα παραθύρου σύγκρισης μετρικών. Από αυτό το τμήμα παραθύρου, μπορείτε να προσαρμόσετε τα γραφήματα με αλλαγές στον τίτλο του γραφήματος, τον τύπο απεικόνισης, τον άξονα Χ, τον άξονα Υ και πολλά άλλα.

Σύγκριση μοντέλων εκμάθησης μηχανής με χρήση του API MLflow

Οι επιστήμονες δεδομένων μπορούν επίσης να χρησιμοποιήσουν MLflow για να αναζητήσουν πολλά μοντέλα που αποθηκεύονται εντός του χώρου εργασίας. Επισκεφθείτε την τεκμηρίωση της MLflow για να εξερευνήσετε άλλα API MLflow για αλληλεπίδραση μοντέλου.

from pprint import pprint

client = MlflowClient()
for rm in client.list_registered_models():
    pprint(dict(rm), indent=4)

Εφαρμογή μοντέλων εκμάθησης μηχανής

Μετά την εκπαίδευση ενός μοντέλου σε ένα σύνολο δεδομένων, μπορείτε να εφαρμόσετε αυτό το μοντέλο σε δεδομένα που δεν είδε ποτέ για να δημιουργήσει προβλέψεις. Καλούμε αυτό το μοντέλο βαθμολόγησης τεχνικής χρήσης ή συμπερασματοποίησης. Για περισσότερες πληροφορίες σχετικά με τη βαθμολόγηση μοντέλου Microsoft Fabric, ανατρέξτε στην επόμενη ενότητα.