Πριν από τη δημιουργία μοντέλου ταξινόμησης κατηγοριών
Προτού δημιουργήσετε το μοντέλο ταξινόμησης κατηγοριών, βεβαιωθείτε ότι τα δεδομένα σας βρίσκονται στο Microsoft Dataverse και ότι είναι δομημένα με τη σωστή μορφή.
Προϋποθέσεις
Αυτό το μοντέλο απαιτεί τα δεδομένα εκπαίδευσης να είναι διαθέσιμα μέσα σε έναν πίνακα Dataverse. Προς το παρόν, η υποστήριξη για δεδομένα από εξωτερικές προελεύσεις δεν είναι διαθέσιμη.
Βεβαιωθείτε ότι ο διαχειριστής σας έχει αναθέσει έναν ρόλο ασφαλείας με δικαίωμα ανάγνωσης για τον πίνακα που έχει τα δεδομένα εκπαίδευσης.
Βεβαιωθείτε ότι έχετε τα κατάλληλα δικαιώματα για τη δημιουργία πινάκων στο περιβάλλον του Power Platform. Μπορείτε να χρησιμοποιήσετε είτε τον Υπεύθυνο προσαρμογής συστήματος είτε τον Διαχειριστή συστήματος ενσωματωμένοι ρόλοι ασφαλείας.
Υποστηριζόμενες γλώσσες
Η ταξινόμηση κατηγορίας AI Builder υποστηρίζει τις ακόλουθες γλώσσες. Εάν επιχειρήσετε να ταξινομήσετε κείμενο σε άλλες γλώσσες, το μοντέλο σας μπορεί να μην λειτουργήσει σωστά.
- Αγγλικά
- Γαλλικά
- Γερμανικά
- Ιταλικά
- Ισπανικά
- Πορτογαλικά (Πορτογαλίας)
Προετοιμασία δεδομένων
Τα δεδομένα εκπαίδευσης που χρησιμοποιούνται για την εκπαίδευση του μοντέλου από τον πίνακα του Dataverse πρέπει να συμμορφώνεται με τα εξής:
Αποθήκευση κειμένου και ετικετών ως δύο στήλες στον ίδιο πίνακα. Κάθε γραμμή πρέπει να έχει δεδομένα στη στήλη Κείμενο.
Μπορείτε να παρέχετε μία ή περισσότερες ετικέτες στα δεδομένα της ίδιας γραμμής στη στήλη Κέιμενο. Μπορείτε επίσης να αφήσετε τη στήλη Ετικέτες κενή.
Εάν έχετε αναγνωρίσει πολλές ετικέτες μέσα στο δείγμα κειμένου, καταχωρήστε τες ως οριοθετημένο κείμενο στα πεδία Ετικέτες. Επί του παρόντος, τα κόμματα (,), τα ερωτηματικά (;) και οι χαρακτήρες στηλοθέτη είναι υποστηριζόμενα διαχωριστικά.
Κείμενο Ετικέτες Εξαιρετικό καθαρό ήσυχο δωμάτιο με ελεύθερη πρόσβαση στο πρωινό Τραπεζαρία, Δωμάτιο Μικρό αλλά καλά σχεδιασμένο δωμάτιο που ήταν άνετο Αίθουσα Μου αρέσει η θέα από τον 13ο όροφο (κανένα) Βεβαιωθείτε ότι έχετε τουλάχιστον 10 διακριτά δείγματα κειμένου για κάθε ετικέτα που θα εξαχθεί. Οι ετικέτες με λιγότερα από 10 δείγματα δεν θα εκπαιδευτούν. Στο προηγούμενο παράδειγμα, θα πρέπει να υπάρχουν τουλάχιστον 10 γραμμές όπου η κάθε μία από αυτές να έχει επισημανθεί με ετικέτες Τραπεζαρία και Δωμάτιο.
Εάν το Δωμάτιο έχει επισημανθεί σε λιγότερες από 10 γραμμές στα δεδομένα, θα παραλειφθεί. Το μοντέλο δεν θα εκπαιδευτεί για την κατηγοριοποίηση δεδομένων για αυτήν την ετικέτα.
Για κάθε ετικέτα που χρησιμοποιείται, δώστε τουλάχιστον 10 δείγματα κειμένου όπου αυτή δεν χρησιμοποιείται.
Κείμενο Ετικέτες Εξαιρετικό καθαρό και ήσυχο δωμάτιο με ελεύθερη πρόσβαση στο πρωινό Αίθουσα Μικρό αλλά καλά σχεδιασμένο δωμάτιο που ήταν άνετο Αίθουσα (κανένα) Αίθουσα Εάν όλες οι γραμμές στον πίνακα έχουν επισημανθεί με ετικέτα Δωμάτιο και δεν υπάρχουν γραμμές — ή υπάρχουν λιγότερες από 10 γραμμές — και έχουν επισημανθεί σε άλλη ετικέτα, το μοντέλο θα αποτύχει στη διαδικασία εκπαίδευσης.
Ένας πίνακας πρέπει να έχει τουλάχιστον δύο ετικέτες και κάθε μία πρέπει να έχει 10 δείγματα κειμένου.
Μπορείτε να ορίσετε έως και 200 διακριτές ετικέτες. Κάθε ετικέτα είναι μια κατηγορία που θα αναγνωριστεί και θα εξαχθεί από το αντίστοιχο κείμενο.
Κάθε δείγμα δεδομένων κειμένου πρέπει να έχει λιγότερους από 5.000 χαρακτήρες.
Εάν δεν έχετε δεδομένα εκπαίδευσης και θέλετε να δοκιμάσετε την ταξινόμηση κατηγορίας AI Builder, μπορείτε να ακολουθήσετε αυτές τις οδηγίες για να χρησιμοποιήσετε το δείγμα δεδομένων.
Παραδείγματα μορφής δεδομένων εκπαίδευσης
Σε αυτήν την ενότητα παρέχονται παραδείγματα της μορφής δεδομένων εκπαίδευσης σε έναν πίνακα Dataverse.
Στήλες | Τύπος δεδομένων | Μέγεθος |
---|---|---|
Σχόλια | Κείμενο | 3,000 |
Ετικέτες | Κείμενο | 100 |
Σχόλια | Ετικέτες |
---|---|
Κατά τη διάρκεια της παραμονής μου, αγνοήθηκα πλήρως. Το προσωπικό δεν μπόρεσε να με παραλάβει ενώ λάμβανα εισπνοές και είχα ουρολοίμωξη. Είχα επίσης και πνευμονία. |
Φροντίδα |
Εξετάστηκα πολύ σύντομα μετά την κάθε φορά που έφτανα κάθε φορά και όλο το προσωπικό, οι νοσηλευτές, ο ιατρός, και ο αναισθησιολόγος ήταν πολύ υποστηρικτικοί. Φαίνεται ότι υπάρχει καλή αίσθηση της ομαδικής εργασίας. |
Προσωπικό, Εισαγωγή |
Ο εξοπλισμός φαίνονταν σύγχρονος. Ο βοηθός νοσηλευτή/υγειονομικού φαίνονταν αρκετά περιποιητικός. |
Εγκαταστάσεις, Προσωπικό |
Σημείωμα
Αν δεν έχετε τα δικά σας δεδομένα εκπαίδευσης και θέλετε να δοκιμάσετε την ταξινόμηση κατηγορίας AI Builder, μπορείτε να ξεκινήσετε κάνοντας λήψη δειγμάτων δεδομένων για το μοντέλο ταξινόμησης κατηγοριών. Περισσότερες πληροφορίες: Χρήση δεδομένων δείγματος για ταξινόμηση κατηγοριών
Εισαγωγή των δεδομένων σας στο Dataverse
Επειδή τα δεδομένα εκπαίδευσης για ένα μοντέλο ταξινόμησης κατηγοριών πρέπει να είναι διαθέσιμα ως πίνακας Dataverse, ας ξεκινήσουμε με την προετοιμασία των δεδομένων στον πίνακα Dataverse.
Το Dataverse περιλαμβάνει ένα ισχυρό σύνολο συνδέσεων που θα σας βοηθήσουν να εισαγάγετε δεδομένα από πολλές προελεύσεις. Περισσότερες πληροφορίες: Προσθήκη δεδομένων σε έναν πίνακα στο Microsoft Dataverse χρησιμοποιώντας το Power Query.
Για παράδειγμα, ας δούμε τον τρόπο εισαγωγής δεδομένων εκπαίδευσης από ένα βιβλίο εργασίας του Excel. Αυτό το παράδειγμα χρησιμοποιεί ένα αρχείο που περιέχει αυτά που παρουσιάζονται στον ακόλουθο πίνακα.
Αναγνωριστικό | Ετικέτες | Κείμενο |
---|---|---|
1 | Τραπεζαρία | Το πρωινό ήταν λίγο μπελάς. |
2 | Τραπεζαρία, Δωμάτιο | Εξαιρετικό καθαρό και ήσυχο δωμάτιο με ελεύθερη πρόσβαση στο πρωινό. |
3 | Δωμάτιο, Τραπεζαρία, Τοποθεσία | Το προσωπικό με το οποίο είμαστε εδώ ήταν πολύ φιλικό και χρήσιμο. Οι διάδρομοι και το δωμάτιό μας ήταν καθαρά και άνετα. Το πρωινό (περιλαμβάνεται) ήταν κέικ και κουλούρια. |
4 | Τοποθεσία, Τραπεζαρία | Η γύρω περιοχή είναι γεμάτη με μπαρ και εστιατόρια. |
5 | Υπηρεσια | Το προσωπικό ήταν ευγενικό. |
Στο παράδειγμα, οι ετικέτες διαχωρίζονται με κόμμα (,). Ως εναλλακτική, μπορείτε να χρησιμοποιήσετε ελληνικό ερωτηματικό (;) ή χαρακτήρα στηλοθέτη.
Συνδεθείτε στο Power Apps.
Επιλέξτε το περιβάλλον στο οποίο θέλετε να εργαστείτε.
Επιλέξτε Δεδομένα>Πίνακες.
Επιλέξτε τον πίνακά σας. Εάν δεν έχετε ήδη έναν πίνακα, ακολουθήστε τα βήματα στην επιλογή Δημιουργία προσαρμοσμένου πίνακα.
Επιλέξτε Δεδομένα>Λήψη δεδομένων>Λήψη δεδομένων από Excel από την κορδέλα του επιλεγμένου πίνακα.
Στην οθόνη Εισαγωγή δεδομένων, επιλέξτε το αρχείο Excel στο οποίο αναφέρονται τα δεδομένα στην ενότητα Παραδείγματα μορφής δεδομένων εκπαίδευσης νωρίτερα σε αυτό το θέμα και, στη συνέχεια, επιλέξτε Αποστολή.
Για να εξετάσετε τις αντιστοιχίσεις πεδίων στην οθόνη Αντιστοιχίσεις στηλών για κατηγορία κειμένου, επιλέξτε Αντιστοίχιση στηλών.
Η αριστερή πλευρά παραθέτει όλες τις στήλες που καθορίζονται στον πίνακα. Η αναπτυσσόμενη λίστα στα δεξιά εμφανίζει τις στήλες που είναι διαθέσιμες στο αρχείο Excel.
Αντιστοιχίστε τις στήλες Ετικέτες, Κείμενο και Αναγνωριστικό από το Excel με τις αντίστοιχες στήλες στον πίνακα.
Αφού αντιστοιχίσετε τις στήλες, μεταβείτε στο βήμα εισαγωγής επιλέγοντας Αποθήκευση αλλαγών στην επάνω δεξιά γωνία.
Αφού δείτε την Κατάσταση αντιστοίχισης ως επιτυχημένη, ξεκινήστε τη διαδικασία εισαγωγής επιλέγοντας Εισαγωγή στην επάνω δεξιά γωνία.
Η διαδικασία της εισαγωγής μπορεί να διαρκέσει μερικά λεπτά, ανάλογα με τον όγκο των δεδομένων που εισάγονται. Μετά από μερικά λεπτά, ανανεώστε την καρτέλα Δεδομένα του πίνακα για να βρείτε όλες τις καρτέλες που εισήχθησαν από το αρχείο Excel.
Είστε πλέον έτοιμοι να προχωρήσετε στο επόμενο βήμα.