Κοινή χρήση μέσω


Χρήση της εμπειρίας Python στο Notebook

Σημείωση

Προς το παρόν, η δυνατότητα είναι σε προεπισκόπηση.

Το σημειωματάριο Python είναι μια νέα εμπειρία που βασίζεται στο σημειωματάριο Fabric. Είναι ένα ευέλικτο και αλληλεπιδραστικό εργαλείο που έχει σχεδιαστεί για ανάλυση δεδομένων, απεικόνιση και εκμάθηση μηχανής. Παρέχει μια απρόσκοπτη εμπειρία ανάπτυξης για τη σύνταξη και εκτέλεση κώδικα Python. Αυτό το καθιστά βασικό εργαλείο για επιστήμονες δεδομένων, αναλυτές και προγραμματιστές BI, ειδικά για εργασίες εξερεύνησης που δεν απαιτούν μεγάλα δεδομένα και κατανεμημένη υπολογιστική λειτουργία.

Με ένα σημειωματάριο Python, μπορείτε να λάβετε τα εξής:

  • Πολλοί ενσωματωμένοι πυρήνες python: Τα σημειωματάρια Python προσφέρουν ένα καθαρό περιβάλλον κωδικοποίησης Python χωρίς Spark, με δύο εκδόσεις του πυρήνα Python - Το Python 3.10 και 3.11 διαθέσιμο από προεπιλογή και τις εγγενείς δυνατότητες ipython που υποστηρίζονται όπως το iPyWidget, μαγικές εντολές.

  • Οικονομικά αποδοτικά: Το νέο σημειωματάριο Python προσφέρει οφέλη εξοικονόμησης κόστους, εκτελώντας ένα σύμπλεγμα μεμονωμένων κόμβων με μνήμη 2vCores/16GB από προεπιλογή. Αυτό εξασφαλίζει την αποτελεσματική χρήση πόρων για έργα εξερεύνησης δεδομένων με μικρότερο μέγεθος δεδομένων.

  • Lakehouse & Πόροι είναι εγγενώς διαθέσιμοι: Το Fabric Lakehouse μαζί με τους ενσωματωμένους Πόρους πλήρεις λειτουργίες του Notebook είναι διαθέσιμες στο σημειωματάριο Python. Αυτό επιτρέπει στους χρήστες να μεταφέρουν εύκολα τα δεδομένα στο σημειωματάριο python. Απλώς δοκιμάστε να σύρετε & απόθεση για να λάβετε το τμήμα κώδικα.

  • Προγραμματισμός Mix μεT-SQL: Το σημειωματάριο Python προσφέρει έναν εύκολο τρόπο αλληλεπίδρασης με την Αποθήκη δεδομένων και τα τελικά σημεία SQL στην εξερεύνηση, χρησιμοποιώντας τη σύνδεση δεδομένων notebookutils και μπορείτε εύκολα να εκτελέσετε τις δέσμες ενεργειών T-SQL στο πλαίσιο της python.

  • υποστήριξη για δημοφιλείς βιβλιοθήκες ανάλυσης δεδομένων: Τα σημειωματάρια Python παρέχονται με προεγκατεστημένες βιβλιοθήκες όπως το DuckDB, το Polars και το Scikit-learn, παρέχοντας μια ολοκληρωμένη εργαλειοθήκη για τον χειρισμό δεδομένων, την ανάλυση και την εκμάθηση μηχανής.

  • Intellisense για προχωρημένους: Το σημειωματάριο Python υιοθετεί την Pylance ως μηχανή intellisense, μαζί με άλλες προσαρμοσμένες υπηρεσίες γλώσσας Fabric, με στόχο να παρέχει εμπειρία κωδικοποίησης τελευταίας τεχνολογίας για προγραμματιστές σημειωματάριων.

  • NotebookUtils & σύνδεση σημασιολογίας: Τα ισχυρά κιτ εργαλείων API σάς παρέχουν τη δυνατότητα να χρησιμοποιείτε εύκολα τις δυνατότητες Fabric και Power BI με εμπειρία πρώτης χρήσης κώδικα.

  • δυνατότητες εμπλουτισμένων απεικονίσεων: Εκτός από τη δημοφιλή συνάρτηση προεπισκόπησης εμπλουτισμένου πλαισίου δεδομένων "Table" και τη συνάρτηση "Chart", υποστηρίζουμε επίσης δημοφιλείς βιβλιοθήκες απεικονίσεων όπως Matplotlib, Seaborn και Plotly. Το PowerBIClient υποστηρίζει επίσης αυτές τις βιβλιοθήκες για να βοηθήσει τους χρήστες να κατανοούν καλύτερα τα μοτίβα δεδομένων και τις πληροφορίες.

  • Συνήθεις δυνατότητες για το Σημειωματάριο Fabric: Όλες οι δυνατότητες επιπέδου Σημειωματάριου ισχύουν φυσικά για το σημειωματάριο Python, όπως οι δυνατότητες επεξεργασίας, η Αυτόματη αποθήκευση, η συνεργασία, η κοινή χρήση και η διαχείριση δικαιωμάτων, η ενοποίηση Git, η εισαγωγή/εξαγωγή κ.λπ.

  • δυνατότητες της επιστήμης δεδομένων πλήρους στοίβας: Το προηγμένο κιτ εργαλείων χαμηλού κώδικα Data Wrangler, το MLFlow πλαισίου εκμάθησης μηχανής και το ισχυρό Copilot είναι όλα διαθέσιμα στο σημειωματάριο Python.

Τρόπος πρόσβασης στο Python Notebook

Αφού ανοίξετε ένα Σημειωματάριο Fabric, μπορείτε να μεταβείτε σε Python στο αναπτυσσόμενο μενού γλώσσας στην αρχική καρτέλα και να μετατρέψετε ολόκληρη τη ρύθμιση σημειωματάριου σε Python.

Στιγμιότυπο οθόνης που εμφανίζει τη μετάβαση σε Python από το μενού γλώσσας σημειωματάριου.

Οι περισσότερες από τις συνήθεις δυνατότητες υποστηρίζονται ως επίπεδο σημειωματάριου. Μπορείτε να ανατρέξετε στην Τρόπος χρήσης σημειωματάριων Microsoft Fabric και Ανάπτυξη, εκτέλεση και διαχείριση σημειωματάριων Microsoft Fabric για να μάθετε τη λεπτομερή χρήση. Εδώ παραθέτουμε ορισμένες βασικές δυνατότητες ειδικά για σενάρια Python.

Εκτέλεση σημειωματάριων Python

Το σημειωματάριο Python υποστηρίζει πολλούς τρόπους εκτέλεσης εργασιών:

  • αλληλεπιδραστική εκτέλεση: Μπορείτε να εκτελέσετε ένα σημειωματάριο Python αλληλεπιδραστικά όπως ένα εγγενές σημειωματάριο Jupyter.
  • Προγραμματισμός εκτέλεσης: Μπορείτε να χρησιμοποιήσετε την εμπειρία χρονοδιαγραμμάτων με μεγάλη βαρύτητα στη σελίδα ρυθμίσεων σημειωματάριου για να εκτελέσετε το σημειωματάριο Python ως εργασία δέσμης.
  • εκτέλεση διοχέτευσης: Μπορείτε να οργανώσετε σημειωματάρια Python ως δραστηριότητες σημειωματάριου σε διοχέτευσης δεδομένων . Το στιγμιότυπο θα δημιουργηθεί μετά την εκτέλεση της εργασίας.
  • εκτέλεσης αναφοράς: Μπορείτε να χρησιμοποιήσετε notebookutils.notebook.run() ή notebookutils.notebook.runMultiple() για αναφορά στην εκτέλεση σημειωματάριων Python σε ένα άλλο σημειωματάριο Python ως εργασία δέσμης. Το στιγμιότυπο θα δημιουργηθεί μετά την ολοκλήρωση της εκτέλεσης αναφοράς.
  • εκτέλεση δημόσιου API: Μπορείτε να προγραμματίσετε την εκτέλεση του σημειωματάριου python με τον σημειωματάριο εκτελεί δημόσιο API, βεβαιωθείτε ότι οι ιδιότητες γλώσσας και πυρήνα στα μετα-δεδομένα σημειωματάριου του δημόσιου ωφέλιμου φορτίου API έχουν οριστεί σωστά.

Μπορείτε να παρακολουθήσετε τις λεπτομέρειες εκτέλεσης της εργασίας σημειωματάριου Python στην καρτέλα κορδέλας Εκτέλεση ->Προβολή όλων των εκτελέσεων.

Αλληλεπίδραση δεδομένων

Μπορείτε να αλληλεπιδράσετε με lakehouse, αποθήκες, τελικά σημεία SQL και ενσωματωμένους φακέλους πόρων στο σημειωματάριο Python.

Αλληλεπίδραση Lakehouse

Μπορείτε να ορίσετε ένα Lakehouse ως προεπιλογή ή μπορείτε επίσης να προσθέσετε πολλά Lakehouse για να τα εξερευνήσετε και να τα χρησιμοποιήσετε σε σημειωματάρια.

Εάν δεν είστε εξοικειωμένοι με την ανάγνωση των αντικειμένων δεδομένων, όπως πίνακα δέλτα, δοκιμάστε να σύρετε και αποθέσετε το αρχείο και τον πίνακα δέλτα στον καμβά σημειωματάριου ή χρησιμοποιήστε το Φόρτωση δεδομένων στο αναπτυσσόμενο μενού του αντικειμένου. Το σημειωματάριο εισάγει αυτόματα τμήμα κώδικα στο κελί κώδικα και δημιουργεί κώδικα για την ανάγνωση του αντικειμένου δεδομένων προορισμού.

Σημείωση

Εάν αντιμετωπίσετε OOM κατά τη φόρτωση μεγάλου όγκου δεδομένων, δοκιμάστε να χρησιμοποιήσετε το dataframe DuckDB, Polars ή PyArrow αντί για pandas.

Μπορείτε να βρείτε τη λειτουργία εγγραφής Lakehouse στο τμήματος κώδικα Αναζήτηση ->Εγγραφή δεδομένων σεπίνακα δέλτα .

Στιγμιότυπο οθόνης που εμφανίζει την επιχείρηση εγγραφής lakehouse.

Αλληλεπίδραση αποθήκης και συνδυασμός προγραμματισμού με το T-SQL

Μπορείτε να προσθέσετε Αποθήκες δεδομένων ή τελικά σημεία SQL από την Εξερεύνηση Αποθήκης του Notebook. Παρομοίως, μπορείτε να σύρετε και αποθέσετε τους πίνακες στον καμβά σημειωματάριου ή να χρησιμοποιήσετε τις λειτουργίες συντόμευσης στο αναπτυσσόμενο μενού πίνακα. Το σημειωματάριο δημιουργεί αυτόματα τμήμα κώδικα για εσάς. Μπορείτε να χρησιμοποιήσετε τα βοηθητικά προγράμματα notebookutils.data για να δημιουργήσετε μια σύνδεση με τις Αποθήκες και να υποβάλετε ερωτήματα στα δεδομένα χρησιμοποιώντας μια πρόταση T-SQL στο περιβάλλον Python.

Στιγμιότυπο οθόνης που εμφανίζει συντομεύσεις πίνακα αποθήκης.

Σημείωση

Τα τελικά σημεία SQL είναι μόνο για ανάγνωση εδώ.

Φάκελος πόρων σημειωματάριου

Ο φάκελος πόρων του Notebook ενσωματωμένος φάκελος πόρων είναι εγγενώς διαθέσιμος στο Python Notebook. Μπορείτε εύκολα να αλληλεπιδράσετε με τα αρχεία στον ενσωματωμένο φάκελο πόρων χρησιμοποιώντας κώδικα Python σαν να εργάζεστε με το τοπικό σύστημα αρχείων σας. Προς το παρόν, ο φάκελος πόρων περιβάλλοντος δεν υποστηρίζεται.

Λειτουργίες πυρήνα

Το σημειωματάριο Python υποστηρίζει δύο ενσωματωμένους πυρήνες αυτήν τη στιγμή, είναι Python 3.10 και Python 3.11, ο προεπιλεγμένος επιλεγμένος πυρήνας είναι Python 3.11. μπορείτε εύκολα να εναλλάσσεστε μεταξύ τους.

Μπορείτε να διακόψετε, να επανεκκινήσετε ή να αλλάξετε τον πυρήνα στην καρτέλα Αρχική της κορδέλας. Η διακοπή του πυρήνα στα σημειωματάρια Python είναι ίδια με την ακύρωση του κελιού στο σημειωματάριο Spark.

Στιγμιότυπο οθόνης που εμφανίζει λειτουργίες πυρήνα.

Η μη φυσιολογική έξοδος πυρήνα προκαλεί διακοπή της εκτέλεσης κώδικα και απώλεια μεταβλητών, αλλά αυτό δεν διακόπτεται στην περίοδο λειτουργίας του σημειωματάριου.

Υπάρχουν εντολές που μπορεί να οδηγήσουν σε θάνατο του πυρήνα. Για παράδειγμα, , exit().

Διαχείριση βιβλιοθήκης

Μπορείτε να χρησιμοποιήσετε εντολές %pip και %conda για ενσωματωμένες εγκαταστάσεις, οι εντολές υποστηρίζουν δημόσιες βιβλιοθήκες και προσαρμοσμένες βιβλιοθήκες.

Για προσαρμοσμένες βιβλιοθήκες, μπορείτε να αποστείλετε τα αρχεία lib στον φάκελο ενσωματωμένων πόρων. Υποστηρίζουμε πολλούς τύπους βιβλιοθηκών, όπως .whl, .jar, .dll, .pyκ.λπ., απλώς δοκιμάστε να σύρετε&απόθεση στο αρχείο και το τμήμα κώδικα δημιουργείται αυτόματα.

Ίσως χρειαστεί να επανεκκινήσετε τον πυρήνα για να χρησιμοποιήσετε τα ενημερωμένα πακέτα.

Μαγική εντολή ρύθμισης παραμέτρων περιόδου λειτουργίας

Παρόμοια με την εξατομίκευση ενός τη ρύθμιση παραμέτρων περιόδου λειτουργίας Spark στο σημειωματάριο, μπορείτε επίσης να χρησιμοποιήσετε %%configure στο σημειωματάριο Python. Το σημειωματάριο Python υποστηρίζει την προσαρμογή μεγέθους υπολογιστικού κόμβου, τη μοντάρισμα σημείων και την προεπιλεγμένη λίμνη της περιόδου λειτουργίας σημειωματάριου. Μπορούν να χρησιμοποιηθούν σε αλληλεπιδραστικές δραστηριότητες σημειωματάριου και σημειωματάριου διοχέτευσης. Συνιστούμε να χρησιμοποιήσετε %%configure εντολή στην αρχή του σημειωματάριού σας ή πρέπει να επανεκκινήσετε την περίοδο λειτουργίας του σημειωματάριου για να τεθούν σε ισχύ οι ρυθμίσεις.

Ακολουθούν οι υποστηριζόμενες ιδιότητες στο σημειωματάριο Python %%configure:

%%configure
{
    "vCores": 4, // Recommended values: [4, 8, 16, 32, 64], Fabric will allocate matched memory according to the specified vCores.
    "defaultLakehouse": {  
        // Will overwrites the default lakehouse for current session
        "name": "<lakehouse-name>",
        "id": "<(optional) lakehouse-id>",
        "workspaceId": "<(optional) workspace-id-that-contains-the-lakehouse>" // Add workspace ID if it's from another workspace
    },
    "mountPoints": [
        {
            "mountPoint": "/myMountPoint",
            "source": "abfs[s]://<file_system>@<account_name>.dfs.core.windows.net/<path>"
        },
        {
            "mountPoint": "/myMountPoint1",
            "source": "abfs[s]://<file_system>@<account_name>.dfs.core.windows.net/<path1>"
        },
    ],
}

Μπορείτε να προβάλετε την ενημέρωση των υπολογιστικών πόρων στη γραμμή κατάστασης του σημειωματάριου και να παρακολουθήσετε τη χρήση της CPU και της μνήμης του υπολογιστικού κόμβου σε πραγματικό χρόνο.

Στιγμιότυπο οθόνης που εμφανίζει την ενημέρωση υπολογιστικών πόρων.

NotebookUtils

Τα Βοηθητικά προγράμματα σημειωματάριου (NotebookUtils) είναι ένα ενσωματωμένο πακέτο που σας βοηθά να εκτελείτε εύκολα συνήθεις εργασίες στο Fabric Notebook. Είναι προεγκατεστημένη στον χρόνο εκτέλεσης Python. Μπορείτε να χρησιμοποιήσετε το NotebookUtils για να εργαστείτε με συστήματα αρχείων, για να λάβετε μεταβλητές περιβάλλοντος, να αλληλουχήσετε σημειωματάρια, να αποκτήσετε πρόσβαση σε εξωτερικό χώρο αποθήκευσης και να εργαστείτε με μυστικά.

Μπορείτε να χρησιμοποιήσετε notebookutils.help() για να εμφανίσετε τα διαθέσιμα API και να λάβετε βοήθεια σχετικά με τις μεθόδους ή την αναφορά στο έγγραφο NotebookUtils.

Βοηθητικά προγράμματα δεδομένων

Σημείωση

  • Προς το παρόν, η δυνατότητα είναι σε προεπισκόπηση.
  • Η σύμβαση API ενδέχεται να αλλάξει στο εγγύς μέλλον.

Μπορείτε να χρησιμοποιήσετε notebookutils.data βοηθητικά προγράμματα για να δημιουργήσετε μια σύνδεση με την παρεχόμενη προέλευση δεδομένων και, στη συνέχεια, να διαβάσετε και υποβάλετε ερωτήματα σε δεδομένα χρησιμοποιώντας μια πρόταση T-SQL.

Εκτελέστε την ακόλουθη εντολή για να δείτε μια επισκόπηση των διαθέσιμων μεθόδων:

notebookutils.data.help()

Απόδοση:

Help on module notebookutils.data in notebookutils:

NAME
    notebookutils.data - Utility for read/query data from connected data sources in Fabric

FUNCTIONS
    connect_to_artifact(artifact: str, workspace: str = '', artifact_type: str = None) -> pyodbc.Connection
        Establishes and returns an ODBC connection to a specified artifact within a workspace 
        for subsequent data queries using T-SQL.
        
        :param artifact: The name or ID of the artifact to connect to.
        :param workspace:  Optional; The workspace in which the provided artifact is located, if not provided,
                             use the workspace where the current notebook is located.
        :param artifactType: Optional; The type of the artifact, Currently supported type are Lakehouse, Warehouse and MirroredDatabase. 
                                If not provided, the method will try to determine the type automatically.
        :return: A connection object to the specified artifact.
        
        :raises UnsupportedArtifactException: If the specified artifact type is not supported to connect.
        :raises ArtifactNotFoundException: If the specified artifact is not found within the workspace.
        
        Examples:
            sql_query = "SELECT DB_NAME()"
            with notebookutils.data.connect_to_artifact("ARTIFACT_NAME_OR_ID", "WORKSPACE_ID", "ARTIFACT_TYPE") as conn:
                cursor = conn.cursor()
                cursor.execute(sql_query)
                rows = cursor.fetchall()
                for row in rows:
                    print(row)
    
    help(method_name=None)
        Provides help for the notebookutils.data module or the specified method.
        
        Examples:
        notebookutils.data.help()
        notebookutils.data.help("connect_to_artifact")
        :param method_name: The name of the method to get help with.

DATA
    __all__ = ['help', 'connect_to_artifact']

FILE
    /home/trusted-service-user/jupyter-env/python3.11/lib/python3.11/site-packages/notebookutils/data.py

Υποβολή ερωτημάτων για δεδομένα από το Lakehouse

conn = notebookutils.data.connect_to_artifact("lakehouse_name_or_id", "optional_workspace_id", "optional_lakehouse_type")

cursor = conn.cursor()
cursor.execute("SELECT * FROM sys.schemas;")
rows = cursor.fetchall()
for row in rows:
    print(row)

Υποβολή ερωτημάτων για δεδομένα από την Αποθήκη

conn = notebookutils.data.connect_to_artifact("warehouse_name_or_id", "optional_workspace_id", "optional_warehouse_type")

cursor = conn.cursor()
cursor.execute("SELECT * FROM sys.schemas;")
rows = cursor.fetchall()
for row in rows:
    print(row)

Σημείωση

  • Τα βοηθητικά προγράμματα δεδομένων στο NotebookUtils είναι διαθέσιμα μόνο στο σημειωματάριο Python προς το παρόν.
  • Γνωστοί περιορισμοί: Για connect_to_artifact API, το αντικείμενο conn που επιστρέφεται προετοιμάζει εσωτερικά ένα διακριτικό PBI για τον έλεγχο ταυτότητας του χρήστη κατά τη σύνδεση στην προέλευση δεδομένων. Ωστόσο, δεν υποστηρίζει ανανέωση διακριτικού. Προς το παρόν, το διακριτικό PBI είναι έγκυρο μόνο για μία ώρα. Οποιοδήποτε ερώτημα υπερβαίνει τη μία ώρα θα αποτύχει λόγω προβλήματος λήξης διακριτικού.

Περιήγηση σε τμήματα κώδικα

Μπορείτε να βρείτε χρήσιμα τμήματα κώδικα python στην καρτέλα Επεξεργασία -Αναζήτησητμήματος κώδικα, υπάρχουν τώρα διαθέσιμα νέα δείγματα Python. Μπορείτε να μάθετε από το τμήμα κώδικα Python για να ξεκινήσετε την εξερεύνηση του σημειωματάριου.

Στιγμιότυπο οθόνης που εμφανίζει πού μπορείτε να περιηγηθείτε σε τμήματα κώδικα python.

Η σημασιολογική σύνδεση είναι μια δυνατότητα που σας επιτρέπει να δημιουργήσετε μια σύνδεση μεταξύ σημασιολογικών μοντέλων και της επιστήμης δεδομένων Synapse στο Microsoft Fabric. Υποστηρίζεται εγγενώς στο σημειωματάριο Python. Οι μηχανικοί του BI και οι προγραμματιστές Power BI μπορούν να χρησιμοποιούν τη σύνδεση σημασιολογίας για εύκολη σύνδεση και διαχείριση μοντέλου σημασιολογίας. Διαβάστε το του δημόσιου εγγράφου για να μάθετε περισσότερα σχετικά με τη Σημασιολογική σύνδεση.

Απεικόνιση

Εκτός από τη σχεδίαση γραφημάτων με βιβλιοθήκες, η ενσωματωμένη απεικόνιση συνάρτηση σάς επιτρέπει να μετατρέψετε τα DataFrames σε απεικονίσεις δεδομένων εμπλουτισμένης μορφής. Μπορείτε να χρησιμοποιήσετε τη συνάρτηση display() σε πλαίσια δεδομένων για να δημιουργήσετε την προβολή πίνακα εμπλουτισμένου πλαισίου δεδομένων και την προβολή γραφήματος.

Στιγμιότυπο οθόνης που εμφανίζει την εμπειρία απεικόνισης στο σημειωματάριο Python.

Σημείωση

Οι ρυθμίσεις παραμέτρων του γραφήματος θα διατηρηθούν στο σημειωματάριο Python, το οποίο σημαίνει ότι μετά την επανάληψη εκτέλεσης του κελιού κώδικα, εάν το σχήμα πλαισίου δεδομένων προορισμού δεν έχει αλλάξει, τα αποθηκευμένα γραφήματα εξακολουθούν να διατηρούνται.

IntelliSense κώδικα

Το σημειωματάριο Python είναι ενσωματωμένο στο Pylance για τη βελτίωση της εμπειρίας κωδικοποίησης Python και το Pylance είναι η προεπιλεγμένη υποστήριξη υπηρεσίας γλώσσας για την Python στον Κώδικα Visual Studio. Παρέχει πολλές εύχρηστες συναρτήσεις, όπως επισήμανση λέξεων-κλειδιών, γρήγορες πληροφορίες, ολοκλήρωση κώδικα, πληροφορίες παραμέτρων και εντοπισμό σφαλμάτων σύνταξης. Επιπλέον, το Pylance έχει καλύτερες επιδόσεις όταν το σημειωματάριο είναι μεγάλο.

Δυνατότητες επιστήμης δεδομένων

Επισκεφθείτε τεκμηρίωση της Επιστήμης δεδομένων στο Microsoft Fabric για να μάθετε περισσότερα σχετικά με την επιστήμη των δεδομένων και την εμπειρία AI στο Fabric. Εδώ παραθέτουμε μερικές βασικές δυνατότητες της επιστήμης δεδομένων που υποστηρίζονται εγγενώς στο σημειωματάριο Python.

  • Data Wrangler: Το Data Wrangler είναι ένα εργαλείο που βασίζεται σε σημειωματάριο που παρέχει μια συναρπαστική διασύνδεση για την ανάλυση δεδομένων εξερεύνησης. Αυτή η δυνατότητα συνδυάζει μια εμφάνιση δεδομένων τύπου πλέγματος με δυναμικά συνοπτικά στατιστικά στοιχεία, ενσωματωμένες απεικονίσεις και μια βιβλιοθήκη συνήθων λειτουργιών εκκαθάρισης δεδομένων. Παρέχει εκκαθάριση δεδομένων, μετασχηματισμό δεδομένων και ενοποίηση, το οποίο επιταχύνει την προετοιμασία δεδομένων με το Data Wrangler.

  • MLflow: Ένα πείραμα εκμάθησης μηχανής είναι η κύρια μονάδα οργανισμού και ελέγχου για όλες τις σχετικές εκτελέσεις εκμάθησης μηχανής. Μια εκτέλεση αντιστοιχεί σε μία μόνο εκτέλεση κώδικα μοντέλου.

  • αυτόματης καταγραφής Fabric: Η επιστήμη δεδομένων Synapse στο Microsoft Fabric περιλαμβάνει αυτόματη καταγραφή, η οποία μειώνει σημαντικά την ποσότητα κώδικα που απαιτείται για την αυτόματη καταγραφή των παραμέτρων, των μετρικών και των στοιχείων ενός μοντέλου εκμάθησης μηχανής κατά τη διάρκεια της εκπαίδευσης.

    Η αυτόματη καταχώρηση επεκτείνει τις δυνατότητες παρακολούθησης ροής ML. Η αυτόματη καταγραφή μπορεί να καταγράψει διάφορα μετρικά, όπως την ακρίβεια, την απώλεια, τη βαθμολογία F1 και τα προσαρμοσμένα μετρικά που καθορίζετε. Με τη χρήση της αυτόματης καταγραφής, οι προγραμματιστές και οι επιστήμονες δεδομένων μπορούν εύκολα να παρακολουθούν και να συγκρίνουν τις επιδόσεις διαφορετικών μοντέλων και πειραμάτων χωρίς μη αυτόματη παρακολούθηση.

  • copilot: Το Copilot για σημειωματάρια επιστήμης δεδομένων και μηχανικής δεδομένων είναι ένας βοηθός AI που σας βοηθά να αναλύετε και να απεικονίζετε δεδομένα. Λειτουργεί με πίνακες lakehouse, σύνολα δεδομένων Power BI και πλαίσια δεδομένων pandas/spark, παρέχοντας απαντήσεις και τμήματα κώδικα απευθείας στο σημειωματάριο. Μπορείτε να χρησιμοποιήσετε τον πίνακα συνομιλίας Copilot και τα μαγικά Char στο σημειωματάριο και η τεχνητή νοημοσύνη παρέχει απαντήσεις ή κώδικα για αντιγραφή στο σημειωματάριό σας.

Γνωστοί περιορισμοί δημόσιας προεπισκόπησης

  • Η εμπειρία ζωντανής πισίνας δεν είναι εγγυημένη για κάθε εκτέλεση σημειωματάριου python. Ο χρόνος έναρξης περιόδου λειτουργίας μπορεί να φτάσει έως και 3 λεπτά εάν η εκτέλεση του σημειωματάριου δεν χρησιμοποιήσει δυναμικό χώρο συγκέντρωσης, ενώ η χρήση του σημειωματάριου python αυξάνεται, οι έξυπνες μέθοδοι συγκέντρωσης θα αυξήσουν σταδιακά την εκχώρηση του δυναμικού χώρου συγκέντρωσης για να ικανοποιήσει τη ζήτηση.

  • Η ενοποίηση περιβάλλοντος δεν είναι διαθέσιμη στο σημειωματάριο Python μέσω δημόσιας προεπισκόπησης.

  • Το χρονικό όριο περιόδου λειτουργίας δεν είναι διαθέσιμο προς το παρόν.

  • Το Copilot μπορεί να δημιουργήσει μια πρόταση Spark, η οποία μπορεί να μην είναι εκτελέσιμη στο σημειωματάριο Python.

  • Προς το παρόν, το Copilot στο σημειωματάριο Python δεν υποστηρίζεται πλήρως σε πολλές περιοχές. Η διαδικασία ανάπτυξης παραμένει σε εξέλιξη. Συνεχίστε να είστε συντονισμένοι καθώς συνεχίζουμε να προσφέρουμε υποστήριξη σε περισσότερες περιοχές.