Koneoppimismalli Microsoft Fabricissa
Koneoppimismalli on tiedosto, joka on harjoitettu tunnistamaan tietyntyyppiset mallit. Harjoitat mallin tietojoukolla ja annat sille algoritmin, joka käyttää järkeillään ja oppiakseen tästä tietojoukosta. Kun olet harjoittanut mallin, voit sen avulla järkeillä tietoja, joita se ei ole ennen nähnyt, ja tehdä ennusteita tiedoista.
MLflow'ssa koneoppimismalli voi sisältää useita malliversioita. Tässä kukin versio voi edustaa mallin iterointia. Tässä artikkelissa kerrotaan, miten voit käsitellä koneoppimismalleja malliversioiden seuraamista ja vertailemista.
Koneoppimismallin luominen
MLflow'ssa koneoppimismallit sisältävät vakiopaketointimuodon. Tämä muoto sallii näiden mallien käytön eri jatkojalostustyökaluissa, mukaan lukien erän asteikkopäätteen Apache Sparkissä. Muoto määrittää käytännön tallentaa mallin eri makuihin, jotka eri jatkotyökalut ymmärtävät.
Voit luoda koneoppimismallin suoraan Fabric-käyttöliittymästä. MLflow-ohjelmointirajapinta voi myös luoda mallin suoraan.
Voit luoda koneoppimismallin käyttöliittymästä seuraavasti:
Luo uusi tietotiedetyötila tai valitse aiemmin luotu tietotieteen työtila.
Luo tyhjä malli datatieteen työtilaan valitsemalla avattavasta + Uusi -valikosta Malli.
Mallin luomisen jälkeen voit aloittaa malliversioiden lisäämisen suoritusmittareiden ja parametrien seuraamiseksi. Rekisteröi tai tallenna kokeita -suoritukset olemassa olevaan malliin.
Voit myös luoda koneoppimiskokeiluja suoraan ohjelmointirajapinnan suodatuskokemuksestasi mlflow.register_model()
. Jos rekisteröityä koneoppimismallia, jolla on etunimi, ei ole olemassa, ohjelmointirajapinta luo sen automaattisesti.
import mlflow
model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")
print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))
Koneoppimismallin versioiden hallinta
Koneoppimismalli sisältää kokoelman malliversioita yksinkertaistettua seurantaa ja vertailua varten. Mallissa tietotutkija voi siirtyä eri malliversioiden välillä ja tarkastella pohjana olevia parametreja ja mittareita. Tietotutkijat voivat myös tehdä vertailuja malliversioiden välillä tunnistaakseen, voisivatko uudemmat mallit tuottaa parempia tuloksia.
Koneoppimismallien seuraaminen
Koneoppimismalliversio edustaa yksittäistä mallia, joka on rekisteröity seurantaan.
Kukin malliversio sisältää seuraavat tiedot:
- Luotu aika: Mallin luonnin päivämäärä ja aika.
- Suorita nimi: Tämän tietyn malliversion luomiseen käytettyjen kokeilu kokeiden suoritusten tunniste.
- Hyperparametrit: Hyperparametrit tallennetaan avain-arvo-pareina. Sekä avaimet että arvot ovat merkkijonoja.
- Mittarit: Suorita mittarit, jotka on tallennettu avain-arvo-pareina. Arvo on numeerinen.
- Mallin rakenne/allekirjoitus: Mallin syötteiden ja tulosten kuvaus.
- Kirjatut tiedostot: Kirjatut tiedostot missä tahansa muodossa. Voit esimerkiksi tallentaa kuvia, ympäristöjä, malleja ja datatiedostoja.
Koneoppimismallien vertaaminen ja suodattaminen
Jos haluat vertailla ja arvioida koneoppimisen malliversioiden laatua, voit verrata parametreja, mittareita ja metatietoja valittujen versioiden välillä.
Koneoppimismallien visuaalinen vertailu
Voit verrata suoritukset visuaalisesti olemassa olevassa mallissa. Visualisointivertailu mahdollistaa helpon siirtymisen useiden versioiden välillä ja lajittelemisen välillä.
Voit verrata suoria suoritukset:
- Valitse aiemmin luotu koneoppimismalli, joka sisältää useita versioita.
- Valitse Näytä-välilehti ja siirry sitten Malli-luettelonäkymään. Voit myös valita Näytä malliluettelo -vaihtoehdon suoraan tietonäkymästä.
- Voit mukauttaa taulukon sarakkeita. Laajenna Mukauta sarakkeita - ruutu. Sieltä voit valita haluamasi ominaisuudet, mittarit ja hyperparametrit.
- Lopuksi voit valita useita versioita niiden tulosten vertailemiseksi mittausten vertailuruudussa. Tässä ruudussa voit mukauttaa kaavioita, joissa on muutoksia kaavion otsikkoon, visualisointityyppiin, X-akseliin, Y-akseliin ja niin edelleen.
Koneoppimismallien vertaaminen MLflow-ohjelmointirajapinnan avulla
Tietotutkijat voivat myös MLflow'n avulla tehdä hakuja useista työtilaan tallennettavista malleista. Tutustu MLflow-dokumentaatioon, jos haluat tutustua muihin MLflow-ohjelmointirajapintoihin mallin vuorovaikutusta varten.
from pprint import pprint
client = MlflowClient()
for rm in client.list_registered_models():
pprint(dict(rm), indent=4)
Koneoppimismallien käyttäminen
Kun harjoitat mallin tietojoukolla, voit käyttää kyseistä mallia tietoihin, joita se ei ole koskaan nähnyt ennusteiden luomiseksi. Kutsumme tätä mallia tekniikoiden pisteytyksellä tai päätelyllä. Lisätietoja Microsoft Fabric -mallin pisteytyksestä on seuraavassa osiossa.