Tekoälypalvelut Fabricissa (esiversio)
Azuren tekoälypalveluiden auttaa kehittäjiä ja organisaatioita luomaan nopeasti älykkäitä, huippuluokan, markkinavalmiita ja vastuullisia sovelluksia, joissa on valmiita ja mukautettavia ohjelmointirajapintoja ja malleja. Aiemmin Azuren kognitiivisten palvelujen
Fabric tarjoaa kaksi vaihtoehtoa Azuren tekoälypalvelujen käyttöön:
valmiista Tekoälymalleista Fabricissa (esiversio)
Fabric integroituu saumattomasti Azuren tekoälypalveluihin, joten voit rikastaa tietojasi valmiilla tekoälymalleilla ilman edellytyksiä. Suosittelemme tätä vaihtoehtoa, koska voit käyttää Tekoälypalveluja Fabric-todennuksen avulla ja kaikki käyttö laskutetaan Fabric-kapasiteettisi perusteella. Tämä asetus on tällä hetkellä julkisessa esikatselussa, ja saatavilla on rajoitettuja tekoälypalveluja.
Fabric tarjoaa oletusarvoisesti Azure OpenAI -palvelun, Tekstianalyysisekä Azure AI Translatorin sekä SynapseML:n että RESTful-ohjelmointirajapinnan tuen ansiosta. Voit käyttää Myös OpenAI Python -kirjastoa Azure OpenAI -palvelun käyttämiseen Fabricissa. Saat lisätietoja käytettävissä olevista malleista Fabric:n valmiiden tekoälymallien
. Bring your own key (BYOK) -
Voit valmistella tekoälypalvelusi Azuressa ja tuoda oman avaimesi, jotta voit käyttää niitä Fabricista. Jos valmiit tekoälymallit eivät vielä tue haluttuja tekoälypalveluita, voit silti käyttää BYOK:ta (Tuo oma avaimesi).
Saat lisätietoja Azure-tekoälypalveluiden käytöstä BYOK:n kanssa SynapseML :n Azure-tekoälypalveluista oman avaimen avulla.
Valmiit tekoälymallit Fabricissa (esiversio)
Muistiinpano
Valmiit tekoälymallit ovat tällä hetkellä saatavilla esikatselussa ja tarjotaan maksutta, joten samanaikaisten pyyntöjen määrää käyttäjää kohden on rajoitettu. Avoimien tekoälymallien tapauksessa rajoitus on 20 pyyntöä minuuttia kohti käyttäjää kohti.
Azure OpenAI -palvelu
REST API, Python SDK. SynapseML
- GPT-35-turbo: GPT-3.5-mallit voivat ymmärtää ja luoda luonnollista kieltä tai koodia. TEHOKKAIN ja kustannustehokkain malli GPT-3.5-perheessä on GPT-3. Keskusteluihin optimoitu
5 Turbo
-vaihtoehto toimii hyvin myös perinteisissä viimeistelytehtävissä. Malligpt-35-turbo-0125
tukee enintään 16 385 syötetunnusta ja 4 096 tulostetunnusta. - gpt-4-perhe:
gpt-4-32k
tuetaan. - text-embedding-ada-002 (versio 2), upotusmalli, jota voidaan käyttää upottaviin ohjelmointirajapintapyyntöihin. Suurin hyväksytty pyyntötunnus on 8 191 ja palautetun vektorin dimensiot 1 536.
Tekstianalyysi
- Kielen tunnistaminen: tunnistaa syötetekstin kielen
- Asenneanalyysi: palauttaa pistemäärän 0–1 ilmaisemaan asenteen syötetekstissä
- Avainlauseiden poiminta: tunnistaa syötteen tekstin tärkeimmät puhepisteet
- Personally Identifiable Information(PII) -entiteetin tunnistaminen: luottamuksellisten tietojen tunnistaminen, luokitteleminen ja uudelleenkirjoittamista syötetekstissä
- Nimetty entiteetin tunnistaminen: tunnistaa tunnetut entiteetit ja yleiset nimetyt entiteetit syötetekstissä
- Entiteetin linkitys: tunnistaa ja selvittää tekstistä löytyneiden entiteettien käyttäjätiedot
Azure AI Translator
- Käännä: kääntää tekstin
- Muunna: muuntaa yhden kielen tekstin yhdellä komentosarjalla toiseksi komentosarjaksi.
Käytettävissä olevat alueet
Azure OpenAI -palvelun käytettävissä olevat alueet
Löydät luettelon Azure-alueista, joissa Valmiit tekoälypalvelut Fabricissa ovat nyt saatavilla, Käytettävissä olevat alueet -osiosta artikkelin Yleiskatsaus Copilot Fabricissa ja Power BI:ssä (esikatselu).
Tekstianalyysin ja Azure AI Translatorin käytettävissä olevat alueet
Valmis tekstianalyysi - ja Azure AI Translator - Fabricissa ovat nyt julkisesti esiversioita käytettävissä tässä artikkelissa luetelluilla Azure-alueilla. Jos et löydä Microsoft Fabric -kotialuettasi tästä artikkelista, voit edelleen luoda Microsoft Fabric -kapasiteetin tuetulla alueella. Lisätietoja on kohdassa Osta Microsoft Fabric -tilaus. Jos haluat selvittää Fabric-kotialueesi, siirry kohtaan Etsi Fabric-kotialueesi.
Tyynenmeren Aasia | Eurooppa | Amerikat | Lähi-itä ja Afrikka. |
---|---|---|---|
Australia, itäinen | Pohjois-Eurooppa | Brasilia, eteläinen | Etelä-Afrikka, pohjoinen |
Kaakkois-Australia | Länsi-Eurooppa | Kanada, keskinen | Yhdistyneet arabiemiirikunnat, pohjoinen |
Keski-Intia | Ranska, keskinen | Kanada, itä | |
Itä-Aasia | Norja, itäinen | Itäinen Yhdysvallat | |
Japani, itä | Sveitsi, pohjoinen | Itä-Yhdysvallat 2 | |
Keski-Korea | Sveitsi läntinen | Yhdysvaltojen pohjoinen keskiosa | |
Kaakkois-Aasia | Yhdistynyt kuningaskunta, etelä | Yhdysvaltojen eteläinen keskiosa | |
Etelä-Intia | Yhdistynyt kuningaskunta, länsi | Länsi-Yhdysvallat | |
Länsi-Yhdysvallat 2 | |||
Länsi-Yhdysvallat 3 |
Kulutusaste
Muistiinpano
Fabricin valmis tekoälypalveluiden laskutus tuli voimaan 1.11.2024 osana olemassa olevaa Power BI Premium- tai Fabric-kapasiteettiasi.
Valmis tekoälypalvelupyyntö käyttää Fabric-kapasiteetin yksiköitä. Tässä taulukossa määritetään, kuinka monta kapasiteettiyksikköä (CU) käytetään tekoälypalvelun käytön yhteydessä.
OpenAI-kielimallien kulutusaste
Models - | Context | syöte (1 000 tunnusta kohti) | tulos (1 000 tunnusta kohti) |
---|---|---|---|
GPT-4o-2024-08-06 yleinen käyttöönotto | 128 k | 84,03 CU sekuntia | 336,13 CU sekuntia |
GPT-4 | 32 k | 2 016,81 CU sekuntia | 4 033,61 CU sekuntia |
GPT-3.5-Turbo-0125 | 16 tuhatta | 16,81 CU sekuntia | 50,42 CU sekuntia |
OpenAI-upotusmallien kulutusaste
Models - | mittayksikön | kulutusasteen |
---|---|---|
text-embedding-ada-002 | 1 000 tunnusta | 3,36 CU sekuntia |
Tekstianalyysin kulutusaste
Toiminnon | mittayksikön | kulutusasteen |
---|---|---|
Kielen tunnistaminen | 1 000 tekstitietuetta | 33 613,45 CU sekuntia |
Asenneanalyysi | 1 000 tekstitietuetta | 33 613,45 CU sekuntia |
Avainlauseiden poiminta | 1 000 tekstitietuetta | 33 613,45 CU sekuntia |
Tietojen entiteetin tunnistaminen henkilökohtaisesti | 1 000 tekstitietuetta | 33 613,45 CU sekuntia |
Nimetty entiteetin tunnistaminen | 1 000 tekstitietuetta | 33 613,45 CU sekuntia |
Entiteetin linkitys | 1 000 tekstitietuetta | 33 613,45 CU sekuntia |
Yhteenvetoa | 1 000 tekstitietuetta | 67 226,89 CU sekuntia |
Tekstikääntäjän kulutusaste
Toiminnon | mittayksikön | kulutusasteen |
---|---|---|
Kääntää | 1 min merkkiä | 336 134,45 CU sekuntia |
Translitteroida | 1 min merkkiä | 336 134,45 CU sekuntia |
Fabric-kulutusasteen tekoälypalveluiden muutokset
Kulutusluvut voivat muuttua milloin tahansa. Microsoft pyrkii kohtuullisesti antamaan ilmoituksen sähköpostitse tai tuotteen sisäisellä ilmoituksella. Muutokset ovat voimassa Microsoftin julkaisutiedoissa tai Microsoft Fabric -blogissa mainittuna päivänä. Jos Fabric Consumption Raten tekoälypalvelun muutos kasvattaa merkittävästi käytettävän kapasiteetin yksiköitä (CU), asiakkaat voivat käyttää valitun maksutavan peruuttamisvaihtoehtoja.
Käytön valvonta
Tehtävään liittyvä kuormitusmittari määrittää Fabricin valmiit tekoälypalveluiden maksut. Jos esimerkiksi tekoälypalvelun käyttö saadaan Spark-kuormituksesta, tekoälyn käyttö ryhmitetään yhteen ja laskutetaan Fabric Capacity Metrics -sovelluksen Spark-laskutusmittarissa.
Esimerkki
Verkkokaupan omistaja käyttää SynapseML:ää ja Sparkiä miljoonien tuotteiden luokittelemiseen asianmukaisiin luokkiin. Tällä hetkellä myymälän omistaja käyttää pysyväiskoodausta logiikkaa raakatuotetyypin puhdistamiseen ja liittamiseen luokkiin. Omistaja suunnittelee kuitenkin siirtyvänsä käyttämään uutta alkuperäistä Fabric OpenAI LLM (Large Language Model) -päätepistettä. Tämä käsittelee tiedot iteratiivisesti kunkin rivin LLM:n avulla ja luokittelee sitten tuotteet niiden "tuotteen nimen", "kuvauksen", "teknisten tietojen" ja niin edelleen perusteella.
Spark-käytön odotettu kustannus on 1 000 CUs. OpenAI-käytön odotettu kustannus on noin 300 CUs.
Jos haluat testata uutta logiikkaa, iteroi se ensin Spark-muistikirjan vuorovaikutteisessa ajossa. Kirjoita suorituksen toiminnon nimeksi "Notebook Interactive Run". Omistaja odottaa näkevänsa 1 300 CUs:n käyttötiedot kohdassa "Notebook Interactive Run", jossa Spark-laskutusmittari vastaa koko käyttöä.
Kun myymälän omistaja vahvistaa logiikan, omistaja määrittää tavallisen suorituksen ja odottaa näkevänsä 1 300 varastointiyksikköä toiminnon nimellä "Spark Job Scheduled Run" niin, että Spark-laskutusmittari vastaa koko käyttöä.