Grote taalmodellen (LLM's) in Databricks
Met Azure Databricks kunt u eenvoudig grote taalmodellen openen en bouwen.
Databricks Runtime voor Machine Learning bevat bibliotheken zoals Hugging Face Transformers en LangChain waarmee u bestaande vooraf getrainde modellen of andere opensourcebibliotheken in uw werkstroom kunt integreren. Hier kunt u gebruikmaken van de mogelijkheden van het Azure Databricks-platform om LLM's af te stemmen met behulp van uw eigen gegevens voor betere domeinprestaties.
Daarnaast biedt Azure Databricks ingebouwde functionaliteit voor SQL-gebruikers om toegang te krijgen tot EN te experimenteren met LLM's zoals Azure OpenAI en OpenAI met behulp van AI-functies.
Foundation Model Fine-tuning
Belangrijk
Deze functie is beschikbaar als openbare preview. Neem contact op met uw Databricks-accountteam om u in te schrijven voor de openbare preview.
Foundation Model Fine-tuning (nu onderdeel van Mosaic AI Model Training) is een eenvoudige interface voor de Databricks-trainingsstack om volledig modelafstemming uit te voeren.
U kunt het volgende doen met behulp van Foundation Model Fine-tuning:
- Verfijn een model met uw aangepaste gegevens, met de controlepunten die zijn opgeslagen in MLflow. U behoudt volledige controle over het verfijnde model.
- Registreer het model automatisch bij Unity Catalog, zodat het eenvoudig kan worden ingezet met modelbediening.
- Verfijn een voltooid, eigen model door de gewichten van een eerder afgestemd model te laden.
Zie Foundation Model Fine-tuning.
Gezichtstransformaties omhelzen
Met Hugging Face Transformers op Databricks kunt u uw NLP-batchtoepassingen (Natural Language Processing) uitschalen en modellen verfijnen voor grootschalige modeltoepassingen.
De Hugging Face-bibliotheek transformers
is vooraf geïnstalleerd op Databricks Runtime 10.4 LTS ML en hoger. Veel van de populaire NLP-modellen werken het beste op GPU-hardware, dus u krijgt mogelijk de beste prestaties met recente GPU-hardware, tenzij u een model gebruikt dat speciaal is geoptimaliseerd voor gebruik op CPU's.
DSPy
DSPy automatiseert het afstemmen van prompts door door de gebruiker gedefinieerde handtekeningen voor natuurlijke taal te vertalen in volledige instructies en enkele voorbeelden.
Zie Build GenAI-apps met behulp van DSPy in Azure Databricks voor voorbeelden over het gebruik van DSPy.
LangChain
LangChain is beschikbaar als experimentele MLflow-smaak waarmee LangChain-klanten rechtstreeks vanuit de Azure Databricks-omgeving gebruikmaken van de robuuste hulpprogramma's en mogelijkheden voor het bijhouden van experimenten van MLflow.
LangChain is een softwareframework dat is ontworpen om toepassingen te maken die gebruikmaken van grote taalmodellen (LLM's) en deze te combineren met externe gegevens om meer trainingscontext voor uw LLM's te creëren.
Databricks Runtime ML bevat databricks langchain
Runtime 13.1 ML en hoger.
Meer informatie over Databricks-specifieke LangChain-integraties.
AI-functies
Belangrijk
Deze functie is beschikbaar als openbare preview.
AI-functies zijn ingebouwde SQL-functies waarmee SQL-gebruikers:
- Gebruik Databricks Foundation Model-API's om verschillende taken uit te voeren op de gegevens van uw bedrijf.
- Open externe modellen zoals GPT-4 vanuit OpenAI en experimenteer ermee.
- Querymodellen die worden gehost door Mosaic AI Model Serving-eindpunten van SQL-query's.