Partager via


Galerie d’échantillons d’IA sur Windows

Une collection d’exemples qui démontrent une variété de façons d’améliorer vos applications Windows en utilisant des API locales et des modèles Machine Learning (ML), l’accélération matérielle locale à l’aide de DirectML, et l’utilisation d’API basées sur le cloud.

Améliorer vos applications Windows avec l’IA en utilisant des API locales et des modèles ML

Ces exemples vous aideront à améliorer vos applications Windows avec l’IA en utilisant des API locales et des modèles Machine Learning.

Éditeur audio basé sur l’intelligence artificielle

Capture d’écran de l’échantillon d’application d’éditeur audio montrant un test de plug-in de découpage audio IA.

Dépôt GitHub : échantillon d’éditeur d’audio IA

Description : l’éditeur audio basé sur l’intelligence artificielle illustre la création d’une application d’édition audio WinUI 3 qui utilise l’IA pour faire correspondre les captures de l’audio à une requête pertinente. Par exemple, nous pourrions prendre le cas d’utilisation d’un créateur de podcasts qui souhaite réaliser de courts clips audio de son contenu pour le promouvoir sur les réseaux sociaux. L’échantillon utilise l’inférence de modèle ML local pour gérer la transcription et la recherche sémantique.

Fonctionnalités : inférence de modèle local avec le runtime ONNX, le modèle Whisper, le modèle Embeddings

Type d’application : C#, WinUI 3

Application Notes basée sur l’intelligence artificielle

Capture d’écran de l’échantillon d’application de notes basée sur l’IA montrant un résumé créé par l’IA.

Dépôt GitHub : échantillon d’application de notes basée sur l’IA

Description : cette application de prise de notes basée sur l’IA illustre l’utilisation d’API, notamment la reconnaissance de texte OCR, la transcription audio par le biais du modèle ML local, la recherche sémantique par le biais d’un modèle d’incorporation local, l’utilisation du modèle de langage local avec Phi3 pour résumé, la saisie semi-automatique et le raisonnement du texte, et la génération augmentée de récupération (RAG) pour fonder des modèles de langage sur des données réelles.

Fonctionnalités : recherche sémantique avec modèle local, transcription audio avec modèle local, génération augmentée de récupération (RAG) avec Phi3, synthèse de texte local et raisonnement avec Phi3, extraction de texte à partir d’images avec l’API OCR

Type d’application : C#, WinUI 3

Génération augmentée de récupération (RAG) avec des fichiers PDF et Phi3

Capture d’écran de l’exemple RAG PDF Analyzer dans une application WPF.

Dépôt GitHub : échantillon d’application WPF de l’analyseur PDF RAG

Description : cet échantillon d’application WPF montre comment créer une expérience avec un modèle de langage local (tel que Phi3) pour répondre à des questions sur le contenu d’un document PDF. L’échantillon trouve des réponses en référençant une base de connaissances en dehors des propres données d’apprentissage du modèle avant de générer une réponse. Ce modèle, appelé de génération augmentée de récupération (RAG), est un exemple de la façon de baser un modèle de langage sur des données faisant autorité dans la réalité.

Fonctionnalités : génération augmentée de récupération (RAG), IA générative ONNX Runtime, DirectML

Type d’application : C#, WPF

Discussion avec l’IA générative de Phi3

Capture d’écran d’un exemple de chat GenAI utilisant Phi3 dans une application WinUI 3.

Dépôt GitHub : échantillon WinUI 3 de conversation Phi3

Description : cet échantillon d’application WinUI 3 montre comment utiliser la bibliothèque d’IA générative du runtime ONNX pour créer une expérience de conversation avec un modèle de langage local, en particulier le petit modèle de langage (SLM) Phi3.

Fonctionnalités : Phi3, IA générative ONNX Runtime, DirectML

Type d’application : C#, WinUI 3

Échantillon d’effets Windows Studio

Dépôt GitHub : échantillon d’application effets Windows Studio

Description : découvrez comment contrôler les effets Caméra Studio à partir de votre application Windows dans cet exemple de code. Vérifiez si une caméra prise en charge est disponible sur le système (nécessite un appareil doté d’un NPU et d’une caméra intégrée), puis obtenez et définissez des contrôles de caméra étendus associés à Windows Studio Effects, tels que le flou d’arrière-plan, la correction du regard et le cadrage automatique.

Fonctionnalités : Windows Studio Effects

Type d’application : C#, WPF

Accélération matérielle locale via DirectML

Diffusion stable accélérée matériellement sur le web

Capture d’écran d’un exemple d’application web Stable Diffusion.

Dépôt GitHub : WebNN Stable Diffusion Turbo

Description : cet échantillon montre comment utiliser WebNN avec ONNX Runtime web pour exécuter une diffusion stable localement sur le GPU avec DirectML. SD-Turbo est un modèle de texte à image de génération rapide qui peut synthétiser des images photoréalistes à partir d’une invite de texte dans une seule évaluation réseau. Dans la démonstration, vous pouvez générer une image en 2s sur des appareils PC IA en tirant profit de l’API WebNN, une API de bas niveau dédiée pour l’accélération matérielle d’inférence de réseau neuronal.

Fonctionnalités : génération d’images locales, WebNN, DirectML

Type d’application : JavaScript, applications web

Segment Anything accéléré matériellement sur le web

Dépôt GitHub : WebNN Segment Anything

Description : cet échantillon montre comment utiliser WebNN avec ONNX Runtime web pour exécuter Segment Anything localement sur le GPU avec DirectML. Segment Anything est un nouveau modèle IA de Meta AI qui peut « découper » n’importe quel objet. Dans la démonstration, vous pouvez segmenter n’importe quel objet à partir de vos images chargées.

Fonctionnalités : segmentation d’images locales, WebNN, DirectML

Type d’application : JavaScript, applications web

Whisper accéléré matériellement sur le web

Dépôt GitHub : WebNN Whisper Base

Description : cet échantillon montre comment utiliser WebNN avec ONNX Runtime web pour exécuter les fonctionnalités de reconnaissance vocale du modèle Whisper localement sur le GPU ou le NPU avec DirectML. Whisper Base est un modèle préentraîné pour la reconnaissance vocale automatique (ASR) et la traduction vocale. Dans la démonstration, vous pouvez découvrir la fonctionnalité de reconnaissance vocale à l’aide de l’inférence sur appareil alimentée par l’API WebNN et DirectML, en particulier l’accélération du NPU.

Fonctionnalités : reconnaissance vocale locale, WebNN, DirectML

Type d’application : JavaScript, applications web

Accélération matérielle et pré-optimisation des modèles de langage ONNX Runtime (Phi3, Llama3, etc) avec DirectML

Capture d’écran d’un exemple de modèle ONNX DirectML LLM Chat UI.

Référentiel GitHub : Exemples de DirectML dans le référentiel Olive

Description : cet exemple illustre comment exécuter un modèle de langage ONNX Runtime (ORT) pré-optimisé localement sur le GPU avec DirectML. L’exemple comprend des instructions sur la façon de configurer votre environnement, de télécharger les derniers modèles de langage pré-entraînés en utilisant l’API ORT Generate et d’entraîner le modèle dans une application Gradio.

Caractéristiques : accélération matérielle, GenAI, ONNX, ONNX Runtime, DirectML

Type d’application : Python, Gradio

Modèles PyTorch accélérés matériellement (Phi3, Llama3, etc) avec DirectML

Capture d’écran de l’exemple de DirectML pour PyTorch.

Référentiel GitHub : Exemples de DirectML pour PyTorch

Description : cet échantillon montre comment exécuter un modèle de langage PyTorch localement sur le GPU avec DirectML. L’exemple comprend des instructions sur la façon de configurer votre environnement, de télécharger les derniers modèles de langage pré-entraînés et d’entraîner le modèle dans une application Gradio. Cet exemple prend en charge divers modèles de langage open source tels que les modèles Llama, Phi3-mini, Phi2 et Mistral-7B.

Caractéristiques : accélération matérielle, PyTorch, DirectML

Type d’application : Python, Gradio

Améliorer vos applications Windows avec l’IA à l’aide d’API cloud

Vous trouverez d’autres échantillons d’API cloud dans la documentation des services Azure AI.

Ajouter des achèvements de conversation OpenAI à votre application WinUI 3 / SDK d’application Windows

Tutoriel : Ajouter des saisies de conversation OpenAI à votre application WinUI 3 / SDK d’application Windows

Description : intégrez les fonctionnalités de saisie de conversation OpenAI dans une application bureautique WinUI 3/SDK d’application Windows.

Fonctionnalités : saisie de conversation OpenAI

Type d’application : C#, WinUI 3

Ajoutez DALL-E à votre application bureautique WinUI 3 / Windows App SDK

Tutoriel : Ajouter DALL-E à votre application bureautique WinUI 3 / SDK d’application Windows

Description : intégrez les fonctionnalités de génération d’images OpenAI DALL-E à une application bureautique WinUI 3 / SDK d’application Windows.

Fonctionnalités : génération d’images

Type d’application : C#, WinUI 3

Créer une application de recommandation avec .NET MAUI et ChatGPT

Tutoriel : Créer une application de recommandations avec .NET MAUI et ChatGPT

Description : intégrez les fonctionnalités de saisie de conversation OpenAI dans une application bureautique .NET MAUI.

Fonctionnalités : génération d’images

Type d’application : C#, .NET MAUI

Ajouter DALL-E à votre application bureautique .NET MAUI sur Windows

Tutoriel : Ajouter DALL-E à votre application bureautique .NET MAUI sur Windows

Description : intégrez les fonctionnalités de génération d’images OpenAI DALL-E à une application bureautique .NET MAUI.

Fonctionnalités : génération d’images

Type d’application : C#, .NET MAUI

Échantillons WinML hérités

Dépôt GitHub : échantillons WinML sur GitHub

Description : WinML continue d’être pris en charge, mais ces échantillons n’ont pas été mis à jour pour refléter l’utilisation moderne de l’IA.