Создание приложения со списком матчей с помощью Infer.NET и вероятностного программирования

Статья
04/11/2023

Это руководство содержит сведения о вероятностном программировании с использованием Infer.NET. Вероятностное программирование — это метод машинного обучения, который позволяет выражать пользовательские модели в виде компьютерных программ. Он позволяет включить в модель знания о предметной области и делает систему машинного обучения более логичной и понятной. Также он поддерживает оперативный вывод, то есть обучение по мере поступления новых данных. Infer.NET используется в нескольких продуктах корпорации Майкрософт, например Azure, Xbox и Bing.

Что такое вероятностное программирование?

Вероятностное программирование позволяет создавать статистические модели для реальных процессов.

Необходимые компоненты

Локальная среда разработки.

Для работы с этим руководством вам потребуется компьютер, который можно использовать для разработки. В руководстве по созданию программы Hello World за 10 минут содержатся инструкции по настройке локальной среды разработки в macOS, Windows или Linux.

Создание своего приложения

Откройте новое окно командной строки и выполните следующие команды:

dotnet new console -o myApp
cd myApp

Команда dotnet создает приложение new с типом console. Параметр -o создает каталог с именем myApp, в котором хранится само приложение и используемые им файлы. Команда cd myApp переносит вас в только что созданный каталог приложения.

Установка пакета Infer.NET

Чтобы использовать Infer.NET, необходимо установить пакет Microsoft.ML.Probabilistic.Compiler. В командной строке выполните следующую команду:

dotnet add package Microsoft.ML.Probabilistic.Compiler

Разработка модели

Этот пример использует таблицу проведенных в офисе компании матчей по настольному теннису или кикеру. Для каждого матча указаны участники и результаты. Теперь на основе этих данных вы можете определить навыки каждого игрока. Предположим, что каждый игрок обладает навыком с нормальным распределением, а его результаты в матчах определяются значением этого навыка с наложением некоторого шума. Данные определяют ограничения для результатов игрока: у победителя они должны быть выше, чем у проигравшего. Это упрощенная версия популярной модели TrueSkill, которая также поддерживает группы поддержки, ничьи и другие расширения. Расширенная версия этой модели используется для сопоставления игроков в популярных играх Halo и Gears of War.

Вам нужно получить список игроков с оценкой значения навыка и неопределенности этого значения.

Пример данных о результатах игр

Игровой	Победитель	Проигравший
1	Игрок 0	Игрок 1
2	Игрок 0	Игрок 3
3	Игрок 0	Игрок 4
4	Игрок 1	Игрок 2
5	Игрок 3	Игрок 1
6	Игрок 4	Игрок 2

Изучив эти данные, вы заметите, что у игроков 3 и 4 есть по одной победе и одному поражению. Давайте узнаем, какие оценки они получат по методу вероятностного программирования. Заметьте, что даже в офисных матчах нумерация игроков начинается с 0.

Написание кода

Итак, мы создали модель, которую теперь можно выразить в виде вероятностной программы с помощью API-интерфейса Infer.NET для моделирования. Откройте Program.cs в любом текстовом редакторе и замените все его содержимое следующим кодом:

namespace myApp

{
    using System;
    using System.Linq;
    using Microsoft.ML.Probabilistic;
    using Microsoft.ML.Probabilistic.Distributions;
    using Microsoft.ML.Probabilistic.Models;

    class Program
    {

        static void Main(string[] args)
        {
            // The winner and loser in each of 6 samples games
            var winnerData = new[] { 0, 0, 0, 1, 3, 4 };
            var loserData = new[] { 1, 3, 4, 2, 1, 2 };

            // Define the statistical model as a probabilistic program
            var game = new Range(winnerData.Length);
            var player = new Range(winnerData.Concat(loserData).Max() + 1);
            var playerSkills = Variable.Array<double>(player);
            playerSkills[player] = Variable.GaussianFromMeanAndVariance(6, 9).ForEach(player);

            var winners = Variable.Array<int>(game);
            var losers = Variable.Array<int>(game);

            using (Variable.ForEach(game))
            {
                // The player performance is a noisy version of their skill
                var winnerPerformance = Variable.GaussianFromMeanAndVariance(playerSkills[winners[game]], 1.0);
                var loserPerformance = Variable.GaussianFromMeanAndVariance(playerSkills[losers[game]], 1.0);

                // The winner performed better in this game
                Variable.ConstrainTrue(winnerPerformance > loserPerformance);
            }

            // Attach the data to the model
            winners.ObservedValue = winnerData;
            losers.ObservedValue = loserData;

            // Run inference
            var inferenceEngine = new InferenceEngine();
            var inferredSkills = inferenceEngine.Infer<Gaussian[]>(playerSkills);

            // The inferred skills are uncertain, which is captured in their variance
            var orderedPlayerSkills = inferredSkills
               .Select((s, i) => new { Player = i, Skill = s })
               .OrderByDescending(ps => ps.Skill.GetMean());

            foreach (var playerSkill in orderedPlayerSkills)
            {
                Console.WriteLine($"Player {playerSkill.Player} skill: {playerSkill.Skill}");
            }
        }
    }
}

Запустите приложение.

В командной строке выполните следующую команду:

dotnet run

Результаты

Результаты выполнения должны выглядеть примерно так:

Compiling model...done.
Iterating:
.........|.........|.........|.........|.........| 50
Player 0 skill: Gaussian(9.517, 3.926)
Player 3 skill: Gaussian(6.834, 3.892)
Player 4 skill: Gaussian(6.054, 4.731)
Player 1 skill: Gaussian(4.955, 3.503)
Player 2 skill: Gaussian(2.639, 4.288)

Как вы видите, в результатах применения нашей модели игрок 3 расположен немного выше, чем игрок 4. Это связано с тем, что победа игрока 3 над игроком 1 гораздо важнее, чем победа игрока 4 над игроком 2, ведь игрок 1 в своем матче обыграл игрока 2. Но несомненным чемпионом стал игрок 0!

Продолжение обучения

Разработка статистических моделей является важным навыком. Команда исследователей корпорации Майкрософт из Кембриджа подготовила бесплатную онлайн-книгу, которая служит своеобразным введением к этой статье. В главе 3 этой книги модель TrueSkill рассматривается более подробно. Придумав свою модель, преобразуйте ее в код с помощью подробной документации на веб-сайте Infer.NET.

Следующие шаги

Изучите наш репозиторий на GitHub, чтобы продолжить обучение и получить дополнительные примеры.

Репозиторий dotnet/infer на сайте GitHub

Поделиться через