Общие сведения о проектировании запросов

Завершено

Качество входных запросов, которые мы отправим в модель ИИ, например те, которые доступны в Azure OpenAI, напрямую влияют на качество того, что мы возвращаем. Тщательно создавая запросы, которые мы отправим в модель, модель может обеспечить лучшие и более интересные ответы.

Что такое техника подсказок?

Проектирование запросов — это процесс проектирования и оптимизации запросов на использование моделей ИИ. Проектирование эффективных запросов имеет решающее значение для успешного проектирования запросов, и это может значительно повысить производительность модели искусственного интеллекта в конкретных задачах. Предоставление соответствующих, конкретных, неоднозначных и хорошо структурированных запросов может помочь модели лучше понять контекст и создать более точные ответы.

Например, если мы хотим, чтобы модель OpenAI создавала описания продуктов, мы можем предоставить ему подробное описание, описывающее функции и преимущества продукта. Предоставляя этот контекст, модель может создавать более точные и соответствующие описания продуктов.

Проектирование запросов также может помочь уменьшить предвзятость и повысить справедливость в моделях искусственного интеллекта. Создав запросы, которые являются разнообразными и инклюзивными, мы можем убедиться, что модель не предвзята к определенной группе или перспективе.

Внимание

Независимо от того, насколько хорошо вы можете разработать запрос, ответы от моделей ИИ никогда не должны приниматься как факт или полностью свободны от предвзятости. Всегда используйте ИИ ответственно. Дополнительные сведения см. в заметке о прозрачности Корпорации Майкрософт по принципам Azure OpenAI и ИИ Майкрософт.

Кроме того, инженерия запросов поможет нам понять, какие ссылки на модель использует для создания ответа. Модели генерного искусственного интеллекта имеют тонну параметров, и следующая логика является в значительной степени неизвестной для пользователей, поэтому она может запутаться в том, как она поступает в ответ, который он дает. Создавая запросы, которые легко понять и интерпретировать, мы можем помочь людям лучше понять, как модель создает свои ответы. Это может быть особенно важно в таких областях, как здравоохранение, где важно понять, как модель принимает решения.

Существуют различные методы использования при проектировании собственных запросов, многие из которых рассматриваются в предстоящих единицах этого модуля. К ним относятся инструкции, контекстное содержимое, подсказки или примеры с несколькими выстрелами, а также правильное упорядочивание содержимого в запросе. Описанные здесь методы не являются исчерпывающими, так как эта область является нюансами и текучим разделом.

Рекомендации по конечным точкам API

Примеры в остальной части этого модуля будут сосредоточены на ChatCompletion. Следует отметить, что ChatCompletion также можно использовать для сценариев, отличных от чата, где все инструкции включены в системное сообщение и содержимое пользователя предоставляются в сообщении роли пользователя. Большинство из этих примеров можно изменить для использования конечной Completion точки при необходимости.

С точки зрения доступности Completion модели конечная точка может использоваться с gpt-3 и более ранними версиями и ChatCompletion может использоваться с gpt-35-turbo и более поздними моделями.

Настройка параметров модели

Помимо методов, описанных в этом модуле, корректировка параметров модели может оказать значительное влияние на ответ. В частности, temperature и top_p (top_probability) наиболее вероятно, чтобы повлиять на ответ модели, так как они управляют случайностью в модели, но по-разному.

Более высокие значения создают более творческие и случайные ответы, но, скорее всего, будут менее согласованными или сосредоточенными. Ожидается, что ответы будут вымышленными или уникальными преимуществами от более высоких значений для этих параметров, в то время как содержимое должно быть более согласованным и конкретным должно использовать более низкие значения.

Попробуйте настроить эти параметры с тем же запросом, чтобы узнать, как они влияют на ответ. Рекомендуется изменить либо temperature top_p одновременно, но не оба.