O que é um Planner?
Depois de ter vários plugins, você precisa de uma maneira para o seu agente de IA usá-los juntos para resolver a necessidade de um usuário. É aqui que entra o planeamento.
Logo no início, o Semantic Kernel introduziu o conceito de planejadores que usavam prompts para solicitar que a IA escolhesse quais funções invocar. Desde que o Semantic Kernel foi introduzido, no entanto, a OpenAI introduziu uma maneira nativa para o modelo invocar ou "chamar" uma função: chamada de função. Outros modelos de IA como Gemini, Claude e Mistral adotaram a chamada de função como uma capacidade central, tornando-a um recurso suportado por modelos cruzados.
Devido a esses avanços, o Kernel Semântico evoluiu para usar a chamada de função como a principal maneira de planejar e executar tarefas.
Importante
A chamada de função só está disponível em modelos OpenAI que são 0613 ou mais recentes. Se você usar um modelo mais antigo (por exemplo, 0314), essa funcionalidade retornará um erro. Recomendamos o uso dos modelos OpenAI mais recentes para aproveitar esse recurso.
Como a chamada de função cria um "plano"?
Em sua forma mais simples, a chamada de função é apenas uma maneira de uma IA invocar uma função com os parâmetros certos. Tomemos como exemplo um usuário que deseja ligar uma lâmpada. Supondo que a IA tenha o plugin certo, ela pode chamar a função para acender a luz.
Role | Mensagem |
---|---|
🔵Utilizador | Por favor, acenda a luz #1 |
🔴Assistente (chamada de função) | Lights.change_state(1, { "isOn": true }) |
🟢Ferramenta | { "id": 1, "name": "Table Lamp", "isOn": true, "brightness": 100, "hex": "FF0000" } |
🔴Assistente | A lâmpada está agora acesa |
Mas e se o usuário não souber o ID da luz? E se o usuário quiser acender todas as luzes? É aqui que entra o planeamento. Os modelos LLM atuais são capazes de chamar iterativamente funções para resolver a necessidade de um usuário. Isso é conseguido criando um loop de feedback onde a IA pode chamar uma função, verificar o resultado e, em seguida, decidir o que fazer a seguir.
Por exemplo, um usuário pode pedir à IA para "alternar" uma lâmpada. A IA precisaria primeiro verificar o estado da lâmpada antes de decidir se a ligaria ou desligaria.
Role | Mensagem |
---|---|
🔵Utilizador | Por favor, alterne todas as luzes |
🔴Assistente (chamada de função) | Lights.get_lights() |
🟢Ferramenta | { "lights": [ { "id": 1, "name": "Table Lamp", "isOn": true, "brightness": 100, "hex": "FF0000" }, { "id": 2, "name": "Ceiling Light", "isOn": false, "brightness": 0, "hex": "FFFFFF" } ] } |
🔴Assistente (chamada de função) | Lights.change_state(1, { "isOn": false }) Lights.change_state(2, { "isOn": true }) |
🟢Ferramenta | { "id": 1, "name": "Table Lamp", "isOn": false, "brightness": 0, "hex": "FFFFFF" } |
🟢Ferramenta | { "id": 2, "name": "Ceiling Light", "isOn": true, "brightness": 100, "hex": "FF0000" } |
🔴Assistente | As luzes foram acesas |
Nota
Neste exemplo, você também viu chamadas de função paralelas. É aqui que a IA pode chamar várias funções ao mesmo tempo. Este é um recurso poderoso que pode ajudar a IA a resolver tarefas complexas mais rapidamente. Foi adicionado aos modelos OpenAI em 1106.
O loop de planejamento automático
Suportar a chamada de função sem Kernel Semântico é relativamente complexo. Você precisaria escrever um loop que realizasse o seguinte:
- Crie esquemas JSON para cada uma das suas funções
- Forneça ao LLM o histórico de bate-papo anterior e esquemas de função
- Analise a resposta do LLM para determinar se ele deseja responder com uma mensagem ou chamar uma função
- Se o LLM quiser chamar uma função, você precisará analisar o nome da função e os parâmetros da resposta do LLM
- Invoque a função com os parâmetros corretos
- Retornar os resultados da função para que o LLM possa determinar o que deve fazer em seguida
- Repita as etapas 2 a 6 até que o LLM decida que concluiu a tarefa ou precisa de ajuda do usuário
No Kernel Semântico, facilitamos o uso da chamada de função automatizando esse loop para você. Isso permite que você se concentre na construção dos plugins necessários para resolver as necessidades do seu usuário.
Nota
Entender como funciona o loop de chamada de função é essencial para construir agentes de IA eficientes e confiáveis. Para obter uma visão detalhada de como o loop funciona, consulte o artigo de chamada de função.
Usando a chamada automática de função
Para usar a chamada automática de função no Kernel Semântico, você precisa fazer o seguinte:
- Registre o plugin com o kernel
- Crie um objeto de configurações de execução que diga à IA para chamar automaticamente as funções
- Invoque o serviço de conclusão de chat com o histórico de chat e o kernel
using System.ComponentModel;
using Microsoft.SemanticKernel;
using Microsoft.SemanticKernel.ChatCompletion;
using Microsoft.SemanticKernel.Connectors.OpenAI;
// 1. Create the kernel with the Lights plugin
var builder = Kernel.CreateBuilder().AddAzureOpenAIChatCompletion(modelId, endpoint, apiKey);
builder.Plugins.AddFromType<LightsPlugin>("Lights");
Kernel kernel = builder.Build();
var chatCompletionService = kernel.GetRequiredService<IChatCompletionService>();
// 2. Enable automatic function calling
OpenAIPromptExecutionSettings openAIPromptExecutionSettings = new()
{
FunctionChoiceBehavior = FunctionChoiceBehavior.Auto()
};
var history = new ChatHistory();
string? userInput;
do {
// Collect user input
Console.Write("User > ");
userInput = Console.ReadLine();
// Add user input
history.AddUserMessage(userInput);
// 3. Get the response from the AI with automatic function calling
var result = await chatCompletionService.GetChatMessageContentAsync(
history,
executionSettings: openAIPromptExecutionSettings,
kernel: kernel);
// Print the results
Console.WriteLine("Assistant > " + result);
// Add the message from the agent to the chat history
history.AddMessage(result.Role, result.Content ?? string.Empty);
} while (userInput is not null)
import asyncio
from semantic_kernel import Kernel
from semantic_kernel.functions import kernel_function
from semantic_kernel.connectors.ai.open_ai import AzureChatCompletion
from semantic_kernel.connectors.ai.function_choice_behavior import FunctionChoiceBehavior
from semantic_kernel.connectors.ai.chat_completion_client_base import ChatCompletionClientBase
from semantic_kernel.contents.chat_history import ChatHistory
from semantic_kernel.functions.kernel_arguments import KernelArguments
from semantic_kernel.connectors.ai.open_ai.prompt_execution_settings.azure_chat_prompt_execution_settings import (
AzureChatPromptExecutionSettings,
)
async def main():
# 1. Create the kernel with the Lights plugin
kernel = Kernel()
kernel.add_service(AzureChatCompletion(
deployment_name="your_models_deployment_name",
api_key="your_api_key",
base_url="your_base_url",
))
kernel.add_plugin(
LightsPlugin(),
plugin_name="Lights",
)
chat_completion : AzureChatCompletion = kernel.get_service(type=ChatCompletionClientBase)
# 2. Enable automatic function calling
execution_settings = AzureChatPromptExecutionSettings()
execution_settings.function_call_behavior = FunctionChoiceBehavior.Auto()
# Create a history of the conversation
history = ChatHistory()
userInput = None
while True:
# Collect user input
userInput = input("User > ")
# Terminate the loop if the user says "exit"
if userInput == "exit":
break
# Add user input to the history
history.add_user_message(userInput)
# 3. Get the response from the AI with automatic function calling
result = (await chat_completion.get_chat_message_contents(
chat_history=history,
settings=execution_settings,
kernel=kernel,
arguments=KernelArguments(),
))[0]
# Print the results
print("Assistant > " + str(result))
# Add the message from the agent to the chat history
history.add_message(result)
# Run the main function
if __name__ == "__main__":
asyncio.run(main())
OpenAIAsyncClient client = new OpenAIClientBuilder()
.credential(new AzureKeyCredential(AZURE_CLIENT_KEY))
.endpoint(CLIENT_ENDPOINT)
.buildAsyncClient();
// Import the LightsPlugin
KernelPlugin lightPlugin = KernelPluginFactory.createFromObject(new LightsPlugin(),
"LightsPlugin");
// Create your AI service client
ChatCompletionService chatCompletionService = OpenAIChatCompletion.builder()
.withModelId(MODEL_ID)
.withOpenAIAsyncClient(client)
.build();
// Create a kernel with Azure OpenAI chat completion and plugin
Kernel kernel = Kernel.builder()
.withAIService(ChatCompletionService.class, chatCompletionService)
.withPlugin(lightPlugin)
.build();
// Add a converter to the kernel to show it how to serialise LightModel objects into a prompt
ContextVariableTypes
.addGlobalConverter(
ContextVariableTypeConverter.builder(LightModel.class)
.toPromptString(new Gson()::toJson)
.build());
// Enable planning
InvocationContext invocationContext = new InvocationContext.Builder()
.withReturnMode(InvocationReturnMode.LAST_MESSAGE_ONLY)
.withToolCallBehavior(ToolCallBehavior.allowAllKernelFunctions(true))
.build();
// Create a history to store the conversation
ChatHistory history = new ChatHistory();
// Initiate a back-and-forth chat
Scanner scanner = new Scanner(System.in);
String userInput;
do {
// Collect user input
System.out.print("User > ");
userInput = scanner.nextLine();
// Add user input
history.addUserMessage(userInput);
// Prompt AI for response to users input
List<ChatMessageContent<?>> results = chatCompletionService
.getChatMessageContentsAsync(history, kernel, invocationContext)
.block();
for (ChatMessageContent<?> result : results) {
// Print the results
if (result.getAuthorRole() == AuthorRole.ASSISTANT && result.getContent() != null) {
System.out.println("Assistant > " + result);
}
// Add the message from the agent to the chat history
history.addMessage(result);
}
} while (userInput != null && !userInput.isEmpty());
Quando você usa a chamada de função automática, todas as etapas no loop de planejamento automático são manipuladas para você e adicionadas ao ChatHistory
objeto. Depois que o loop de chamada de função estiver concluído, você poderá inspecionar o ChatHistory
objeto para ver todas as chamadas de função feitas e os resultados fornecidos pelo Kernel Semântico.
E quanto aos planejadores Stepwise e Handlebars de chamada de função?
Os planejadores Stepwise e Handlebars ainda estão disponíveis no Kernel Semântico. No entanto, recomendamos o uso de chamada de função para a maioria das tarefas, pois é mais poderoso e fácil de usar. Os planejadores Stepwise e Handlebars serão preteridos em uma versão futura do Kernel Semântico.
Saiba como migrar o Stepwise Planner para Auto Function Calling.
Atenção
Se você estiver criando um novo agente de IA, recomendamos que não use os planejadores Stepwise ou Handlebars. Em vez disso, use a chamada de função, pois é mais poderoso e fácil de usar.
Próximos passos
Agora que você entende como os planejadores funcionam no Kernel Semântico, você pode aprender mais sobre como influenciar seu agente de IA para que eles planejem e executem melhor as tarefas em nome de seus usuários.