O que esperar do seu assistente IA

O que seu assistente pode fazer

  • Responder corretamente instantaneamente seus clientes em no mínimo 99% das vezes, melhor que a maioria de nós.

  • Pode fazer perguntas, pode guiar conversas, pode se comportar do jeito que a sua estratégia de atendimento determinar. Tudo isso é feito via instruções.

  • Comportamento diferente de acordo com chamadas que você iniciou.

  • Transferir atendimento para uma pessoa, selecionando o setor correto quando solicitado pelo cliente ou em situações que você instruir, como por exemplo, quando solicitar um agendamento de visita.

  • Pode identificar intenções, chamar webhooks e acessar APIs

Importante saber

O seu assistente será treinado para responder sobre os seus dados. Alguns comportamentos específicos são esperados em qualquer modelos de IA, vamos tentar explicar aqui alguns deles.

  • Responder estritamente sobre seus dados, o que na grande maioria dos casos é o que queremos, mas em situações pontuais, para aqueles clientes que gostam de bater papo sobre assuntos aleatórios, o seu assistente, a menos que seja instruído para isso, não vai responder. Ele educadamente voltará ao assunto que ele está preparado para responder, isso pode parecer "pouco natural" para alguns clientes.

  • A qualidade da resposta do seu assistente depende de muitos fatores que vão além do modelo utilizado, como a qualidade e quantidade de dados disponibilizados por você, ajuste de temperatura do modelo e as próprias limitações da tecnologia. É possível que ele responda de foram incorreta em algumas situações e necessite de ajustes nas instruções e dados para melhorar determinados tipos de pergunta.

  • Por melhor que sejam seus dados e instruções, as primeiras semanas ou meses de operação são um grande aprendizado para entender o que seus clientes perguntam, como perguntam e fazer ajustes finos nos dados e instruções. Isso é normal e aos poucos fará cada vez menos ajustes até encontrar uma estabilidade.

  • Ele pode não responder em alguns casos, porém espere que ele responda ao menos 99,5% de todas as solicitações.

  • Muitas perguntas ou assuntos diferentes na mesma mensagem: Por mais que o Konversas tenha uma tecnologia específica para tratar esse tipo de situação, é notório que modelos de IA respondem melhor a uma pergunta de cada vez, ou um assunto por vez. Se isso é comum no seu atendimento, talvez uma instrução para o assistente solicitar ao cliente uma pergunta de cada vez seja indicado. Converse com nosso suporte para conhecer opções.

  • Seu assistente por "inferir dados" ou concluir informações se essa não estiver disponível nos dados que ele tem acesso. ex: Se você é uma escola e diz que a mensalidade custa 1000 reais, e também diz que a lista de atividades inclui disciplinas regulares, almoço e atividades esportivas. Se um cliente perguntar se o almoço está incluído na mensalidade, é possível que o assiste conclua que sim (ou que não). Isso ocorre porque ele trata as informações de preços e lista de atividades de forma lógica e usa seu conhecimento para inferir um resultado. De forma ideal, ele poderia dizer que não sabe, uma vez que você não falou sobre esse assunto nos seus dados, e ele faz isso algumas vez, mas se, pelo seu texto, ele entender que a probabilidade dele estar certo dizendo que sim ou não for boa, é isso que ele vai fazer isso. Para evitar esse tipo de comportamento, inclua a informação dizendo se as refeições estão ou não incluídas. Isso é uma exemplo de ajuste fino que fazemos ao identificar o que os clientes perguntam. Omissão de dados e detalhes, pode fazer o modelo de IA interpretar incorretamente os dados e criar uma resposta que não existe, mesmo que gente tome todas as precauções e processos para evitar isso.

Como seu assistente funciona em um processo de RAG

O processo de RAG (ou Recuperação e Geração, Retrieval-Augmented Generation) é uma técnica que permite a um assistente de IA responder a perguntas usando uma base de conhecimento externa, como arquivos DOCx, PDF, HTML e outros de forma precisa e informada. Veja como as etapas funcionam:

1. Inserção dos Dados

Imagine que você tem vários arquivos DOCX com informações importantes e quer que o assistente de IA use esses dados para responder perguntas, exatamente o que o Konversas faz.. Primeiramente, os DOCXs são lidos e processados por uma ferramenta de IA que extrai o texto e transforma essas informações em fragmentos de conhecimento (parágrafos, frase ou blocos de texto separados semanticamente). O Konversas faz isso parte com modelos de IA, parte com tecnologia própria, para criar blocos de textos separados semanticamente, ou seja, por assunto e estrutura hierárquica do arquivo.

2. Indexação e Armazenamento

Depois que o conteúdo é extraído, ele passa por uma etapa de “indexação”, que é como organizar os fragmentos de texto em um tipo de “catálogo inteligente”. Neste catálogo, os dados são preparados para serem recuperados de forma rápida, usando um sistema de busca (parecido com o Google, mas específico para esse conjunto de dados). Dentre outras coisas, consistente em criar vetores de milhares de dimensões para cada fragmento. Esse sistema permite encontrar rapidamente os fragmentos mais relevantes para qualquer pergunta.

3. A Pergunta do Usuário

Quando o usuário faz uma pergunta, o assistente de IA não tenta responder com seus dados genéricos. Em vez disso, buscamos no catálogo para encontrar fragmentos de informações que estejam diretamente relacionados à pergunta feita.

4. Recuperação dos Dados Relevantes

Usando o sistema de busca, disponibilizamos ao assistente os fragmentos de texto mais próximos da pergunta. Por exemplo, se o usuário pergunta sobre uma política específica mencionada em um dos arquivos, o sistema traz um ou mais trechos que provavelmente contêm a resposta ou detalhes relevantes ao que foir perguntado

5. Geração da Resposta

Com os dados e trechos recuperados, o assistente agora tem uma base específica para responder. Ele combina essas informações com seu próprio conhecimento para gerar uma resposta completa e contextualizada, usando o texto recuperado. O assistente pode reorganizar e reescrever a informação para que a resposta faça sentido e seja clara para o usuário, ele não repassa simplesmente o texto.

Em Resumo

Esse processo de RAG permite que o assistente de IA seja uma espécie de "bibliotecário inteligente". Ele busca e usa informações específicas nos arquivos e as traz para responder, em vez de tentar adivinhar ou inventar uma resposta.

Ele também não poderia ler tudo de todos os arquivos a cada pergunta, seria demorado e infinitamente caro de operar. Fazer isso seria como perguntar a um bibliotecário em que corredor está um livro e ele precisar andar por todos os corredores lendo todas as capas para então te dar a informação.

A tecnologia e o que acontece por trás pode ser uma pouco mais complicado, mas isso te dá um entendimento mínimo parar te mostrar a importância de ter dados bons, bem escritos e organizados para seu assistente conseguir separar e encontrar as partes necessárias para responder cada pergunta.

Atualizado