Este documento tem como objetivo descrever as atividades e passos realizados durante a execução do projeto a partir da parceria entre CI&T e UNICAMP. O projeto provém de uma experiência humanizada, agradável e resolutiva para clientes por meio de um assistente célere e preciso (i.e., chatbot) para melhorar a experiência e resolutividade em canais digitais. Para isso, propomos um framework para criar um chatbot baseado em um modelo de linguagem, o qual aborda todas as tarefas necessárias para o desenvolvimento do chatbot, ou seja, desde a coleta e pré-processamento de dados, até o treinamento e uso do modelo de linguagem. Além disso, é importante destacar que esse framework pode ser aplicado em diferentes escopos (cenários de atendimento) e sua aplicação é transparente para seus usuários, ou seja, todas as tarefas são automatizadas, assim os usuários apenas fornecem os dados para o cenário que desejam, tendo como resultado um chatbot baseado em modelo de linguagem com uma experiência agradável e humanizada. A Figura 1 ilustra o processo de aplicação do framework proposto.

framework_10.png

Em resumo, o framework é composto pelas seguintes etapas principais: (i) coleta e obtenção de dados; (ii) pré-processamento e anotação; (iii) treinamento e fine-tuning; e (iv) humanização e aprimoramento. Para endereçar os desafios inerentes a cada etapa, as seguintes perguntas de pesquisa foram definidas:

A partir deste diagrama geral, nota-se que o desenvolvimento do framework proposto pode ser dividido em tópicos fundamentais, são eles:

Coleta e obtenção de dados

Pré-processamento dos Dados

Anotação dos Dados

Treinamento e Fine-tuning do Modelo

Interação Usuário-chatbot

Avaliação da Humanização em Chatbots

Modelos

Datasets

Código Fontes