ouça este conteúdo
OpenAI treinou um modelo GPT-4 para gerar respostas e apontamentos de erros, com aprendizado por reforço e feedbacks dos treinadores de IA.
A OpenAI desenvolveu uma nova ferramenta, o CriticGPT, com base no GPT-4 para identificar falhas em respostas produzidas pelo ChatGPT. Segundo a empresa, ao utilizar o CriticGPT para a correção dos textos gerados pelo ChatGPT, os usuários conseguem resolver os problemas sem assistência extra em 60% das situações. A série de modelos GPT-4 que impulsiona o ChatGPT passa por um processo de correção por meio do ‘aprendizado de reforço a partir do feedback humano’ (RLHF), no qual a plataforma aprimora seu desempenho conforme os treinadores de inteligência artificial avaliam as respostas do ChatGPT e apontam possíveis equívocos.
O uso do CriticGPT como um modelo de revisão automatizada representa um avanço significativo na detecção de erros em textos gerados por sistemas de inteligência artificial. Ao integrar essa ferramenta de correção, os usuários do ChatGPT podem aprimorar a qualidade de suas interações sem depender de intervenções externas. A combinação do ChatGPT com o CriticGPT demonstra como a tecnologia pode evoluir constantemente, proporcionando uma experiência mais precisa e eficiente aos usuários. respostas geradas
CriticGPT: A Nova Ferramenta de Correção e Revisão
À medida que o ChatGPT evolui, é natural que seus erros se tornem mais complexos e difíceis de detectar pelos treinadores de IA. É aí que entra o CriticGPT, uma ferramenta inovadora que promete auxiliar nesse processo de correção e revisão. Segundo a empresa responsável, a ideia é integrar modelos semelhantes ao CriticGPT no processo de RLHF, permitindo que os feedbacks humanos sejam aprimorados com a contribuição da inteligência artificial.
O CriticGPT não é infalível, é importante ressaltar. Suas sugestões nem sempre estão corretas, mas podem ser valiosas para identificar problemas que passariam despercebidos de outra forma. Assim como o GPT-4, o CriticGPT também se aprimora com o tempo, à medida que mais usuários utilizam a ferramenta e fornecem feedbacks.
Um exemplo concreto do potencial do CriticGPT foi revelado pela OpenAI, que comparou os apontamentos feitos por essa nova ferramenta com os do ChatGPT. Surpreendentemente, em 63% dos casos, as correções sugeridas pelo CriticGPT foram consideradas superiores. Além disso, a ferramenta demonstrou uma redução significativa nas chamadas ‘alucinações’, momentos em que a IA gera informações incorretas.
No entanto, é importante ter em mente que o CriticGPT possui limitações. Em situações extremamente complexas, mesmo a combinação de especialistas humanos e modelos de IA pode não ser suficiente para avaliar corretamente uma tarefa ou resposta. O aprendizado e o reforço contínuos são essenciais para que o CriticGPT atinja seu potencial máximo.
Em resumo, o CriticGPT representa um avanço significativo no campo da correção e revisão de modelos de IA. Com sua capacidade de identificar erros sutis e especializados, essa ferramenta promete elevar a qualidade dos feedbacks e contribuir para o aprimoramento contínuo das inteligências artificiais.
Fonte: © CNN Brasil