ChatGPT
ChatGPT | |
---|---|
Desenvolvedor | OpenAI |
Lançamento | 30 de novembro de 2022 (0 anos) |
Licença | Proprietária |
Página oficial | openai |
Repositório | https://chat.openai.com/ |
O ChatGPT é um protótipo de um chatbot com inteligência artificial desenvolvido pela OpenAI especializado em diálogo. O chatbot é um modelo de linguagem ajustado com técnicas de aprendizado supervisionado e por reforço. O modelo básico que foi ajustado foi o modelo de linguagem GPT-3.5 da OpenAI, uma versão melhorada do GPT-3.
O ChatGPT foi lançado em novembro de 2022 e chamou a atenção por suas respostas detalhadas e articuladas, embora a precisão de suas informações tenha sido criticada.[1]
Características[editar | editar código-fonte]
O ChatGPT foi ajustado com base no GPT-3.5 usando aprendizado supervisionado e aprendizado por reforço.[2]Ambos as abordagens usaram treinadores humanos para melhorar suas performances. No caso do aprendizado supervisionado, foi fornecido ao modelo conversações nas quais ostreinadores jogaram ambos os lados: o usuário e o assistante de inteligência artificial. Na etapa de reforço, os treinadores humanos primeiro classificaram as respostas que o modelo havia criado na conversa anterior. Essas classificações foram usadas para criar modelos de recompensa nos quais o modelo foi aprimorado usando várias iterações de Proximal Policy Optimization (PPO).[3] [4] Os algoritmos Proximal Policy Optimization apresentam um benefício econômico para os algoritmos de otimização de política de região confiável; eles anulam muitas das operações computacionalmente caras com desempenho mais rápido.[5] [6] Os modelos foram treinados em colaboração com a Microsoft em sua infraestrutura de supercomputação do Azure.
Em comparação com seu antecessor, InstructGPT, o ChatGPT tenta reduzir as respostas prejudiciais e enganosas; em um exemplo, enquanto o InstructGPT aceita o prompt "Fale-me sobre quando Cristóvão Colombo veio para os EUA em 2015" como verdadeiro, o ChatGPT usa informações sobre as viagens de Colombo e informações sobre o mundo moderno, incluindo percepções de Colombo para construir uma resposta que pressupõe o que aconteceria se Columbo viesse para os EUA em 2015.[3] Os dados de treinamento do ChatGPT incluem páginas de manual e informações sobre fenômenos da Internet e linguagens de programação, como sistemas de quadro de avisos e a linguagem de programação Python.[7]
Ao contrário da maioria dos chatbots, o ChatGPT é stateful, lembrando-se de solicitações anteriores dadas a ele na mesma conversa, o que alguns jornalistas sugeriram que permitirá que o ChatGPT seja usado como um terapeuta personalizado. [8] Em um esforço para impedir que resultados ofensivos sejam apresentados e produzidos a partir do ChatGPT, as consultas são filtradas por meio de uma API de moderação e solicitações potencialmente racistas ou sexistas são descartadas.[3] [8]
ChatGPT sofre de múltiplas limitações. O modelo de recompensa do ChatGPT, projetado com base na supervisão humana, pode ser superotimizado e, assim, prejudicar o desempenho, também conhecido como lei de Goodhart.[9] No treinamento, os revisores preferiram respostas mais longas, independentemente da compreensão real ou do conteúdo factual.[3] Os dados de treinamento também podem sofrer viés algorítmico; prompts incluindo descrições vagas de pessoas, como um CEO, podem gerar uma resposta que assume que essa pessoa, por exemplo, é um homem branco.[10]
Recepção[editar | editar código-fonte]
O ChatGPT recebeu críticas geralmente positivas. Samantha Lock, do The Guardian, observou que foi capaz de gerar um texto "impressionantemente detalhado" e "semelhante ao humano".[11] O redator de tecnologia Dan Gillmor usou o ChatGPT em uma tarefa do aluno e descobriu que o texto gerado estava de acordo com o que um bom aluno entregaria e opinou que "a academia tem alguns problemas muito sérios a enfrentar".[12] Alex Kantrowitz, da Slate, elogiou a resistência do ChatGPT às questões relacionadas à Alemanha nazista, incluindo a alegação de que Adolf Hitler construiu rodovias na Alemanha, que recebeu informações sobre o uso de trabalho forçado pela Alemanha nazista.[13] Em um artigo de opinião, o economista Paul Krugman escreveu que o ChatGPT afetaria a demanda dos trabalhadores do conhecimento.[14] James Vincent , do The Verge, viu o sucesso viral do ChatGPT como prova de que a inteligência artificial se tornou popular.[4] No The Atlantic, Stephen Marche observou que seu efeito na academia e especialmente nos ensaios de aplicação ainda não foi compreendido.[15] O professor e autor do ensino médio da Califórnia, Daniel Herman, escreveu que o ChatGPT dará início ao "Fim do inglês do ensino médio".[16]
A precisão factual do ChatGPT foi questionada, entre outras preocupações. Mike Pearl, do Mashable, testou o ChatGPT com várias perguntas. Em um exemplo, ele perguntou ao modelo "o maior país da América Central que não é o México ". ChatGPT respondeu com Guatemala, quando a resposta foi Nicarágua.[17] Em dezembro de 2022, o site de perguntas e respostas Stack Overflow proibiu o uso do ChatGPT para gerar respostas a perguntas, citando a natureza factualmente ambígua das respostas do ChatGPT.[18] O economista Tyler Cowen expressou preocupação com seus efeitos na democracia, citando a capacidade de escrever comentários automatizados em um esforço para afetar o processo de decisão de novos regulamentos.[19] Axe Sharma, da Bleeping Computer, observou que o ChatGPT era capaz de escrever malware e e-mails de phishing.[20]
Implicações[editar | editar código-fonte]
Implicações para a cibersegurança[editar | editar código-fonte]
A Check Point Research e outros observaram que o ChatGPT era capaz de escrever e-mails de phishing e malware , especialmente quando combinado com o OpenAI Codex . O CEO do OpenAI, criador do ChatGPT, Sam Altman , escreveu que o avanço do software poderia representar "(por exemplo) um enorme risco de segurança cibernética" e também continuou a prever "poderíamos chegar à AGI real ( inteligência geral artificial ) na próxima década , então temos que levar o risco disso muito a sério". Altman argumentou que, embora o ChatGPT "obviamente não esteja próximo do AGI", deve-se "confiar no exponencial . Plano olhando para trás, vertical olhando para a frente ."
Implicações para a educação[editar | editar código-fonte]
Na revista The Atlantic , Stephen Marche observou que seu efeito na academia e especialmente nos ensaios de aplicação ainda não foi compreendido. O professor e autor do ensino médio da Califórnia, Daniel Herman, escreveu que o ChatGPT inauguraria "O fim do inglês do ensino médio".
Na revista Nature , Chris Stokel-Walker apontou que os professores devem se preocupar com os alunos que usam o ChatGPT para terceirizar sua escrita, mas que os provedores de educação se adaptarão para aprimorar o pensamento ou o raciocínio crítico.
Emma Bowman, da NPR, escreveu sobre o perigo de os alunos plagiarem por meio de uma ferramenta de IA que pode produzir texto tendencioso ou sem sentido com um tom autoritário: "Ainda há muitos casos em que você faz uma pergunta e isso lhe dá um som muito impressionante resposta que está completamente errada."
Joanna Stern, do The Wall Street Journal, descreveu a trapaça no inglês do ensino médio americano com a ferramenta, enviando uma redação gerada. O professor Darren Hick, da Furman University, descreveu a observação do "estilo" do ChatGPT em um artigo enviado por um aluno. Um detector GPT online afirmou que o papel tinha 99,9% de probabilidade de ser gerado por computador, mas Hick não tinha nenhuma prova concreta. No entanto, o aluno em questão confessou usar o GPT quando confrontado e, como consequência, foi reprovado no curso. Hick sugeriu uma política de dar um exame oral individual ad-hoc sobre o tópico do artigo se um aluno for fortemente suspeito de enviar um artigo gerado por IA. Edward Tian, um estudante sênior de graduação emA Universidade de Princeton , afirmou que criou um programa, chamado "GPTZero", que detecta se um ensaio é escrito por humanos ou não para combater o plágio acadêmico .[21]
Referências[editar | editar código-fonte]
- ↑ «ChatGPT – The Most Advance Chatbot in the World». OpChatgpt. Consultado em 14 de janeiro de 2023
- ↑ Knox, W. Bradley; Stone, Peter. Augmenting Reinforcement Learning with Human Feedback (PDF). University of Texas at Austin. Consultado em 5 de dezembro de 2022
- ↑ a b c d OpenAI (30 de novembro de 2022). «ChatGPT: Optimizing Language Models for Dialogue». Consultado em 5 de dezembro de 2022
- ↑ a b Vincent, James (8 de dezembro de 2022). «ChatGPT proves AI is finally mainstream — and things are only going to get weirder». The Verge. Consultado em 8 de dezembro de 2022
- ↑ Schulman, John; Wolski, Filip. «Proximal Policy Optimization Algorithms». arXiv:1707.06347
[cs.LG]
- ↑ van Heeswijk, Wouter (29 de novembro de 2022). «Proximal Policy Optimization (PPO) Explained». Towards Data Science. Consultado em 5 de dezembro de 2022
- ↑ Edwards, Benj (5 de dezembro de 2022). «No Linux? No problem. Just get AI to hallucinate it for you». Ars Technica. Consultado em 5 de dezembro de 2022
- ↑ a b Roose, Kevin (5 de dezembro de 2022). «The Brilliance and Weirdness of ChatGPT». The New York Times. Consultado em 5 de dezembro de 2022
- ↑ Gao, Leo; Schulman. «Scaling Laws for Reward Model Overoptimization». arXiv:2210.10760
[cs.LG]
- ↑ Murphy Kelly, Samantha (5 de dezembro de 2022). «This AI chatbot is dominating social media with its frighteningly good essays». CNN. Consultado em 5 de dezembro de 2022
- ↑ Lock, Samantha (5 de dezembro de 2022). «What is AI chatbot phenomenon ChatGPT and could it replace humans?». The Guardian. Consultado em 5 de dezembro de 2022
- ↑ Hern, Alex (4 de dezembro de 2022). «AI bot ChatGPT stuns academics with essay-writing skills and usability». The Guardian. Consultado em 5 de dezembro de 2022
- ↑ Kantrowitz, Alex (2 de dezembro de 2022). «Finally, an A.I. Chatbot That Reliably Passes "the Nazi Test"». Slate. Consultado em 5 de dezembro de 2022
- ↑ Krugman, Paul (6 de dezembro de 2022). «Does ChatGPT Mean Robots Are Coming For the Skilled Jobs?». The New York Times. Consultado em 6 de dezembro de 2022
- ↑ Marche, Stephen (6 de dezembro de 2022). «The College Essay Is Dead». The Atlantic. Consultado em 8 de dezembro de 2022
- ↑ Herman, Daniel (9 de dezembro de 2022). «The End of High-School English». The Atlantic (em inglês). Consultado em 19 de dezembro de 2022
- ↑ Pearl, Mike (3 de dezembro de 2022). «The ChatGPT chatbot from OpenAI is amazing, creative, and totally wrong». Mashable. Consultado em 5 de dezembro de 2022
- ↑ Vincent, James (5 de dezembro de 2022). «AI-generated answers temporarily banned on coding Q&A site Stack Overflow». The Verge. Consultado em 5 de dezembro de 2022
- ↑ Cowen, Tyler (6 de dezembro de 2022). «ChatGPT Could Make Democracy Even More Messy». Bloomberg News. Consultado em 6 de dezembro de 2022
- ↑ Sharma, Ax (6 de dezembro de 2022). «OpenAI's new ChatGPT bot: 10 dangerous things it's capable of». Bleeping Computer. Consultado em 6 de dezembro de 2022
- ↑ «ChatGPT». Wikipedia (em inglês). 27 de janeiro de 2023. Consultado em 27 de janeiro de 2023