Saltar para o conteúdo

Andrew Barto

Origem: Wikipédia, a enciclopédia livre.
Andrew Barto
Nascimento 1948 (77 anos)
Cidadania Estados Unidos
Alma mater
Ocupação engenheiro, cientista de computação, pesquisador de inteligência artificial, professor universitário
Distinções
  • IEEE Fellow
  • Fellow of the AAAS
  • IEEE Neural Networks Pioneer Award
Empregador(a) Universidade de Massachusetts Amherst
Orientador(a)(es/s) Bernard P. Zeigler
Página oficial
http://www-all.cs.umass.edu/~barto

Andrew Gehret Barto (nascido em 1948 ou 1949) é um cientista da computação americano, atualmente professor emérito de ciência da computação na Universidade de Massachusetts Amherst. Barto é mais conhecido por suas contribuições fundamentais ao campo do aprendizado computacional moderno por reforço.[1]

Início da vida e educação

[editar | editar código-fonte]

Andrew Gehret Barto nasceu em 1948 ou 1949.[2] Ele recebeu seu bacharelado com distinção em matemática pela Universidade de Michigan em 1970, depois de se formar inicialmente em arquitetura e engenharia naval. Depois de ler o trabalho de Michael Arbib, Warren Sturgis McCulloch e Walter Pitts, ele se interessou em usar computadores e matemática para modelar o cérebro e, cinco anos depois, recebeu um doutorado em ciência da computação por uma tese sobre autômatos celulares.[3]

Em 1977, Barto ingressou na Faculdade de Ciências da Informação e da Computação da Universidade de Massachusetts Amherst como pesquisador associado de pós-doutorado, foi promovido a professor associado em 1982 e professor titular em 1991. Foi chefe de departamento de 2007 a 2011 e membro do corpo docente do programa de neurociência e comportamento.[4]

Durante esse período na UMass, Barto codirigiu o Laboratório de Aprendizagem Autônoma (inicialmente o Laboratório de Rede Adaptativa), que gerou várias ideias-chave na aprendizagem por reforço.[4] Richard Sutton, com quem foi coautor do influente livro Reinforcement Learning: An Introduction (MIT Press 1998; 2ª edição 2018), foi seu aluno de doutorado.[4]

Aprendizagem por reforço

[editar | editar código-fonte]

Quando Barto começou na UMass, se juntou a um grupo de pesquisadores que tentavam explorar o comportamento dos neurônios no cérebro humano como base para a inteligência humana, um conceito que havia sido desenvolvido pelo cientista da computação A. Harry Klopf. Barto foi acompanhado por seu aluno de doutorado, Sutton, no uso da matemática para aprofundar o conceito e usá-lo como base para a inteligência artificiak, que ficou conhecido como aprendizagem por reforço e passou a se tornar uma parte fundamental das técnicas de inteligência artificial.[5]

Barto e Sutton usaram o processo de decisão de Markov (PDM) como base matemática para explicar como os agentes (entidades algorítmicas) tomavam decisões em um ambiente estocástico ou aleatório, recebendo recompensas ao final de cada ação. A teoria tradicional do PDM pressupunha que os agentes conheciam todas as informações sobre os PDMs na tentativa de maximizar suas recompensas cumulativas. As técnicas de aprendizagem por reforço de Barto e Sutton permitiram que tanto o ambiente como as recompensas fossem desconhecidos e, assim, permitiram que esta categoria de algoritmos fosse aplicada a uma vasta gama de problemas.[6]

Barto construiu um laboratório na UMass Amherst para desenvolver ideias sobre aprendizagem por reforço enquanto Sutton retornava ao Canadá. O aprendizado por reforço como tópico continuou a se desenvolver nos círculos acadêmicos até que uma de suas primeiras grandes aplicações no mundo real viu o programa AlphaGo do Google, construído sobre esse conceito, derrotando o então campeão humano prevalecente.[5] Barto e Sutton foram amplamente creditados e aceitos como pioneiros da aprendizagem por reforço moderna, sendo a técnica em si fundamental para o boom da IA moderna.[7]

Barto publicou mais de cem artigos ou capítulos em periódicos, livros e anais de conferências e workshops. Ele é coautor com Richard Sutton do livro Reinforcement Learning: An Introduction, MIT Press 1998 (2ª edição 2018), e coeditor com Jennie Si, Warren Powell e Don Wunch II do Handbook of Learning and Approximate Dynamic Programming, Wiley-IEEE Press, 2004.[8]

Prêmios e honrarias

[editar | editar código-fonte]

Barto é membro da Associação Americana para o Avanço da Ciência, membro sênior do IEEE[9] e membro da Associação Americana de Inteligência Artificial e da Sociedade de Neurociência.[10]

Barto foi galardoado com o UMass Neurosciences Lifetime Achievement Award em 2019, o IEEE Neural Network Society Pioneer Award em 2004[11] e o Prêmio IJCAI por Excelência em Pesquisa em 2017. A sua citação para este último dizia: “O Professor Barto é reconhecido pela sua investigação inovadora e impactante tanto na teoria como na aplicação da aprendizagem por reforço."[1]

Em 2025, ele recebeu o Prêmio Turing da Association for Computing Machinery junto com seu ex-aluno de doutorado Richard S. Sutton por seu trabalho em aprendizagem por reforço; a citação do prêmio dizia: "Por desenvolver os fundamentos conceituais e algorítmicos da aprendizagem por reforço."[12][13][14]

Referências

  1. a b «IJCAI 2017 Awards». 19 de agosto de 2017. Consultado em 6 de setembro de 2022 
  2. «Andrew Barto and Richard Sutton, pioneers in field of reinforcement learning, win AM Turing Award». The Telegraph. 5 de março de 2025. Consultado em 10 de março de 2025 
  3. «Virtual History Interview». International Neural Network Society. 7 de janeiro de 2022. Consultado em 6 de setembro de 2022 
  4. a b c «Andrew G. Barto». University of Massachusetts Amherst. 17 de fevereiro de 2008. Consultado em 18 de outubro de 2020. Arquivado do original em 28 de novembro de 2020 
  5. a b Metz, Cade (5 de março de 2025). «Turing Award Goes to 2 Pioneers of Artificial Intelligence». The New York Times (em inglês). ISSN 0362-4331. Consultado em 8 de março de 2025 
  6. «A.M. Turing Award». amturing.acm.org. Consultado em 8 de março de 2025 
  7. «AI pioneers Andrew Barto and Richard Sutton win 2025 Turing Award for groundbreaking contributions to reinforcement learning | NSF – National Science Foundation». www.nsf.gov (em inglês). 5 de março de 2025. Consultado em 8 de março de 2025 
  8. UMass Amherst: Department of Computer Science Arquivado em 2006-09-02 no Wayback Machine
  9. «Barto elected IEEE fellow». University of Massachusetts Amherst. 22 de novembro de 2005. Consultado em 3 de dezembro de 2019. Arquivado do original em 3 de dezembro de 2019 
  10. «CMU CS – AI Seminar». www.cs.cmu.edu. Consultado em 7 de março de 2025 
  11. «"IEEE Computational Intelligence Society Past Recipients"». 6 de setembro de 2022. Consultado em 6 de setembro de 2022 
  12. Metz, Cade (5 de março de 2025). «Turing Award Goes to 2 Pioneers of Artificial Intelligence». The New York Times (em inglês). ISSN 0362-4331. Consultado em 8 de março de 2025 
  13. «Turing Awardees – Directorate for Computer and Information Science and Engineering (CISE) | NSF – National Science Foundation». www.nsf.gov (em inglês). 5 de março de 2025. Consultado em 8 de março de 2025 
  14. Metz, Cade (5 de março de 2025). «Turing Award Goes to 2 Pioneers of Artificial Intelligence». The New York Times (em inglês). ISSN 0362-4331. Consultado em 8 de março de 2025