Rede neural convolucional

Origem: Wikipédia, a enciclopédia livre.

No contexto de inteligência artificial e aprendizagem de máquina, uma rede neural convolucional (CNN do inglês Convolutional Neural network ou ConvNet) é uma classe de rede neural artificial do tipo feed-forward, que vem sendo aplicada com sucesso no processamento e análise de imagens digitais.[1]

Uma CNN usa uma variação de perceptrons multicamada desenvolvidos de modo a demandar o mínimo pré-processamento possível. Essas redes também são conhecidas como redes neurais artificiais invariantes a deslocamento (shift invariant) ou invariantes a espaço (space invariant), em ambos os casos representadas pela sigla em inglês SIANN.[2][3]

As redes convolucionais são inspiradas nos processos biológicos.[4] Nelas o padrão de conectividade entre os neurônios é inspirado na organização do córtex visual dos animais. Neurônios corticais individuais respondem a estímulos apenas em regiões restritas do campo de visão conhecidas como campos receptivos. Os campos receptivos de diferentes neurônios se sobrepõem parcialmente de forma a cobrir todo o campo de visão.

Uma CNN tende a demandar um nivel minimo de pre-processamento quando comparada a outros algoritmos de classificação de imagens.[5] Isso significa que a rede "aprende" os filtros que em um algoritmo tradicional precisariam ser implementados manualmente. Essa independencia de um conhecimento a priori e do esforço humano no desenvolvimento de suas funcionalidades basicas pode ser considerada a maior vantagem de sua aplicação.

Esse tipo de rede é usada principalmente em reconhecimento de imagens e processamento de vídeo, embora já tenha sido aplicada com sucesso em experimentos envolvendo processamento de voz e linguagem natural.

Na saúde usa-se esta metodologia com algoritmos específicos, recorrendo a um grande número de fotografias clínicas, para o diagnóstico da retinopatia diabética e do cancro da pele, com resultados muito precisos e comparáveis aos clínicos especializados.[6][7]

Referências[editar | editar código-fonte]

  1. «Convolutional Neural Networks (LeNet) - DeepLearning 0.1 documentation». DeepLearning 0.1. LISA Lab. Consultado em 31 de agosto de 2013 
  2. Zhang, Wei (1988). «Shift-invariant pattern recognition neural network and its optical architecture». Proceedings of annual conference of the Japan Society of Applied Physics 
  3. Zhang, Wei (1990). «Parallel distributed processing model with local space-invariant interconnections and its optical architecture». Applied Optics. 29 (32): 4790–7. Bibcode:1990ApOpt..29.4790Z. PMID 20577468. doi:10.1364/AO.29.004790 
  4. Matusugu, Masakazu; Katsuhiko Mori; Yusuke Mitari; Yuji Kaneda (2003). «Subject independent facial expression recognition with robust face detection using a convolutional neural network» (PDF). Neural Networks. 16 (5): 555–559. doi:10.1016/S0893-6080(03)00115-1. Consultado em 17 de novembro de 2013 
  5. LeCun, Yann. «LeNet-5, convolutional neural networks». Consultado em 16 de novembro de 2013 
  6. Gulshan, Varun; Peng, Lily; Coram, Marc; Stumpe, Martin C.; Wu, Derek; Narayanaswamy, Arunachalam; Venugopalan, Subhashini; Widner, Kasumi; Madams, Tom (13 de dezembro de 2016). «Development and Validation of a Deep Learning Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs». JAMA (em inglês). 316 (22). ISSN 0098-7484. doi:10.1001/jama.2016.17216 
  7. Esteva, Andre; Kuprel, Brett; Novoa, Roberto A.; Ko, Justin; Swetter, Susan M.; Blau, Helen M.; Thrun, Sebastian (fevereiro de 2017). «Dermatologist-level classification of skin cancer with deep neural networks». Nature (em inglês). 542 (7639): 115–118. ISSN 1476-4687. doi:10.1038/nature21056