Ciência de dados

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

Ciência de dados (em inglês: data science) é uma área da computação voltada para o estudo e a análise de dados, estruturados ou não, que visa a extração de conhecimento ou insigths para possíveis tomadas de decisão, de maneira similar à mineração de dados. Ciência de dados alia big data e machine learning, além de técnicas de outras áreas interdisciplinares como estatística, economia, engenharia e outros subcampos da computação como: banco de dados e análise de agrupamentos (cluster analysis). A ciência de dados é um campo que já existe a 30 anos, porém ganhou mais destaque nos últimos anos devido a alguns fatores como: o surgimento e popularização do Big Data e o desenvolvimento de áreas como o machine learning. A ciência de dados pode, por exemplo, transformar essa grande quantidade de dados brutos em insights de negócios, e com isso, auxiliar empresas em tomadas de decisões para atingir melhores resultados. [1]

Origem[editar | editar código-fonte]

Atualmente o volume de dados gerado por ações online como, uma simples curtida no Facebook ou até o upload de vídeos ou fotos no Instagram, é enorme. A cada 10 minutos, o volume de dados gerados no mundo todo é maior do que o volume de dados gerados desde a pré-história até o ano de 2003. Junto com esse aumento na geração de dados também aumentou a nossa capacidade de processamento. Desde os anos 1970 a cada dois anos a nossa capacidade de processamento praticamente dobrou. E com esse grande aumento na quantidade de dados e na capacidade de processamento, um novo conceito surgiu, o Big Data. E com a necessidade de analisar e tentar extrair desse grande volume de dados informações úteis, surge a Ciência de dados, que também é considera como uma versão mais recente do Busines Intelligence [2]. Mas apesar das semelhanças, as duas ciências possuem funções e abordagens diferentes. Enquanto Busines Intelligence utiliza uma análise de dados "descritiva" ou "retrospectiva" para tentar responder a pergunta "o que aconteceu?", a ciência de dados faz uso da análise preditiva e tenta descobrir "o que vai, ou pode acontecer?". [3]

Curiosidades[editar | editar código-fonte]

Broom icon.svg
Se(c)ções de curiosidades são desencorajadas pelas políticas da Wikipédia.
Ajude a melhorar este artigo, integrando ao corpo do texto os itens relevantes e removendo os supérfluos ou impróprios.

Existe uma polêmica envolvendo a ciência de dados, no que se refere ao fato desta se confundir com a estatística. Em 2015, a American Statistical Association fez uma declaração através de um comunicado de imprensa que procura apaziguar essa questão. Basicamente ela afirma que as ciências são complementares, e a estatística procura fomentar um relacionamento mais próximo à ciência de dados para benefício mútuo. [4]

Aplicações[editar | editar código-fonte]

Busca na internet[editar | editar código-fonte]

Os principais mecanismos de pesquisa na internet fazem o uso da ciência de dados em conjunto com o aprendizado de máquina para encontrar o resultado mais refinado em frações de segundos. A velocidade dos motores de busca atuais só é possível graças à ciência de dados.

Propaganda digital[editar | editar código-fonte]

Praticamente todo o conteúdo de marketing digital que existe é escolhido por algoritmos que utilizam ciência de dados. Com isso as empresas obtêm um resultado muito melhor do que o marketing convencional, pois os anúncios são montados de acordo com o histórico do usuário. É por esse motivo que duas pessoas podem ver diferentes anúncios em uma mesma página.

Sistemas de recomendação[editar | editar código-fonte]

Aliando os dados do perfil do usuário com os dados do seu histórico de buscas, é possível ter melhores insights sobre os tipos sugestões que mais se adequam a cada pessoa, e é isso que ocorre quando visualizamos novas sugestões de amizades no Facebook ou Linkedin, bem como as sugestões de filmes e séries no Netflix e até mesmo as sugestões de produtos no site da Amazon.

Reconhecimento de imagens[editar | editar código-fonte]

Utilizando algoritmos de reconhecimento de imagens, várias aplicações são possíveis, como qr code que permite que você escaneie uma imagem com seu Smartphone para poder utilizar o Whatsapp web ou até mesmo o recurso automático de tags para marcar amigos em fotos postadas em redes sociais.

Logística[editar | editar código-fonte]

A UPS, empresa do ramo de logística, desenvolveu um sistema chamado ORION, que é responsável por gerenciar as rotas de seus caminhões de entrega nos EUA. Esse sistema foi alimentado, a partir de 2008, com informações oriundas de sua frota sobre rotas, tempo de veículos parados e até se os motoristas estavam utilizando o cinto de segurança. A partir daí, foi desenvolvido um complexo algoritmo para resolver os problemas de rota dos caminhões. Isso gerou um impressionante código com 1000 paginas, que transforma os dados obtidos em instruções para otimizar as rotas dos caminhões. Atualmente, esse sistema consegue otimizar as rotas em segundos e, rodando em segundo plano, está sempre atualizando a mesma para garantir a melhor rota para seus caminhões, fazendo com que a UPS economize até 50 milhões de dólares ao ano. [5]

Saúde[editar | editar código-fonte]

A Walgreens utiliza ferramentas avançadas de analytics na área de drogarias para o cuidado de pacientes, avaliando melhor as suas condições e fornecendo recomendações que fortalecem a saúde e evitam despesas médicas futuras.

E-commerce de viagens[editar | editar código-fonte]

Muitas empresas de e-commerce de viagens como Booking, Trivago, Expedia, entre outras, utilizam a Ciência de Dados para melhorar os resultados em seus motores de busca, trazendo para o cliente não só os resultados de pesquisas sobre hotéis ou voos, como também sugerindo serviços complementares a essas viagens (reserva de carros, pacotes de passeios no destino, seguro de viagens, etc.).[6]

Serviços financeiros[editar | editar código-fonte]

A ciência de dados auxilia na análise e compreensão dados armazenados sobre gastos passados, concessões de crédito entre outras variáveis, e com isso os bancos podem traçar perfis que são capazes de projetar a probabilidade de um determinado cliente se tornar inadimplente ou não.[7]

Comparação de preços[editar | editar código-fonte]

Com o imenso volume de dados gerado pela grande quantidade de lojas virtuais, os sites como: Buscapé, Trivago, Bondfaro dentre muitos outros, utilizam a ciência de dados para mostrar os menores preços do produto que o cliente está procurando. [8] [9]

Cientista de dados[editar | editar código-fonte]

Os cientistas de dados são profissionais da "nova geração" com conhecimentos em Matemática, Estatística e T.I. e com habilidades em análises de dados complexos e soluções para possíveis problemas extraídos a partir desses dados. [10]

Mercado de trabalho[editar | editar código-fonte]

O profissional dessa área encontra-se em primeiro lugar das melhores profissões da América, de acordo com uma lista do site Glassdoor[11] . O alto número de vagas (devido a pouca quantidade de profissionais qualificados), os bons salários e a satisfação de no trabalho foram os fatores que colocaram essa profissão no topo dessa lista. [12] Segundo uma pesquisa realizada pela IBM, a demanda por esses profissionais deve subir 28% até 2020 e atualmente, 60% da procura por esses profissionais encontra-se na área de finanças. [13]

Principais Linguagens utilizadas[editar | editar código-fonte]

Principais abordagens utilizadas[editar | editar código-fonte]


Referências

  1. Slveira, Debora Priscila (20 de julho de 2016). «O que é Data Science». Consultado em 22 de outubro de 2017 
  2. Cavique, Luís (2014). «Big Data e Data Science» (PDF) 
  3. Fabris, Felipe (setembro de 2017). «A evolução de Business Intelligence para Data Science». Consultado em 20 de novembro de 2017 
  4. Myers, Jeffrey A. (1 de outubro de 2015). «ASA Issues statement on role of statistics in Data Science» (PDF). Consultado em 21 de novembro de 2017 
  5. «ORION Backgounder». 2017. Consultado em 28 de novembro de 2017 
  6. «Data Science and AI in the Travel Industry: 9 Real-Life Use Cases». 9 de outubro de 2017. Consultado em 29 de novembro de 2017 
  7. Zaidi, Deena (7 de outubro de 2017). «Data Analytics in Banking». Consultado em 29 de novembro de 2017 
  8. «Data Science aplicado ao MKT: Entenda como isso funciona na prática». 4 de julho de 2017. Consultado em 22 de novembro de 2017 
  9. Saraswat, Manish (21 de setembro de 2015). «13 aplicações práticas de data science hoje». Consultado em 22 de novembro de 2017 
  10. Pereira, Tiago (24 de junho de 2017). «Cientista de Dados - por onde começar em 8 passos». Consultado em 25 de novembro de 2017 
  11. «50 Best Jobs in America». 2017. Consultado em 29 de novembro de 2017 
  12. Zhang, Vivian (14 de abril de 2017). «3 razões pelas quais o cientista de dados continua sendo o principal emprego na América». Consultado em 25 de novembro de 2017 
  13. Columbus, Louis (13 de maio de 2017). «IBM prevê demanda por dados Os cientistas aumentarão em 28% até 2020». Consultado em 25 de novembro de 2017 
Ícone de esboço Este artigo sobre computação é um esboço. Você pode ajudar a Wikipédia expandindo-o.