Big data
Em tecnologia da informação, Big data se trata de um conceito, no qual o foco é o grande armazenamento de dados e maior velocidade. Podemos dizer que o big data se baseia em 5V’s velocidade, volume, variedade, veracidade e valor.1 '2 3 4
Índice |
Motivo da criação [editar]
O uso do Big Data pode ser uma arma contra os problemas socioeconômicos, onde ele é interpretado com clareza no filme “Moneyball” (O homem que virou o jogo) com o ator Brad Pitt, no qual o gerente de um time de beisebol usa o Big data para reunir um elenco de primeira linha sem gastar muito. Com a globalização e o modelo “just in time” a expansão virtual se tornou necessária; a partir da ultima década de 2000 houve uma crescente de dados exponencial que já preocupam os especialistas pela falta de espaço. Segundo a IBM em 2008 foram produzidos cerca de 2,5 quintilhões de bytes todos os dias e surpreendentemente 90% dos dados no mundo foram criados nos últimos dois anos, decorrente a adesão das grandes empresas à internet, como exemplo as redes sociais, dados dos GPS, dispositivos embutidos e móbil.
Comparação (Warehouse com Big Data) [editar]
Conceitualmente, um Data Warehouse (Armazém de dados) é um conjunto de dados baseado em assuntos integrados, não voláteis, variáveis em relação ao tempo, e destinado a auxiliar em decisões de negócios, diferente do big data que se baseia em grande volume de dados, voláteis ou não, com maior velocidade. E também em vez de criar um subconjunto limpo de dados do utilizador para os colocar numa “data warehouse” e serem consultados a partir de um número limitado de formas pré-determinadas, o software de big data recolhe todos os dados que uma organização gera e permite que os administradores e analistas se preocupem em como usá-los mais tarde.Neste sentido são mais escaláveis do que os bancos de dados tradicionais e as “datas warehouses”.
Mercado de trabalho [editar]
As oportunidades de trabalho na área de estatística estão aumentando graças à proliferação de programas para análise de dados e seu uso, especialmente, na tomada de decisão com objetivos estratégicos como: políticas de governo, seleção de investimentos, gestão de empresas e negócios, etc.. O Big Data permite trabalhar com grandes volumes de dados, por vezes, não aceitos pelos grandes programas estatísticos. No Brasil, a existência da profissão de Estatístico, regulamentada pelo Decreto Federal nº 62497 de 19685 , vigente, é vantagem do conhecimento nacional frente aos países desenvolvidos, uma vez que esse profissional é o que melhor pode trabalhar com esse tipo de sistema porque é treinado em estruturas de dados, em seu manuseio para extração de informação estratégica, nos métodos estatísticos de análise e em programação para sua análise estatística, de modo a se obter conclusões com margens de erro controladas para a tomada de decisões com base nos dados disponíveis. A IBM criou a Big Data University, que fornece certo conhecimento do Big Data.
Sistemas de Informação em atualidade [editar]
- Uma companhia que tira fotos de satélites e vende aos seus clientes informações em tempo real sobre a disponibilidade de vagas de estacionamento livres em uma cidade numa determinada hora ou quantos navios estão ancorados neste mesmo momento.
- Um projeto das Nações Unidas irá utilizar um programa que decifra a linguagem humana na análise de mensagens de texto e posts em redes sociais para prever o aumento do desemprego, o esfriamento econômico e epidemias de doenças.
- Uma varejista americana controla as combinações de produtos que seus clientes põem no carrinho, ou seja, ganhou eficácia e ainda descobriu várias curiosidades que podem ajudar.
- O terremoto do Haiti, foi previsto pelos EUA o que facilitou a ajuda humanitária, com a disponibilização de 2 milhões chips SIM.
- Um hospital Canadense utilizou de uma tecnologia proposta pela IBM, para o monitoramento dos quadros de bebes prematuros, permitindo aos médicos antecipar as ameaças às vidas das crianças.
- Em busca dos melhores lugares para instalar turbinas eólicas, uma empresa dinamarquesa analisou petabytes de dados climáticos do nível das marés, mapas de desmatamentos, entre outros. No fim o que costumava demorar semanas durou apenas algumas horas.
- A tecnologia do Big Data ja vem proporcionando diversos avanços em diferentes tipos de setores, como por exemplo, uma rede de vestuário que controla em tempo real seu fluxo de mercadoria e cruza os dados dos GPS dos caminhões dos seus fornecedores.
- Segundo especialistas o Big Data foi de grande importancia para o descobrimento do pré-sal, devido a sua velocidade, que agilizava os processamentos de dados sismicos captados pelas sondas que procuram petróleo no fundo do mar.Como são milhões as variáveis, o trabalho exige intermináveis simulações de imagens, e só o Big Data é capaz de dar conta do trabalho em um tempo melhor.
Críticas e prospectos [editar]
A massificação de dados, no entanto, ainda enfrenta obstáculos. O maior deles seria a privacidade, se a recomendação de links patrocinados pelo Google já parece invasiva à maioria das pessoas, o mundo e a legislação atual não estão preparadas para as possibilidades que o Big Data oferece de agregar e tirar conclusões de dados até então esparsos. Outro problema é a escassez de profissionais, que terão de se adaptar a tal tecnologia, com a previsão que em 2018 só os Estados Unidos podem enfrentar a falta de 140mil a 190mil com profundas capacidades analíticas.
Referências
- ↑ Big Data Definition - MIKE2.0, the open source methodology for Information Development. mike2.openmethodology.org. Página visitada em 16 de maio de 2012.
- ↑ White, Tom. Hadoop: The Definitive Guide. 2009. 1st Edition. O'Reilly Media. Pg 3.
- ↑ MIKE2.0, Big Data Definition http://mike2.openmethodology.org/wiki/Big_Data_Definition
- ↑ Grobelnik, Marko. Big Data Tutorial http://videolectures.net/eswc2012_grobelnik_big_data/
- ↑ Decreto nº 62.497, de 1º de Abril de 1968 que aprova o regulamento para o exercício da profissão de estatístico.. Página visitada em 18 de maio de 2013.
Bibliografia
- Hilbert, Martin; Priscila Lopez. (2011). "The World's Technological Capacity to Store, Communicate, and Compute Information". Science 332 (6025): 60–65. DOI:10.1126/science.1200970. PMID 21310967.
- Grobelnik, Marko. (2012). "Big Data Tutorial". 2nd ESWC Summer School 2012. http://videolectures.net/.