É grande o número de pessoas que já ouviu falar no Big Data, mas não tem ideia do que ele é, e para entender de que forma essa tecnologia esta mudando nossas vidas é preciso deixar os termos técnicos de lado e usar uma linguagem mais informal.
Como definição, o Big Data é a habilidade de capturar, armazenar e processar grandes quantidades de dados em busca de correlações, ou seja, é uma aventura de descobertas através do cruzamento de números, estatísticas e levantamento do comportamento do consumidor por trás do seu perfil, como tendências, modelos, entre outros, fundamental para a tomada de decisões, porém, nós não sabemos exatamente o que estamos procurando até encontrarmos resultados inesperados.
Para exemplificar, podemos citar uma empresa americana que realizou uma pesquisa para criar um método de prever os problemas que um carro usado poderá ter antes de comprá-lo no caso de um leilão, pois não é possível examinar o carro com detalhes antes de dar o lance embora estabelecer esse método possa gera alguma vantagem competitiva.
Estranhamente depois de cruzar um número imenso de informações e dados históricos, os cientistas que analisaram a pesquisa concluíram que os carros cor laranja são os que apresentam menor chance de apresentar problemas. Vale salientar que a pesquisa não procurava por carros especificamente cor laranja e sim por dados como: marca, modelo, ano, cor, preço, origem, fabricante, entre outros, e no resultado da análise dos dados encontraram uma correlação entre quantidade de problemas e a cor.
No final da pesquisa não houve efetivamente uma justificativa do motivo da cor estar associada aos critérios selecionados, mas o que foi demonstrado realmente é que nos Estados Unidos os carros cor laranja possuem 50% menos chance de apresentar problemas. Para quem busca o resultado pouco importa o porquê e sim o que fazer com as informações, as correlações detectadas nos números são fatos. Essa possibilidade se dá graças ao imenso suporte que temos disponível para coleta de dados, armazenamento e processamento.
Outro caso a exemplificar foi o surto de gripe causado pelo vírus H1N1 (influenza) em meados de 2008, onde os dados sobre onde e como o vírus se alastrava estavam sempre desatualizados devido ao fato do período de incubação se dar sempre em torno de duas semanas antes do paciente procurar ajuda e o caso ser registrado nos órgãos competentes que também demoravam em juntar os dados às estatísticas. Nos Estados Unidos, o CDC, agência que regula o departamento de saúde, precisava dos dados muito antes para que pudesse tomar alguma providência com efeito preventivo.
Assim, a maioria das pessoas que tinha algum tipo de sintoma começou a recorrer ao Google para saber mais informações, foi então que os cientistas do Google cruzaram os dados das milhões de pesquisas realizadas semanas antes do H1N1 ser detectado em determinada região através de dados oficiais, em comparação com as pesquisas que estavam sendo realizadas naquele momento, e conseguiram gerar gráficos capazes de prever em tempo real de que forma o H1N1 estava se propagando. O resultado deste processo chegou a mostrar ser 90% eficiente, e hoje o mesmo está disponível gratuitamente a todos, não apenas para o influenza, mas também para outros tipos de doenças.
Casos exemplificados como estes ilustram a concepção do Big Data, que propõe também sua aplicação na área comercial possibilitando prever tendências de preços e compras, contudo é preciso tomar muito cuidado no que diz respeito à privacidade, pois devemos lembrar que há um aumento cada vez maior do número de pessoas que acessam a internet e as redes sociais, e consequentemente fica fácil monitorar e registrar comportamentos e hábitos de cada um a todo o momento.