O que é o Big Data

P23 veja
Em Janeiro, a revista brasileira Veja indicava vinte e cinco razões que permitem ser optimista em 2013. Haverá menos poluição e impunidade, as colheitas serão abundantes, o cancro ficará sob controlo, as economias acelerarão o crescimento, eis algumas previsões que não deixam ninguém indiferente. Mas, entre o que neste ano se solucionará, há um problema que a generalidade da população não sabe sequer que existe: a desordem do Big Data, que agora regressa à Veja, tomando conta de quase toda a capa. No interior, numa dezena de páginas, o jornalista André Petry define o conceito, conta uma história, apresenta alguns números, noticia uma investigação e oferece um conselho.

Uma história

Na história, intervêm a Target, uma loja gigantesca, com quase dois mil postos de venda nos Estados Unidos da América, e um cliente. A loja atribuiu um número a cada um dos milhões de clientes e começou a rastrear e armazenar todas as suas pegadas digitais: produtos preferidos, hábitos de consumo, média de gastos, uso de cupões e do cartão de fidelidade. A isso, acrescentou outros dados: sexo, idade, profissão, endereço, estimativa de ordenado. Depois, contratou quem analisasse essas informações e estabeleceu um retrato do padrão de consumo de cada cliente. Um dia, entrou um homem numa loja da Target em Minnesota. Estava furioso. A filha, uma adolescente, tinha recebido cupões de produtos para bebés. “Ela é uma adolescente. Vocês estão a querer incentivá-la a engravidar?”. Depois de olhar para os cupões enviados pelo correio, o gerente pediu perdão. Dias depois, com receio de perder um bom cliente, telefonou para reforçar as desculpas. O pai da adolescente estava desconcertado: “Tive uma conversa com a minha filha. Fiquei a saber de algumas coisas que estavam a acontecer na minha casa”. Respirou fundo e completou: “Ela vai dar à luz em Agosto…”.

Alguns números

A história que a Veja reproduziu de O poder do hábito, um livro de Charles Duhigg editado este ano em Portugal pela D. Quixote, ilustra o modo como uma empresa pode querer rentabilizar as informações que a clientela deixa na Internet. Imenso, o rasto online dos clientes, efectivos ou potenciais, diz a revista, encontra-se no clique no rato para comprar um livro na Amazon, ou não comprar; na foto inserida no Facebook; no tweet; no vídeo colocado no YouTube; na pesquisa no Google; no telefonema gravado “para sua segurança”; na música escutada online; na publicação lida num leitor electrónico; no e-mail enviado ou, mesmo, no que não chegou a ser enviado; e, imagine-se, no próprio lixo online. A Veja nota que a imensa quantidade de informações se pode dividir em dois géneros. Um é constituído pela reduzidíssima parte que corresponde a dados limpos, correctos, verificados, como os que são apresentados por organismos como o Instituto Nacional de Estatística. O outro, a maior parte, é composto por dados caóticos, não trabalhados, resultado, por exemplo, da tal informação, voluntária ou involuntária, que cada um deixa na Internet. Para ilustrar o nível de profusão de dados, a Veja refere que, a cada quinze minutos, a humanidade gera o triplo de informações disponíveis no acervo da Biblioteca do Congresso dos Estados Unidos da América, a maior do mundo.

Uma definição

O Big Data, explica a Veja, é o “nome em inglês usado para definir a tectónica quantidade de dados e informações que produzimos no mundo digital”. E é essa extraordinária abundância de informação que – e esse era o prognóstico optimista da Veja de Janeiro – será cada vez mais bem analisada e compreendida com o auxílio da matemática e da estatística. Como a revista conta, “a análise do oceano de informações pode revelar um padrão, uma correlação, um significado antes oculto e, quase sempre, ajuda a prever o futuro”.

Uma investigação

Depois de notar que “a abundância e a variedade de dados seriam inúteis se fosse impossível analisá-los”, a Veja dá conta de uma investigação, feita pela Universidade de Cambridge, que, após analisar as páginas do Facebook de 58 mil pessoas, descobriu que pessoas com alto Quociente de Inteligência apreciam a voz do actor Morgan Freeman. Ninguém sabe por quê. A análise do Big Data pode estabelecer uma correlação, mas não é capaz de apontar uma causa. Os investigadores criaram, depois, um algoritmo para descobrir com uma precisão assinalável outras características não reveladas no Facebook. “O objectivo não era impressionar, mas mostrar que se pode deduzir muita coisa com base no nosso rasto digital”, esclarece Michal Kosinski, da Universidade de Cambridge.

Um conselho

“Há mais dados online do que dentro da casa das pessoas”, diz um empresário de Silicon Valley. O jornalista André Petry aproveita a afirmação para oferecer um bom conselho: “O cuidado de fechar a porta de casa ao sair deve ser redobrado na vida digital”.

Um comentário a O que é o Big Data

  1. Pingback: O que é o Big Data – Página...

Deixar um comentário

O seu email nunca será publicado ou partilhado.Os campos obrigatórios estão assinalados *

Podes usar estas tags e atributos de HTML:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>