Clique aqui para ver a previsão completa da semana
18/06/2017
Cientista de dados Ricardo Cappra usa big data para encontrar padrões; ele explicou processo e falou sobre avalanche de dados em palestra em Brasília. Leia entrevista ao G1.
m um mundo dominado pela “avalanche de informações”, onde os dados são medidos em escalas cada vez maiores – terabytes, petabytes, exabytes –, conseguir identificar padrões de comportamento se tornou um dos superpoderes mais valiosos. Com essa carta na manga, o cientista de dados gaúcho Ricardo Cappra abriu espaço no mercado norte-americano e passou a dar consultoria a órgãos como a Casa Branca, a ONU e o Google.
Em Brasília para a primeira edição da Campus Party na capital federal, Cappra conversou com os participantes do evento sobre a necessidade de filtrar, analisar e encontrar usos inteligentes para todos esses dados. Pouco antes, o cientista falou ao G1 sobre o trabalho que o deixou conhecido como “o cientista que ajudou a ONU a conter o ebola”.
"No caso da ONU, a gente fez um trabalho de background, cruzar informações para entender o efeito de disseminação da doença. Aí, no final, a ONU pega isso como matéria-prima e faz a aplicação”, declarou.
Apesar de toda a pompa, o Cappra Data Science – escritório liderado por ele, com sedes em São Paulo e São Francisco – não é exatamente um centro de tecnologia. Em vez de desenvolver ferramentas hi-tech para tabelar os dados, o grupo de cientistas se dedica a encontrar os algoritmos de análise – ou seja, as regras para decifrar todo esse código.
“A gente não está preocupado com a infraestrutura, com a montagem do modelo, porque a tecnologia é cada vez mais barata. A gente vai nas áreas de negócio, por exemplo, na ONU, e vê o que eles precisam resolver. Em cima disso, a gente detecta as informações que eles estão consumindo para decidir, e hackeia esse processo de decisão, criando um sistema mais lógico”, explica.
"Os dados estão em todo lugar, e crescem absurdamente todo dia. O problema é que você pode ficar tentando encontrar padrões o resto da vida, e não encontrar nenhum. Ou pode encontrar muitos padrões que não fazem sentido nenhum para as perguntas de negócio."
Padrões e recomendações
Os padrões de comportamento identificados em meio ao big data são usados, diariamente, para guiar o consumo de bilhões de pessoas ao redor do mundo. Quando uma rede social mostra “propagandas direcionadas”, ou quando um site de streaming diz “achamos que você poderia gostar desse conteúdo”, o produto é apresentado com base nesses padrões.
"Quando vocês pagam por esses serviços de streaming, vocês pagam por esse tipo de recomendação baseada nos seus dados", afirmou Cappra, durante a palestra na Campus Party BSB. Para além desses serviços, é possível usar esses padrões de comportamento em outras áreas de negócios.
“A gente cria um modelo preditivo, às vezes pra ver quantas pessoas vão entrar na Justiça contra a empresa, por exemplo, ou quando é melhor comprar tal matéria-prima. Ele começa com uma taxa de acerto pequena, que incrementa quando mais você balancear o algoritmo.”
No caso da previsão das ações judiciais – um exemplo real, feito pelo Cappra Data Science e em uso atualmente –, o algoritmo começou com uma taxa de acerto de 20%. Em pouco tempo de ajustes, o cientista diz ter elevado essa precisão para os 87%.
“Quando você toma uma decisão no seu negócio, você olha para várias variáveis, intuitivamente. A gente testa quantas dessas variáveis são de percepção, e quantas são de dados. Geralmente, são 30% e 70%, respectivamente. Aí, a gente pega a percepção e complementa com dados. Olha, tem essas informações do seu público que você nunca usou”, explica.
Fonte: g1.globo.com