Entenda o papel do Data Science

Conhecido também como Ciência de Dados – Data Science – representa um conjunto de estudos (análise, cruzamento e manipulação) de informações para predizer e compreender fenômenos. 

Colocando de lado a explicação formal, podemos dizer que data science é o tipo de estudo que utiliza dados – informações – como base. A partir de uma análise estatística, esses números podem explicar quais a características de determinada variável, compreendendo seu  comportamento, variação e até mesmo prevendo qual será a próxima mudança.

Além da estatística, computação e matemática, o profissional de Data Science precisa sobretudo compreender o contexto no qual os dados estão inseridos: o que são e pra que serão utilizados, o conhecimento a respeito do business e como a informação gerada se tornará ação. 

Ok, mas como podemos entender na prática essa relação entre ação e dados, causa e efeito? Veremos a seguir:

Pegando como exemplo um vendedor de sorvete na praia, sabemos que durante o final-de-semana, muitas famílias deixam o interior e se direcionam ao litoral, fazendo o turismo crescer e consequentemente o número de banhista. Sendo assim, podemos relacionar que determinados dias da semana (Sábado e Domingo) se vende mais sorvete que outros, portanto com essa correlação podemos prever quanto sorvete será vendido diariamente? Sim e não.

É importante ressaltar que um dos fundamentos do Data Science é a correlação de dados, onde constata-se que uma informação pode ou não descrever um fenômeno. No caso citado poderíamos levantar vários questionamentos a respeito dessa informação:

  • Nos finais-de-semana frios? Teria a mesma quantidade de consumidores?
  • Nos meses de verão? Não venderíamos mais?
  • E o número de outros vendedores e ambulantes?

Por isso que ressaltamos, dentro da área de dados entender  o que a informação explica por si só é fundamental, mas o conjunto ao qual ele pertence é indispensável!

Correlação não é causalidade, mas é um bom indício. 

Dentro do espectro de possibilidades, existem também o principal inimigo da análise de dados: a coincidência. No gráfico abaixo, vemos a relação entre o número de filmes que o ator Nicolas Cage apareceu e a quantidade em milhões de visitantes no Sea World, na Flórida – EUA:

Sendo assim, podemos dizer que encontramos a chave do sucesso para o Sea World, e que sua equipe deve se esforçar ao máximo para que Nicolas Cage não estrele em nenhuma produção. Certo? A correlação não indica efeito de causa, sendo assim é importante para a ciência de dados entender que dados que se relacionam ou como eles estão ligados. 

Uma correlação estatística precisa se provada por hipóteses, apostar em uma coincidência é apenas uma jogada de sorte. 

Ok, mas e o que eu tenho a ver com isso?

Hoje o mundo é feito de dados, grandes fluxos de informações são gerados a cada minuto e devemos fazer dele o fruto da nossa eficiência. Desde grandes multinacionais até o vendedor ambulante, é possível prever demanda, receita e custos através das informações do seu negócio.

Nós da Hprojekt trabalhamos com recrutamento e seleção de cargos altamente especializados, como profissionais em Data Science e desenvolvedores. Nosso objetivo é ajudar  empresas a contrataram o cara certo para quantificar seu negócio.

Gostou desse conteúdo? Acesse nosso blog para saber mais:

https://blog.hprojekt.com.br/

Se você deseja encontrar o cara certo pra sua empresa:

https://www.hprojekt.com.br/contato/

Se você procura o emprego ideal:

https://jobs.hprojekt.com.br/

Comments are closed.