São duas profissões em alta no mercado com salários de até R$ 20 mil
Em tempos em que saber reunir informações e fazer a compilação de dados tem sido crucial para as empresas, as profissões de cientista e de engenheiro de dados estão super em alta. A primeira, é hoje considerada a mais requisitada para o próximo século, segundo a Harvard Business Review. Conforme informa o site Glassdoor, um cientista de dados no Brasil ganha de R$ 9 mil a R$ 20 mil. Já para um engenheiro de dados, o mercado paga em torno de R$ 7 mil.
Cientistas são aquelas pessoas curiosas, investigativas, questionadoras e com um poder de análise e observação aguçados O cientista da área de dados traduz informações, constrói probabilidades e gera previsões para um negócio evoluir.
O Relatório Connectivity Benchmark 2020, da MuleSoft, entrevistou 800 líderes, em organizações com pelo menos mil funcionários, dos Estados Unidos, Reino Unido, França, Alemanha, Holanda, Austrália, Cingapura, Hong Kong e Japão, constatando que as quatro principais prioridades de investimento delas em TI eram: segurança (53%), big data e analytics (48%), estratégia de multicloud (41%) e IA/machine learning (41%). O que se observa é que todas são relacionadas a dados.
Ainda segundo a pesquisa, as três principais funções de negócios com necessidades desta integração são: analistas de negócios (40%), cientistas de dados (38%) e suporte ao cliente (38%).
Embora seja comum que os cientistas de dados reúnam conhecimento autodidata, a profissão requer estudo aprofundado e especialização. Por isso, o interessado no ramo deve buscar comunidades, grupos e eventos gratuitos para aprender sobre tecnologias novas, reaprender as que domina e questionar dúvidas em fóruns do segmento.
Pré-requisito básico para esta carreira é ter conhecimento básico de banco de dados relacional ou não relacional (SQL e NoSQL) e em linguagem de programação.
Para esmiuçar uma base de dados é preciso aprender algumas linguagens como R e Python, criando seu modelo de algoritmo, assim como estrutura de atribuição de variáveis, vetores, matrizes e loops.
Quem ingressa na carreira deve ter um nível inicial de conhecimento sobre infraestrutura e comandos básicos de Linux, pois os fornecedores principais dos programas de Big Data trabalham com sistemas e ferramentas open source, logo, desenvolvidos em Linux.
Quartis, percentis, variância, desvio-padrão e o básico em cálculos matemáticos como álgebra, regressão, entender a tendência dos dados pensando na representação visual nos gráficos exploratórios, são outras exigências para um cientista de dados, uma vez que a partir destes conhecimentos poderá aplicar um algoritmo.
O cientista de dados tem que gostar de tecnologia, matemática e física. Profissionais que já são formados em algum campo da engenharia, encontram nesse ramo uma excelente opção para ampliar o leque de habilidades.
Business Intelligence, Data Analytics e Big Data são tecnologias desenvolvidas para captar e analisar grandes quantidades de dados, ligadas diretamente a diversas profissões do universo da TI. E um dos especialistas mais demandados nesse ambiente é o cientista de dados.
O papel do cientista de dados surgiu ainda na academia: as universidades necessitavam de programadores capazes de trabalhar em equipe. Seguindo esse contexto foram criados programas como o Institute for Advanced Analytics, da North Carolina, State University, que ajudaram a produzir toda uma geração de cientistas de dados. Hoje, já existem mais de 60 programas semelhantes em faculdades dos EUA.
Usados para coletar e processar uma quantidade muito grande de dados que as empresas armazenam em suas redes – e muitas vezes ficam esquecidos – esses programas deram origem ao Big Data.
Por muitos anos, os cientistas de dados trabalhavam como estatísticos ou analistas no campo da tecnologia da informação, apenas em empresas muito específicas. Hoje, o Big Data é ferramenta cada vez mais frequente em diversos mercados, inclusive para as áreas do marketing e dos negócios.
A principal atividade do cientista de dados é coletar e armazenar dados não-estruturados, traduzindo-os para uma linguagem mais acessível para servir de base para traçar estratégias de mercado.
O profissional desta área atua em conjunto com a TI e com a gerência. Tem de saber dialogar com linguagens próprias: uma, mais focada no universo dos softwares e programas; outra, mais focada na comunicação com os supervisores que nem sempre estão familiarizados com os termos e siglas.
Engenheiros de dados são membros chaves que integram uma equipe corporativa de análise de dados, pois detectam tendências nos conjuntos de dados e desenvolvem algoritmos para ajudar a tornar os dados brutos em informações úteis para a empresa.
A profissão remunera bem. Um iniciante na carreira de engenheiro tem um rendimento em torno de R$ 4,6 mil e pode vir a ganhar até R$ 10,1 mil. A média salarial no Brasil é de R$ 7,7 mil.
Essa função exige um profundo conhecimento do design do banco de dados SQL e de várias linguagens de programação. O profissional da área também precisa ter habilidades de comunicação para entender e reportar os insights que os negócios desejam extrair do Big Data.
É um profissional que tem que ter as metas de negócios alinhadas ao trabalhar com os dados, especialmente para empresas que lidam com conjuntos de dados complexos.
Esses engenheiros também precisam entender como otimizar a recuperação de dados e como desenvolver dashboards, relatórios e outras visualizações para as partes interessadas.
Normalmente, os engenheiros de dados têm formação em Ciência da Computação, Engenharia, Matemática Aplicada ou diploma em outras áreas relacionadas à TI.
Em síntese o engenheiro de dados pode percorrer por três campos de trabalho, sendo eles: os Generalistas geralmente encontrados em pequenas equipes ou em pequenas empresas; Centralizado em Pipeline voltado para empresas de médio porte, trabalham em conjunto com cientistas de dados e, por fim, o Centralizado no Banco de Dados buscado por grandes corporações, onde o gerenciamento do fluxo de dados é um trabalho em tempo integral realizado em bancos de dados analíticos.
Quando o engenheiro de dados é responsável pela criação do pipeline, ele transforma os dados brutos que estão nos mais variados formatos, desde bancos de dados transacionais até arquivos de texto, em um formato que permite ao cientista de dados dar andamento em suas tarefas.
Cabe ao engenheiro de dados assegurar, por meio de linguagens de programação, que os dados sejam limpos, confiáveis e disponíveis para acesso em alta performance.
A organização dos dados é uma das principais atividades do engenheiro e envolve tarefas como transformar dados bagunçados e brutos em dados realmente úteis.
Para se tornar um engenheiro de dados é necessário saber formatar arquivos, processar dados em streaming e em batches, SQL, gerenciar clusters, decifrar banco de dados transacionais, frameworks para web, fazer a visualização de dados e entender de machine learning. Além de aptidões técnicas, é importante reunir características pessoais, como capacidade analítica, visão sistêmica e pensamento estratégico.
Essas qualidades servem para transformar os dados em insights e, posteriormente, em ações.
Também são exigidos conhecimentos sobre análise preditiva e prescritiva, usando linguagens como Java, Scala e Python. O engenheiro de dados deve dominar amplamente toda a lógica e complexidade por trás de conceitos como Big Data e computação em nuvem.
As principais universidades de TI do Brasil oferecem cursos específicos para cientista de dados ou Data Science. A graduação em Ciência de Dados geralmente é oferecida pelas faculdades na modalidade tecnólogo, com disciplinas específicas distribuídas em dois anos de curso. A pós-graduação em Data Warehouse e Business Intelligence é uma das opções para expandir o seu portfólio no campo de cientista de dados.
O mercado acadêmico oferece uma grande variedade de cursos para formação e especialização de quem quer atuar como engenheiro de dados. Confira os mais cobiçados:
Amazon Web Services (AWS) Certified Data Analytics – Specialty
Cloudera Certified Associate (CCA) Spark and Hadoop Developer
Cloudera Certified Professional (CCP): Data Engineer
Data Science Council of America (DASCA) Associate Big Data Engineer
Data Science Council of America (DASCA) Senior Big Data Engineer
Google Professional Data Engineer
IBM Certified Data Architect – Big Data
IBM Certified Data Engineer – Big Data
SAS Certified Big Data Professional
Data Analytics com certificação
Links pesquisados:
EAD Univali
Computer World
Vagas.com
DSA Academy
Insight Lab
FIA
CIO