Cientista de Dados Júnior/Pleno
Estamos em busca de um(a) Cientista de Dados para conduzir análises complexas e desenvolver soluções orientadas por dados que apoiem a tomada de decisões estratégicas de nossos clientes. A atuação envolve todas as etapas de projetos de dados, desde a coleta e tratamento até a construção de modelos estatísticos e algoritmos de aprendizado de máquina.
O desafio principal será o desenvolvimento de modelos de AI/ML em projetos diversos, garantindo entregas com qualidade e dentro dos prazos estabelecidos. A atuação será junto ao time interno de Ciência de Dados da Datalakers, em contato constante com diferentes clientes, dentro de uma estrutura de squads ágeis utilizando Scrum como metodologia de trabalho.
Se o seu perfil se conecta com esses desafios e você deseja ser considerado para a oportunidade inscreva-se e faça parte de uma rede de profissionais que buscam impacto e inovação. 💙
Obrigatório:
- Superior completo em Estatística, Matemática, Ciência da Computação ou áreas afins;
- Vivência com a linguagem de programação Python ou R;
- Conhecimento em plataformas de dados (Ex: Databricks, Spark, etc.);
- Conhecimento em ambientes de nuvem (GCP, Azure ou AWS);
- Conhecimento em modelos de Machine Learning;
- Conhecimento em modelos de LLM (incluindo fine-tuning e RAG) e suas aplicações;
- Experiência com análise de dados em diferentes contextos de negócio;
- Experiência com SQL para manipulação e consulta de dados em bancos de dados relacionais (PostgreSQL, MySQL, SQL Server).
- Compreensão de pipelines de dados e ETL para ingestão e preparação de dados;
- Boa comunicação, capacidade de pesquisar soluções e desenvolver conhecimento continuo
Diferencial
- Familiaridade com conceitos de NoSQL (MongoDB, Cassandra);
- Experiência com RAG e com orquestração e desenvolvimento de agentes inteligentes;
- Atuação com metodologias ágeis.
- Entender as necessidades do negócio e convertê-las em hipóteses, métricas e insights de dados;
- Criar modelos de Machine Learning;
- Explorar novas tecnologias e ferramentas para Data Science, MLOps e LLMOps;
- Desenvolver algoritmos em Python ou R para Advanced Analytics, Machine Learning, Deep Learning e aplicações que utilizem LLMs (incluindo fine-tuning e RAG);
- Avaliar os modelos desenvolvidos com métricas adequadas, realizando testes e monitoramento de qualidade, desempenho e custo;
- Explorar e modelar os dados à necessidade dos modelos analíticos que criará;
- Implantar e dar suporte aos modelos de IA em produção, garantindo governança, escalabilidade e manutenção ao longo do ciclo de vida.