Trabalhe Conosco
Descrição
O Engenheiro de Dados Sênior será responsável por projetar, desenvolver e manter pipelines de dados escaláveis, garantindo a qualidade, segurança e governança das informações utilizadas em análises de negócio e sistemas críticos.
Responsabilidades
· Projetar, desenvolver e otimizar pipelines de ingestão, processamento e transformação de dados em larga escala.
· Garantir a governança, qualidade e integridade dos dados em todo o ciclo de vida.
· Trabalhar com arquiteturas de data lake, data warehouse e streaming de dados.
· Implementar boas práticas de versionamento, monitoramento e observabilidade dos fluxos de dados.
· Integrar diferentes fontes de dados (APIs, bancos relacionais, NoSQL, streams, arquivos, etc.).
· Avaliar trade-offs entre diferentes abordagens técnicas (custo, performance, complexidade) e comunicar recomendações para stakeholders não técnicos
· Monitorar e otimizar custos de processamento e armazenamento em cloud
Requisitos Técnicos
· Formação: Ciência da Computação, Engenharia, Sistemas de Informação ou áreas correlatas.
· Experiência: 5+ anos em engenharia de dados ou desenvolvimento de software ou funções relacionadas.
· Linguagens: Python, NodeJS e SQL;
· Bancos de Dados: MySQL, PostgreSQL, SQL Server, MongoDB, Redis, ElasticSearch
· Big Data: Apache Spark (PySpark, Spark SQL), Databricks (Delta Lake, clusters, otimização de custos), processamento de tabelas com 56B+ linhas
· Cloud: AWS (S3, EC2, Glue, Lambda, IAM) + GCP (BigQuery, Cloud Storage, Pub/Sub) — visão multi-cloud ou ao menos deep em uma
· Ferramentas de ETL/Orquestração: Airflow (ou Prefect) + dbt + CI/CD de pipelines (GitHub Actions/GitLab CI)
· Formatos: Parquet, Delta Lake, Avro — estratégias de particionamento, compactação e otimização de leitura/escrita
· Streaming: Kafka, RabbitMQ, Pub/Sub.
· DevOps e Infraestrutura: Docker, Git, Linux.
· Segurança e Governança: boas práticas de criptografia, controle de acesso (IAM), Lineage de dados, catalogação, políticas de acesso (RBAC/ABAC), retenção e conformidade (LGPD).
Competências Comportamentais
· Capacidade de lidar com grandes volumes de dados e ambientes de alta complexidade.
· Perfil analítico e orientado a resultados.
· Boa comunicação e habilidade para trabalhar em times multidisciplinares.
· Capacidade de mentorar juniores e plenos.
· Visão de arquitetura e escalabilidade.
Diferenciais
· Vivência com arquiteturas orientadas a eventos e micro serviços.
· Conhecimento em observabilidade (Grafana, Prometheus, Loki, ELK).
· Ter trabalhado com NFe, CTe e MDFe
· BI e Visualização: Power BI, Superset.
Local e Modelo de Trabalho
· Presencial
· Tipo de contrato: PJ
Descrição
O Analista de Dados Pleno será responsável por coletar, processar, analisar e visualizar dados para apoiar decisões estratégicas e operacionais do negócio, contribuindo com insights relevantes e mantendo a qualidade e integridade das informações.
Responsabilidades
• Extrair, transformar e carregar dados de diversas fontes (ETL/ELT) para suporte analítico.
• Desenvolver e manter dashboards, relatórios e visualizações interativas para áreas de negócio e clientes.
• Realizar análises exploratórias e descritivas de dados para geração de insights.
• Garantir a qualidade, consistência e integridade dos dados utilizados nas análises.
• Documentar processos, fluxos de dados e modelos analíticos de forma clara e acessível.
• Propor e implementar melhorias em processos, consultas e automações
Requisitos Técnicos
• Formação: Ciência da Computação, Estatística, Matemática, Sistemas de Informação ou áreas correlatas.
• Experiência: 3+ anos em análise de dados, business intelligence ou funções relacionadas.
• Linguagens: Python (Python + bibliotecas para BigQuery e pySpark) e SQL avançado.
• Bancos de Dados: MySQL, PostgreSQL, SQL Server, e noções de bancos NoSQL.
• BI e Visualização: Power BI e/ou Superset, Metabase.
• Cloud: Domínio em consultas, otimização e particionamento em grandes volumes. AWS (S3) ou GCP (BigQuery).
• Ferramentas de ETL: Experiência com pipelines de dados (Airflow, dbt ou similares).
• Controle de versão: Git e boas práticas de versionamento de código.
• Experiência comprovada com datasets acima de 100M+ registros
Competências Comportamentais
• Perfil analítico e orientado a resultados, com atenção a detalhes.
• Boa comunicação para traduzir dados em insights acionáveis para públicos não técnicos.
• Capacidade de trabalhar de forma autônoma e em times multidisciplinares.
• Proatividade na identificação de problemas e proposição de soluções baseadas em dados.
• Organização e capacidade de gerenciar múltiplas demandas com prazos distintos.
Diferenciais
• Experiência com modelagem de dados e data warehousing.
• Conhecimento em estatística;
• Familiaridade com ferramentas de observabilidade e monitoramento de dados.
• Vivência com ambientes de dados em tempo real (streaming).
• Certificações em plataformas de dados ou BI (AWS, Google, Power BI).
• Experiência com Databricks (Spark SQL, Delta Lake, pySpark)
Local e Modelo de Trabalho
• Modalidade: Presencial
• Tipo de contrato: PJ