Trabalhe Conosco

Descrição

O Engenheiro de Dados Sênior será responsável por projetar, desenvolver e manter pipelines de dados escaláveis, garantindo a qualidade, segurança e governança das informações utilizadas em análises de negócio e sistemas críticos.

Responsabilidades

· Projetar, desenvolver e otimizar pipelines de ingestão, processamento e transformação de dados em larga escala.

· Garantir a governança, qualidade e integridade dos dados em todo o ciclo de vida.

· Trabalhar com arquiteturas de data lake, data warehouse e streaming de dados.

· Implementar boas práticas de versionamento, monitoramento e observabilidade dos fluxos de dados.

· Integrar diferentes fontes de dados (APIs, bancos relacionais, NoSQL, streams, arquivos, etc.).

· Avaliar trade-offs entre diferentes abordagens técnicas (custo, performance, complexidade) e comunicar recomendações para stakeholders não técnicos

· Monitorar e otimizar custos de processamento e armazenamento em cloud

Requisitos Técnicos

· Formação: Ciência da Computação, Engenharia, Sistemas de Informação ou áreas correlatas.

· Experiência: 5+ anos em engenharia de dados ou desenvolvimento de software ou funções relacionadas.

· Linguagens: Python, NodeJS e SQL;

· Bancos de Dados: MySQL, PostgreSQL, SQL Server, MongoDB, Redis, ElasticSearch

· Big Data: Apache Spark (PySpark, Spark SQL), Databricks (Delta Lake, clusters, otimização de custos), processamento de tabelas com 56B+ linhas

· Cloud: AWS (S3, EC2, Glue, Lambda, IAM) + GCP (BigQuery, Cloud Storage, Pub/Sub) — visão multi-cloud ou ao menos deep em uma

· Ferramentas de ETL/Orquestração: Airflow (ou Prefect) + dbt + CI/CD de pipelines (GitHub Actions/GitLab CI)

· Formatos: Parquet, Delta Lake, Avro — estratégias de particionamento, compactação e otimização de leitura/escrita

· Streaming: Kafka, RabbitMQ, Pub/Sub.

· DevOps e Infraestrutura: Docker, Git, Linux.

· Segurança e Governança: boas práticas de criptografia, controle de acesso (IAM), Lineage de dados, catalogação, políticas de acesso (RBAC/ABAC), retenção e conformidade (LGPD).

Competências Comportamentais

· Capacidade de lidar com grandes volumes de dados e ambientes de alta complexidade.

· Perfil analítico e orientado a resultados.

· Boa comunicação e habilidade para trabalhar em times multidisciplinares.

· Capacidade de mentorar juniores e plenos.

· Visão de arquitetura e escalabilidade.

Diferenciais

· Vivência com arquiteturas orientadas a eventos e micro serviços.

· Conhecimento em observabilidade (Grafana, Prometheus, Loki, ELK).

· Ter trabalhado com NFe, CTe e MDFe

· BI e Visualização: Power BI, Superset.

Local e Modelo de Trabalho

· Presencial

· Tipo de contrato: PJ

Candidate-se!

Descrição

O Analista de Dados Pleno será responsável por coletar, processar, analisar e visualizar dados para apoiar decisões estratégicas e operacionais do negócio, contribuindo com insights relevantes e mantendo a qualidade e integridade das informações.

Responsabilidades

• Extrair, transformar e carregar dados de diversas fontes (ETL/ELT) para suporte analítico.

• Desenvolver e manter dashboards, relatórios e visualizações interativas para áreas de negócio e clientes.

• Realizar análises exploratórias e descritivas de dados para geração de insights.

• Garantir a qualidade, consistência e integridade dos dados utilizados nas análises.

• Documentar processos, fluxos de dados e modelos analíticos de forma clara e acessível.

• Propor e implementar melhorias em processos, consultas e automações

Requisitos Técnicos

• Formação: Ciência da Computação, Estatística, Matemática, Sistemas de Informação ou áreas correlatas.

• Experiência: 3+ anos em análise de dados, business intelligence ou funções relacionadas.

• Linguagens: Python (Python + bibliotecas para BigQuery e pySpark) e SQL avançado.

• Bancos de Dados: MySQL, PostgreSQL, SQL Server, e noções de bancos NoSQL.

• BI e Visualização: Power BI e/ou Superset, Metabase.

• Cloud: Domínio em consultas, otimização e particionamento em grandes volumes. AWS (S3) ou GCP (BigQuery).

• Ferramentas de ETL: Experiência com pipelines de dados (Airflow, dbt ou similares).

• Controle de versão: Git e boas práticas de versionamento de código.

• Experiência comprovada com datasets acima de 100M+ registros

Competências Comportamentais

• Perfil analítico e orientado a resultados, com atenção a detalhes.

• Boa comunicação para traduzir dados em insights acionáveis para públicos não técnicos.

• Capacidade de trabalhar de forma autônoma e em times multidisciplinares.

• Proatividade na identificação de problemas e proposição de soluções baseadas em dados.

• Organização e capacidade de gerenciar múltiplas demandas com prazos distintos.

Diferenciais

• Experiência com modelagem de dados e data warehousing.

• Conhecimento em estatística;

• Familiaridade com ferramentas de observabilidade e monitoramento de dados.

• Vivência com ambientes de dados em tempo real (streaming).

• Certificações em plataformas de dados ou BI (AWS, Google, Power BI).

• Experiência com Databricks (Spark SQL, Delta Lake, pySpark)

Local e Modelo de Trabalho

• Modalidade: Presencial

• Tipo de contrato: PJ

Candidate-se!