Empleo de Data Engineer Python Middle - Remoto en Remoto-108125-REMOTO

Publicado hace más de 30 días.

Data Engineer Python Middle - Remoto en AOS

$ 5.000.000 a 5.999.999 COP (Neto)

Remoto: LATAM

Empleado de tiempo completo

Inglés : Nivel Básico

se requiere data inginier con conocimientos en:


1. Fundamentos de Datos

-Tipos de Datos: Comprensión de datos estructurados, semiestructurados y no estructurados.

-Modelado de Datos: Conocimientos en diseño y modelado de bases de datos, incluyendo esquemas de datos y normalización.

2. Lenguajes de Programación

-Lenguajes Comunes: Dominio de lenguajes como Python, Java o Scala, que son comunes en el procesamiento de datos.

-SQL: Habilidad avanzada en SQL para la consulta y manipulación de datos en bases de datos relacionales.

3. Bases de Datos

-Bases de Datos Relacionales: Experiencia con sistemas como MySQL, PostgreSQL o Oracle.

-Bases de Datos NoSQL: Familiaridad con bases de datos NoSQL como MongoDB, Cassandra o Redis.

4. Herramientas y Tecnologías de Big Data

-Ecosistema Hadoop: Conocimiento de herramientas como Hadoop, Hive y HBase para el procesamiento de grandes volúmenes de datos.

-Frameworks de Procesamiento: Experiencia con Apache Spark y Apache Flink para el procesamiento en tiempo real y por lotes.

5. ETL y Pipelines de Datos

-ETL (Extracción, Transformación, Carga): Conocimientos sobre cómo diseñar y construir procesos de ETL para mover y transformar datos.

-Herramientas de ETL: Familiaridad con herramientas como Apache NiFi, Talend o Informatica.

6. Cloud Computing

-Plataformas en la Nube: Experiencia con servicios en la nube como AWS (Redshift, S3), Google Cloud (BigQuery, Dataflow) o Azure (Data Lake, Azure SQL).

-Arquitectura en la Nube: Comprender cómo diseñar arquitecturas escalables y eficientes en la nube.

7. Seguridad y Gobernanza de Datos

-Políticas de Seguridad: Conocimiento sobre cómo proteger los datos y cumplir con regulaciones de privacidad.

-Calidad de Datos: Implementar prácticas de calidad de datos para asegurar que los datos sean precisos y consistentes.

8. DevOps y Automatización

-CI/CD: Familiaridad con prácticas de integración y entrega continua (CI/CD) para automatizar el despliegue de pipelines de datos.

-Contenedores y Orquestación: Conocimiento de herramientas como Docker y Kubernetes para la implementación y gestión de aplicaciones.