Publicado hace más de 30 días.
Data Engineer Python Middle - Remoto en AOS
$ 5.000.000 a 5.999.999 COP (Neto)
Remoto: LATAM
Empleado de tiempo completo
Inglés : Nivel Básico
se requiere data inginier con conocimientos en:
1. Fundamentos de Datos
-Tipos de Datos: Comprensión de datos estructurados, semiestructurados y no estructurados.
-Modelado de Datos: Conocimientos en diseño y modelado de bases de datos, incluyendo esquemas de datos y normalización.
2. Lenguajes de Programación
-Lenguajes Comunes: Dominio de lenguajes como Python, Java o Scala, que son comunes en el procesamiento de datos.
-SQL: Habilidad avanzada en SQL para la consulta y manipulación de datos en bases de datos relacionales.
3. Bases de Datos
-Bases de Datos Relacionales: Experiencia con sistemas como MySQL, PostgreSQL o Oracle.
-Bases de Datos NoSQL: Familiaridad con bases de datos NoSQL como MongoDB, Cassandra o Redis.
4. Herramientas y Tecnologías de Big Data
-Ecosistema Hadoop: Conocimiento de herramientas como Hadoop, Hive y HBase para el procesamiento de grandes volúmenes de datos.
-Frameworks de Procesamiento: Experiencia con Apache Spark y Apache Flink para el procesamiento en tiempo real y por lotes.
5. ETL y Pipelines de Datos
-ETL (Extracción, Transformación, Carga): Conocimientos sobre cómo diseñar y construir procesos de ETL para mover y transformar datos.
-Herramientas de ETL: Familiaridad con herramientas como Apache NiFi, Talend o Informatica.
6. Cloud Computing
-Plataformas en la Nube: Experiencia con servicios en la nube como AWS (Redshift, S3), Google Cloud (BigQuery, Dataflow) o Azure (Data Lake, Azure SQL).
-Arquitectura en la Nube: Comprender cómo diseñar arquitecturas escalables y eficientes en la nube.
7. Seguridad y Gobernanza de Datos
-Políticas de Seguridad: Conocimiento sobre cómo proteger los datos y cumplir con regulaciones de privacidad.
-Calidad de Datos: Implementar prácticas de calidad de datos para asegurar que los datos sean precisos y consistentes.
8. DevOps y Automatización
-CI/CD: Familiaridad con prácticas de integración y entrega continua (CI/CD) para automatizar el despliegue de pipelines de datos.
-Contenedores y Orquestación: Conocimiento de herramientas como Docker y Kubernetes para la implementación y gestión de aplicaciones.