Data Science
Empresa bancaria con prestigio en Guatemala, está en búsqueda de un Data Sciente con enfoque en Arquitectura de datos modernas para que pueda desempeñar las siguientes funciones:
1. Desarrollar análisis exploratorios, inferenciales y predictivos sobre fuentes de datos estructuradas provenientes de arquitecturas batch.
2. Extraer, transformar y analizar grandes volúmenes de datos utilizando motores distribuidos como Apache Spark.
3. Consumir y procesar datos de arquitecturas batch tradicionales (archivos planos, bases de datos, parquet, etc.) o data lakes empresariales.
4. Ejecutar trabajos Spark en entornos distribuidos gestionados por YARN y orquestados desde interfaces como Apache Livy y Hue.
5. Utilizar cuadernos interactivos (Microsoft Fabric o Databricks) para análisis exploratorios, prototipos de modelos o entrega de reportes.
6. Generar dashboards dinámicos con indicadores clave para las áreas de negocio.
7. Aplicar metodologías de data wrangling y data profiling para limpieza, control de calidad y validación de fuentes de datos.
8. Documentar procedimientos, modelos y definiciones de negocio utilizadas.
9. Participar en la definición de buenas prácticas y flujos de trabajo en la arquitectura de datos organizacional.
Requisitos:
- Título universitario en Estadística Aplicada, Ingeniería en Sistemas, Ciencias de la Computación, Matemática Aplicada, Economía, Ingeniería Electrónica, Ingeniería Mecatrónica o afín.
- Experiencia de al menos 2 años trabajando con procesamiento de datos batch en entornos distribuidos
- Dominio de SQL avanzado, optimización de consultas y modelado relacional.
- Conocimiento práctico de Apache Spark (PySpark o Scala), preferiblemente sobre YARN.
- Experiencia utilizando interfaces como Apache Livy y Hue para ejecución y monitoreo de trabajos.
- Experiencia trabajando con formatos eficientes de almacenamiento como Parquet, ORC, Avro.
- Dominio de Python orientado al análisis de datos (pandas, numpy, matplotlib, seaborn).
- Participación en proyectos de modelos predictivos o clasificación usando Scikit-learn, MLlib u otras herramientas de machine learning.
- Conocimiento de flujos ETL batch y patrones de arquitectura como Medallion Architecture (bronze/silver/gold layers).
- Uso de herramientas de visualización como Power BI, Tableau o similares.
Ofrecemos:
- Horario de lunes a viernes
- Plaza presencial en sede central en zona 9 Ciudad de Guatemala
- Salario bastante competitivo y atractivo
- Beneficios de ley
- Oportunidad de pertenecer a un Banco líder de Guatemala