Publicado hace 2 días.
Científico de Datos Python Senior - Remoto en BakerRobotics
Sueldo oculto
Remoto: LATAM
Empleado de tiempo completo
Inglés : Nivel Intermedio
Misión Principal :
Desarrollar, entrenar y desplegar modelos que aprovechen fuentes de datos alternativos (sociales, conductuales, imágenes) e integren LLMs en el pipeline de scoring de riesgo.
Responsabilidades :
Construir pipelines de extracción de variables a partir de datos no estructurados (texto de transacciones, logs de comportamiento, redes sociales).
Desarrollar modelos de fusión multimodal para combinar datos estructurados y no estructurados.
Optimizar modelos para decisiones en tiempo (casi) real.
Colaborar con el estadístico para asegurar explicabilidad y generar análisis de datos y modelos de Machine Learning.
Conocimientos Requeridos :
Machine Learning y Deep Learning: gradient boosting (XGBoost, LightGBM, CatBoost), redes neuronales (PyTorch, TensorFlow). - LLMs y NLP: Hugging Face Transformers. Puesta en producción: MLflow, Docker, despliegue en la nube.
Tecnologías: Python (transformers, PyTorch, scikit-learn, OpenAI SDK), SQL/NoSQL.
Deseable: Familiaridad con métricas de riesgo crediticio (charge-off, curvas de morosidad).