Publicado hoy.
Ingeniero SRE (Site Reliability Engineer) - con manejo de AppDynamics en Capital Empresarial Horizonte
$ 80,000 a 90,000 MXN (Bruto)
Jalisco
Empleado de tiempo completo
Inglés : Nivel Intermedio
Capital Empresarial Horizonte Empresa Mexicana especialista en Recursos Humanos y Tecnologías de la Información solicita:
Ingeniero SRE (Site Reliability Engineer)
Ingles conversacional obligatorio
Trabajo en esquema 100% presencial en Guadalajara, Av. al Iteso 8900
Skill set:
- .NET – Soporte de aplicaciones y depuración de rendimiento
- ServiceNow – Gestión de incidentes, cambios y problemas
- AppDynamics – Monitoreo del rendimiento de aplicaciones y generación de alertas
Requisitos (6años):
- Experiencia práctica en gestión de incidentes y cambios mediante ServiceNow .
- Experiencia práctica en herramientas de monitoreo y paneles de observabilidad , especialmente AppDynamics .
- Sólida experiencia en desarrollo y scripting para automatización y sistemas de auto-recuperación (self-healing) .
- Capacidad para implementar filtros de alertas , umbrales dinámicos y reglas de supresión en AppDynamics.
- Cumplimiento de marcos de análisis de causa raíz (RCA) y seguimiento de incidentes .
- Experiencia en análisis proactivo de tendencias de incidentes y correlación de registros (logs) .
- Experiencia comprobada en soporte de aplicaciones y resolución de problemas en entornos de producción basados en .NET .
- Conocimiento en monitoreo proactivo , ajuste de alertas y estrategias de supresión de ruido .
- Capacidad para construir automatizaciones de auto-recuperación o scripts de recuperación para problemas recurrentes.
- Competencia en el análisis de telemetría y registros , gestión de eventos y detección de patrones.
Responsabilidades:
- Garantizar la salud del sistema mediante monitoreo continuo, respuesta automatizada a alertas y creación de incidentes.
- Integrar herramientas de observabilidad (por ejemplo, AppDynamics) y crear/mantener paneles de monitoreo.
- Automatizar la clasificación, triaje y flujos de escalamiento de tickets.
- Implementar monitoreo proactivo , ajuste de alertas, umbrales dinámicos y estrategias de supresión de ruido.
- Analizar registros (logs) para detectar patrones, gestionar eventos y contribuir a la detección proactiva de problemas.
- Mantener y versionar los documentos de RCA y las entradas de la base de conocimiento .
- Habilitar reinicios proactivos automatizados .
- Desarrollar automatizaciones de auto-recuperación o scripts de recuperación para problemas recurrentes.
Ofrecemos:
- Horario de Oficina
- Esquema 100% nomina
- Sueldo abierto a negociación de acuerdo a experiencia
- Prestaciones de Ley
Si te encuentras interesado, manda tu CV a: contacto (arroba) horizonteempresarial.com.mx