Data Scientist - SaaS I+D+I
Somos Merlin Digital Partner, una consultoría líder en la captación de talento IT & digital con más de 10 años de experiencia. Hemos escalado grandes referentes del sector como Wallapop, Glovo, Banc Sabadell o Factorial, entre otros.
Enfocados en humanizar y agilizar los procesos de selección, nuestro objetivo es transformar empresas mediante la incorporación del mejor talento.
Nos caracterizamos por sumergirnos a fondo en la realidad de cada uno de nuestros partners, comprendiendo sus necesidades, pero también su esencia.
Actualmente, estamos en búsqueda de un Data Scientist.
Nuestro partner, una solución SaaS cuyo producto esta en 15 países y cuenta con clientes de primer nivel. Se especializan en el desarrollo de software para la gestión de espacios de trabajo, viajes de negocios, gastos corporativos etc.. con una fuerte inversión en I+D+I.
La misión del Data Scientist que buscamos:
Uno de nuestros principales retos es proporcionar a los clientes información relevante para la toma de decisiones por medio de la analítica de datos y a la que desean incorporar la Inteligencia Artificial para análisis predictivos.
Poseen ya una arquitectura de BI pero buscan un profesional con, al menos, 3-4 años de experiencia que los ayude a evolucionarla y gestionar la arquitectura de datos en AWS de la empresa, permitiendo la ingesta, procesamiento y análisis de datos provenientes de múltiples bases de datos MySQL y flujos de eventos de la aplicación. Los datos procesados deben integrarse en informes de Power BI y Grafana, que a su vez se embeben en la aplicación web de administración de la empresa.
Es por esto que este proyecto requiere una comprensión profunda de los servicios de AWS, experiencia en procesamiento de datos con PySpark, y habilidades en la integración de herramientas de análisis como Power BI y Grafana en aplicaciones web. El uso de metodologías ágiles y de minería de datos, junto con una sólida gestión de versiones, son cruciales para el éxito del proyecto.
Dentro de tus Responsabilidades y Actividades:
- Desde MySQL: Configurar la ingesta de datos desde varias bases de datos MySQL, tanto de manera incremental como mediante cargas completas periódicas.
- Eventos de la Aplicación: Ingestar datos de eventos de la aplicación a través de Amazon Kinesis, para capturar y procesar eventos en tiempo real.
- Almacenar los datos ingeridos en un Data Lake en AWS S3, asegurando una organización óptima para accesibilidad y procesamiento eficientes.
- Implementar estrategias de particionado y compresión para optimizar el almacenamiento y el rendimiento.
- Utilizar Amazon EMR o AWS Glue para procesar y transformar los datos almacenados en el Data Lake.
- Implementar procesos de limpieza y transformación de datos utilizando PySpark, asegurando la calidad y la preparación de los datos para análisis.
- Power BI: Desarrollar informes en Power BI basados en los datos transformados e integrar estos informes en la aplicación web de administración de Bookker.
- Grafana: Configurar y desarrollar informes en Grafana para monitoreo y visualización de datos en tiempo real.
- Utilizar metodologías ágiles SCRUM para la gestión de proyectos, asegurando la entrega continua y colaborativa.
- Aplicar la metodología CRISP-DM (Cross-Industry Standard Process for Data Mining) para la planificación y ejecución de proyectos de minería de datos.
- Implementar Gitflow para la gestión de versiones del código, asegurando un flujo de trabajo organizado y controlado.
Lo que te hará triunfar:
- Mínimo 3-4 años de experiencia en arquitecturas de datos, preferentemente en entornos AWS.
- Grado en Informática, Ingeniería de Sistemas, o campo relacionado.
- AWS (S3, EMR, Glue, Kinesis, RDS)
- Bases de datos MySQL
- PySpark
- Power BI
- Grafana
- Metodologías ágiles SCRUM
- CRISP-DM
- Git y Gitflow
Valoramos:
- Conocimiento en otros servicios de AWS (Lambda, Redshift)
- Experiencia con otros sistemas de bases de datos (PostgreSQL, NoSQL)
- Habilidades en lenguajes de programación adicionales (Python, Java, Scala)
- Familiaridad con herramientas de CI/CD (Jenkins, AWS CodePipeline)
- Conocimiento en seguridad de datos y prácticas de cumplimiento (GDPR, HIPAA)
Ofrecemos integrarte en un squad pequeño en crecimiento, dentro de una empresa que empieza a convertirse en una scale-up, con un ambiente distendido, 100% remoto y totalmente enamorado de su producto.
Abogando por el talento joven y comprometido, dónde trabajarás codo con codo con mentores realmente potente en el mundo de la realidad virtual y IT, en un proyecto retador e innovador.
- Departamento
- Data & BI
- Ubicaciones
- Barcelona
- Estado remoto
- Completamente remoto
Data Scientist - SaaS I+D+I
Cargando formulario de solicitud
¿Ya trabajas en Merlin Digital Partner?
Ayúdanos a encontrar a tu próximo compañero.