Stage Fin d'Etudes - Data Engineer at Silae

Paris, Ile-de-France, France -

Full Time

Start Date

Immediate

Expiry Date

20 Jul, 26

Salary

0.0

Posted On

21 Apr, 26

Experience

0 year(s) or above

Remote Job

Yes

Telecommute

Yes

Sponsor Visa

Skills

Python, SQL, Databricks, Apache Spark, Azure, ETL, PySpark, Data Engineering, Machine Learning, LLM, Data Quality, CI/CD, Data Lakehouse, Cloud Computing, Data Architecture

Industry

Software Development

Description

🚀Qui sommes-nous ? Silae, premier centaure RH français et logiciel n°1 de Paie en France, accélère sa croissance avec ses offres SaaS de gestion des ressources humaines (My Silae). Silae fait partie de Silver Lake, fonds d’investissement associé aux plus grandes transformations technologiques de ces dernières années. Le succès de Silae s'appuie sur la pertinence et la robustesse de ses solutions pour les TPE et PME, promu et opéré par un réseau inégalé de partenaires (experts comptables, professionnels de Paie et revendeurs) engagés au quotidien auprès de nos clients communs. Silae, c’est aujourd’hui 450 collaborateurs répartis sur plusieurs sites en France (Aix-en-Provence / Bordeaux / Lyon / Nantes/ Rennes / Paris / Montpellier / Brest) et en Espagne. Pour en savoir plus, un petit coup d'œil sur nos équipes 👉https://www.welcometothejungle.com/fr/companies/si... 👉 Notre page youtube 👉 Notre histoire 📝Missions Une équipe en construction, une culture d'ingénierie forte, un challenge technologique réel. Rejoignez une équipe jeune et en pleine création au sein d'une entreprise leader dans le domaine de la gestion de la paie. Dans un secteur où la donnée est au cœur du réacteur, nous construisons une plateforme Data moderne pour transformer des millions de lignes de paie en insights stratégiques. Votre mission : Construire le futur de la donnée Paie Sous la responsabilité du Lead Data Engineer, vous participerez au développement des cas d’usage sur notre plateforme Lakehouse Databricks dans le Cloud Azure. Vos missions incluront : Ingestion de données : créer des connecteurs pour extraire des données critiques (SQL, APIs, fichiers plats) vers notre Data Lakehouse. Transformation de données : écrire et optimiser des pipelines ETL complexes en PySpark pour nettoyer et structurer les données de paie (Architecture Medallion). Innovation IA & LLM : participer au déploiement et au monitoring de modèles de Machine Learning et de LLMs. Data Quality & Sécurité : garantir l’intégrité et la confidentialité des données (RGPD), un enjeu majeur dans notre domaine. Devops : participer aux revues de code, à l'automatisation CI/CD et au monitoring des flux. 🧩Votre profil Formation : Ingénieur de formation, passionné(e) par les problématiques de scalabilité et d'architecture. Technos : o Des bases solides en Python et SQL sont indispensables. o Les connaissances sur Databricks, Spark et Cloud Azure sont appréciées. o Une curiosité pour les problématiques d'IA générative et de LLM. Langues : Français courant, Anglais technique. Pourquoi nous rejoindre ? · Culture d'Ingénieur : Un environnement stimulant où la qualité du code et l'innovation technologique sont primordiaux. · Équipe en construction : Vous ne serez pas un simple exécutant, vous participerez aux choix techniques et à la structuration du pôle. · Possibilité d'embauche : Ce stage est conçu comme un tremplin vers un poste en CDI.

Responsibilities

You will participate in the development of data use cases on the Databricks Lakehouse platform within the Azure cloud. Responsibilities include building data ingestion connectors, optimizing ETL pipelines, and contributing to the deployment of machine learning and LLM models.