Senior MLOps Engineer (m/f/d) at Deutsche Telekom Group
Berlin, Saxony, Germany -
Full Time


Start Date

Immediate

Expiry Date

19 Mar, 26

Salary

0.0

Posted On

19 Dec, 25

Experience

5 year(s) or above

Remote Job

Yes

Telecommute

Yes

Sponsor Visa

No

Skills

Python, Docker, Git, Gitlab, GCP, AWS, Azure, TensorFlow, PyTorch, Machine Learning, CI/CD, Data Preparation, Monitoring, Debugging, Problem Solving, Analytical Skills, Communication Skills

Industry

Telecommunications

Description
Als Lead MLOps Engineer bist Du verantwortlich für das Deployment, die Überwachung und Automatisierung von Machine Learning-Modellen in Produktionsumgebungen. Du arbeitest dabei eng mit Data Scientists und Software Engineers zusammen, um die Skalierbarkeit und Zuverlässigkeit von Machine Learning-Systemen sicherzustellen und Probleme zu beheben. Modellbetrieb und -überwachung: Implementierung und Überwachung von Machine Learning-Modellen in Produktionsumgebungen, einschließlich Aufbauen von Pipelines für automatisiertes Training der Modelle sowie Verwaltung von Modellversionen und Sicherstellung der Konsistenz und Genauigkeit der Modelle. Automatisierung: Entwicklung und Pflege von CI/CD-Pipelines für Machine Learning-Projekte, um die kontinuierliche Integration und Bereitstellung von Modellen zu ermöglichen. Dies umfasst die Automatisierung von Tests, Validierungen und Deployments. Standardisierung: Einführung von Standards für Deployment von Datenaufbereitungs- und Machine Learning Pipelines sowie Sicherstellung der Wiederverwendbarkeit von einzelnen Schritten in den Pipelines. Skalierbarkeit: Sicherstellung der Skalierbarkeit und Zuverlässigkeit von Machine Learning-Systemen durch die Implementierung von Load Balancing, Failover-Strategien und Performance-Optimierungen. [CK2] Monitoring und Wartung: Implementierung von Monitoring-Tools zur Überwachung der Modellleistung und -stabilität sowie regelmäßige Wartung und Updates der Machine Learning-Infrastruktur. Fehlerbehebung: Identifizierung und Behebung von Problemen in Machine Learning-Modellen und -Infrastrukturen, einschließlich der Analyse von Logs, der Durchführung von Debugging und der Implementierung von Korrekturmaßnahmen. Hervorragende technische Fähigkeiten: in Python, Docker, Git/Gitlab und Cloud-Plattformen wie GCP (oder AWS/Azure) und mit Machine Learning-Frameworks wie TensorFlow oder PyTorch. Umfangreiche praktische Erfahrung: in der Implementierung und Verwaltung von Machine Learning-Modellen und Datenaufbereitungspipelines in Produktionsumgebungen, einschließlich der Arbeit mit großen Datenmengen und komplexen Algorithmen. Nachweisliche Erfahrung als technischer Lead: für ML-Produkte mit signifikanter Reichweite von der Konzeption über den Markteintritt bis zum laufenden Betrieb Exzellente analytische Fähigkeiten: zur Analyse und Optimierung von Machine Learning-Prozessen, einschließlich der Identifizierung von Engpässen und der Implementierung von Verbesserungen. Hervorragende Kommunikationsfähigkeiten: technische Konzepte klar und verständlich zu vermitteln, sowie aktives Coachen innerhalb des Teams. Starke Problemlösungsfähigkeiten: zur Identifizierung und Behebung von technischen Herausforderungen und zur kontinuierlichen Verbesserung der Systemleistung.
Responsibilities
As a Lead MLOps Engineer, you will be responsible for deploying, monitoring, and automating machine learning models in production environments. You will work closely with Data Scientists and Software Engineers to ensure the scalability and reliability of machine learning systems.
Loading...