Distributed System Engineer/GPU #Rust at GECI Int.

, , -

Full Time

Start Date

Immediate

Expiry Date

23 Jun, 26

Salary

0.0

Posted On

25 Mar, 26

Experience

5 year(s) or above

Remote Job

Yes

Telecommute

Yes

Sponsor Visa

Skills

Rust, Distributed Systems, HPC, GPU, Backend Services, Orchestration, Task Queues, Data Management, Performance Optimization, Resilience, Microservices, gRPC, Apache Pulsar, RabbitMQ, AWS, Lustre

Industry

IT Services and IT Consulting

Description

Prestation | CDI I Senior | Environnement international – Londres (1j/semaine sur site) Démarrage : Mai / Juin / Juillet 2026 I Durée du projet : 6-12 mois Contexte du poste Alliance Services Plus (AS+) recherche plusieurs Ingénieurs Systèmes Distribués HPC pour le compte de l’un de ses clients, dans le cadre d’un projet stratégique de développement d’une plateforme de calcul distribué. Ce projet vise à concevoir une nouvelle génération d’infrastructure permettant l’exécution de calculs massifs sur des environnements hybrides CPU/GPU. Les travaux portent sur la conception des services backend et des mécanismes d’orchestration nécessaires au fonctionnement d’une plateforme distribuée à haute performance. Missions principales Dans un cadre orienté architecture et performance, les missions incluront notamment : La conception et le développement de services backend pour une plateforme HPC distribuée La mise en place de mécanismes d’orchestration entre nœuds CPU et GPU Le développement de systèmes de gestion de files de tâches distribuées La conception de services de gestion et de cycle de vie des données L’optimisation des performances et de la résilience des systèmes distribués La participation aux choix d’architecture et aux design reviews Environnement technique Langages : Rust (principal) Architectures distribuées : microservices, API gRPC Middleware : Apache Pulsar, RabbitMQ Cloud : AWS Stockage HPC : Lustre (ou équivalent) Réseaux (atout) : RDMA, libfabric GPU (connaissances appréciées) : CUDA, architecture mémoire Profil recherché Expérience significative en développement de systèmes distribués Maîtrise de Rust, ou forte capacité à monter en compétence rapidement Solide compréhension des architectures orientées services et des systèmes scalables Expérience avec des systèmes de messaging (Pulsar, RabbitMQ ou équivalent) Capacité à intervenir sur des problématiques de performance et de résilience Atouts appréciés : Connaissances HPC (réseaux, stockage, GPU) Expérience en environnements haute performance

Responsibilities

The role involves designing and developing backend services for a distributed High-Performance Computing (HPC) platform, focusing on creating orchestration mechanisms between CPU and GPU nodes. Key tasks include developing distributed task queue management systems and designing data lifecycle services while optimizing system performance and resilience.