Contexte du poste
Alliance Services Plus (AS+) recherche un(e) GPU Acceleration Engineer – Calculation Engine pour le compte de l’un de ses clients.
Dans un contexte d’évolution technologique et de forts enjeux de performance, le client souhaite faire évoluer son moteur de calcul afin de traiter des volumes de données très importants et des calculs complexes aujourd’hui limités par des architectures CPU traditionnelles.
L’ingénieur(e) interviendra sur des problématiques de calcul haute performance et d’accélération GPU, avec pour objectif le portage et l’optimisation d’algorithmes critiques vers des architectures CUDA, permettant des gains de performance significatifs et l’amélioration de la scalabilité des plateformes.
Missions principales
Dans un cadre orienté performance et calcul scientifique, les missions incluront notamment :
- Le portage d’algorithmes de calcul existants en Rust et C++ vers des architectures GPU (CUDA)
- L’identification et l’extraction des chemins de calcul critiques à accélérer
- L’optimisation d’opérations sur matrices sparse pour les architectures GPU
- La conception et l’optimisation de la gestion mémoire GPU pour des jeux de données massifs
- L’optimisation des transferts mémoire CPU ↔ GPU
- Le benchmarking, le profiling et la validation des gains de performance
- L’intégration des développements GPU au sein du moteur de calcul existant
- La documentation technique et le partage des bonnes pratiques GPU avec les équipes d’ingénierie
Environnement technique
Les projets s’appuient principalement sur les technologies suivantes :
- GPU & Accélération : NVIDIA CUDA, cuBLAS, cuSPARSE
- Langages : Rust, C++, CUDA (Java en environnement plateforme)
- Calcul scientifique : opérations sur matrices sparse (CSR, COO, etc.)
- Optimisation & Profiling : nvprof, NVIDIA Nsight, outils de performance
- Architectures : GPU NVIDIA, gestion avancée de la hiérarchie mémoire
Profil recherché
- Expérience significative en programmation GPU avec CUDA (3 ans minimum)
- Solide expertise en optimisation de kernels GPU et compréhension fine de l’architecture NVIDIA
- Rust requis : maîtrise en environnement de production appréciée, ou forte capacité et motivation à monter en compétence sur des usages avancés (unsafe Rust, FFI).
- Bon niveau en C++ moderne et intégration C++ ↔ CUDA
- Anglais requis
- Rigueur, autonomie, forte orientation performance et capacité à travailler sur des problématiques complexes à grande échelle
Atouts appréciés :
- Expérience de portage CPU → GPU
- Environnements HPC ou clusters GPU
- Optimisation mémoire pour datasets de très grande taille
- Contexte calcul scientifique, simulation ou moteurs de calcul intensif