Remote
وصف الوظيفة
Rejoignez Tether, une scale‑up innovante spécialisée dans les solutions d’intelligence artificielle de nouvelle génération. En tant qu’Ingénieur Recherche IA au sein de notre équipe Modèles IA, vous serez au cœur de la conception, du déploiement et de l’optimisation de modèles de langage de grande taille (LLM) et multimodaux. Vous travaillerez sur des projets ambitieux visant à repousser les limites du pré‑entraînement sur des infrastructures distribuées, tout en garantissant la qualité et la pertinence des données utilisées.
**Missions principales**
- Concevoir et implémenter des architectures de modèles de pointe (LLM, vision‑langage, audio‑texte) en utilisant les frameworks PyTorch et TensorFlow.
- Piloter le pré‑entraînement de ces modèles sur des clusters GPU/TPU, en optimisant la parallélisation (pipeline, data‑parallel, model‑parallel) et la gestion des ressources.
- Curater, nettoyer et enrichir les jeux de données massifs (texte, image, audio) afin d’assurer la diversité, la représentativité et la conformité éthique.
- Identifier les goulets d’étranglement (bande passante, I/O, mémoire, scalabilité) et proposer des solutions d’optimisation (mixed‑precision, gradient checkpointing, compression).
- Mettre en place des pipelines d’évaluation continue (perplexité, BLEU, ROUGE, métriques multimodales) pour mesurer les gains de performance.
- Collaborer étroitement avec les équipes de recherche fondamentale, d’ingénierie produit et de data‑science pour transformer les prototypes en solutions commercialisables.
- Rédiger des rapports techniques, des publications internes et, le cas échéant, des articles scientifiques pour partager les avancées avec la communauté IA.
**Profil recherché**
- Diplôme d’ingénieur ou master en informatique, IA, mathématiques appliquées ou domaine équivalent.
- Minimum 5 ans d’expérience professionnelle sur des projets de pré‑entraînement de modèles de grande taille, idéalement dans un contexte de recherche appliquée.
- Maîtrise approfondie des architectures LLM (Transformer, GPT, BERT, T5) et des modèles multimodaux (CLIP, Flamingo, Whisper).
- Expertise en optimisation de l’entraînement distribué (Horovod, DeepSpeed, Megatron‑LM) et en utilisation de clusters GPU/TPU.
- Solides compétences en programmation Python, C/C++, ainsi qu’en outils de versionning (Git) et de CI/CD.
- Expérience en data engineering : pipelines ETL, gestion de données massives (Parquet, TFRecord), et techniques de data‑augmentation.
- Capacité à travailler de façon autonome en remote, à gérer les priorités et à communiquer efficacement en anglais et en français.
**Ce que nous offrons**
- Contrat à durée indéterminée (CDI) en télétravail complet, avec la possibilité de se rendre ponctuellement à nos bureaux d’Athènes pour des workshops.
- Environnement de travail stimulant, avec accès à des ressources de calcul de pointe (GPU Nvidia A100, TPU v4).
- Budget dédié à la formation continue (conférences, cours en ligne, certifications) et à la participation à des compétitions IA.
- Rémunération attractive, bonus annuel basé sur les performances et participation au capital de l’entreprise.
- Politique de congés flexibles, assurance santé internationale et programme de bien‑être (coachings, activités sportives).
- Culture d’entreprise axée sur l’innovation, la transparence et la collaboration inter‑disciplinaire.
Si vous êtes passionné(e) par les défis techniques du pré‑entraînement à grande échelle et que vous souhaitez contribuer à façonner l’avenir de l’IA, rejoignez Tether et participez à la création de modèles qui transformeront les industries.
**Postulez dès maintenant** en envoyant votre CV et une lettre de motivation détaillant vos réalisations majeures en pré‑entraînement de modèles IA.