En tant que AI Data Platform Engineer, tu seras au cœur de nos projets d’intelligence artificielle, responsable de la gestion, de l’automatisation et de l’optimisation des flux de données et des plateformes critiques, notamment pour les annotations et la gestion des datasets. Tu travailleras en collaboration étroite avec nos équipes IA et infrastructure pour garantir des outils performants, évolutifs et conformes aux exigences réglementaires.
1/ Gestion de la Plateforme d’Annotation
Assurer la gestion complète de la plateforme d’annotation pour garantir ses performances, sa scalabilité et son adaptabilité aux besoins des projets IA.
Configurer les workflows, permissions et utilisateurs tout en développant des solutions sur mesure (plugins, scripts).
Surveiller et optimiser les performances, résoudre les problèmes techniques et intégrer les retours des utilisateurs.
2/ Anonymisation et Conformité des Données
Garantir l’anonymisation systématique des données personnelles (images, vidéos) conformément aux réglementations en vigueur (ex. : GDPR).
Développer et automatiser des processus fiables pour détecter et anonymiser les données sensibles.
3/ Gestion et Préparation des Données
Organiser, maintenir et automatiser la gestion des bases de données d’images, vidéos et annotations pour garantir leur qualité et leur intégration dans les pipelines IA.
Assurer le versionnage, l’étiquetage et la préparation des datasets pour répondre aux besoins des projets de machine learning.
4/ Optimisation des Flux d’Annotation
Concevoir et superviser les workflows d’annotation pour garantir la qualité et le respect des délais.
Collaborer avec les ingénieurs IA pour aligner les annotations sur les besoins des modèles et former les annotateurs sur les bonnes pratiques.
5/ Développement et Automatisation d’Outils
Développer des outils d’intégration et d’automatisation pour les pipelines IA, en utilisant des APIs et SDK Python.
Créer des interfaces et automatisations pour simplifier l’utilisation de la plateforme par les équipes.
• Plateforme et outils d’annotation : Supervisely, SageMaker Ground Truth
• Gestion des données : Python, SQL, APIs REST, Terraform/CDK
• Cloud : AWS (S3, RDS, Lambda, Batch, Step Functions)
• Automatisation : Airflow, Jenkins, Ansible
• Monitoring : Datadog, Grafana
• Langues : Python, Bash, Typescript
• Rémunération attractive : 60-85k€ selon expérience
• Avantages : tickets restaurant, mutuelle premium, BSPCE
• Flexibilité : télétravail partiel et horaires adaptables
• Impact direct : travailler sur des solutions concrètes et respectueuses de l’environnement
Expérience : 3+ ans dans un poste similaire, avec une expertise démontrée dans la gestion de plateformes IA et la préparation de datasets.
Compétences techniques :
• Maîtrise de Terraform/CDK pour l’automatisation d’infrastructure.
• Bonne connaissance des workflows IA, incluant la gestion des plateformes d’annotation.
• Compréhension des contraintes réglementaires liées à la gestion des données (GDPR).
Soft skills :
• Capacité à collaborer avec des équipes pluridisciplinaires.
• Rigueur dans l’organisation et la gestion des projets techniques.
Entretien téléphonique : premier échange pour discuter de ton parcours et de tes motivations.
Entretien avec Alexandre (CTO)
Entretiens techniques avec Jérôme (Lead Cloud Engineer).
Retour et proposition finale : débrief et décision.