Site Reliability Engineer - AI H/F/N

Au sein de votre équipe #OneTeam

  • Vous rejoindrez l'équipe AI Core, responsable du développement des produits d'IA OVHcloud et de leur maintien en condition opérationnelle.
  • En tant que Site Reliability Engineer, vous interviendrez notamment sur la partie infrastructure pour l'intégration de nouveaux matériels, les évolutions de la plateforme ainsi que le perfectionnement de nos méthodes de déploiement.

Vos principales responsabilités

  • Gérer un infrastructure basée sur Kubernetes et GPU.
  • Faire évoluer l'infrastructure en lien avec l'état de l'art.
  • Opérez la plate-forme sous-jacente 24h / 24 et 7j / 7 dans plusieurs centres de données.
  • Contribuer à la vision OVHcloud AI et à la feuille de route de l'équipe.

Votre futur impact

Dans 6 mois vous aurez accompli :

  • Votre montée en compétence sur l'infrastructure des produits IA d'OVHcloud.
  • Vos premières contributions à l'infrastructure.
  • La prise de rotation de run en journée avec le support de l'équipe.

Et dans 1 an vous :

  • Maîtrisez l'ensemble de la stack technique des produits IA d'OVHcloud.
  • Serez pleinement autonome dans la gestion du run.
  • Contriburez activement aux évolutions de l'infrastructure.
  • Ferez des contributions occasionnelles sur la stack logicielle.

#

Compétences requises :

  • Vous avez une précédent expérience en administration ou ingénierie système.
  • Vous maitrisez les outils comme : Kubernetes / Docker et la philosophie Cloud Native.
  • Vous avez une expérience sur des sujets de CI/CD.
  • Vous connaissez au moins un de ces outils de déploiements: Ansible, Terraform, Puppet, Chef...

C'est un +

  • Intérêt pour les sujets Data et IA.
  • Vous avez des compétences de développement logiciel (Go ou Rust).

Location

BREST, FR, 29200

Job Overview
Job Posted:
3 weeks ago
Job Expires:
Job Type
Full Time

Share This Job: