Job Requisition ID #

25WD86439

25WD86439, Senior MLOps Engineer – AI/ML Platform 

French translation will follow!/La traduction française suivra !

About Autodesk

Autodesk is a global leader in 3D design, engineering, manufacturing, and entertainment software. Our customers use Autodesk software to design and make the physical world that we live in—from complex structures like tall skyscrapers, to strong bridges, to modern cars and even eye-popping movies. The AI/ML Platform helps enable and integrate smart solutions into our software products that improves the design and make process.

Position Overview

Autodesk, a global leader in 3D design, engineering, manufacturing, and entertainment software, is seeking a skilled MLOps Engineer to join our AI/ML Platform team. This role is pivotal in ensuring the smooth operationalization of machine learning models and the overall efficiency of our next-generation AI/ML platform used in the development of machine learning and generative AI solutions powering Autodesk’s suite of products and services. You will collaborate with research and product engineering from various domains including design, construction, manufacturing, and media & entertainment to to support platform operations. This role offers a unique opportunity to contribute to the operational success of a strategic AI/ML platform and collaborate with diverse teams to drive innovation in 3D design, engineering, and entertainment software

Responsibilities

  • Operational Efficiency: Drive the operational excellence of our AI/ML Platform by implementing and optimizing MLOps practices

  • Deployment Automation: Design and implement automated deployment pipelines for machine learning models, ensuring seamless transitions from development to production

  • Scalable Infrastructure: Collaborate with cross-functional teams to design, implement, and maintain scalable infrastructure for model training, inference, and data processing

  • Monitoring and Logging: Develop and maintain robust monitoring and logging systems to track model performance, system health, and overall platform efficiency

  • Collaboration with Data Engineers: Work closely with data engineers to ensure efficient data pipelines for model training and validation

  • Version Control and Model Governance: Implement version control systems for machine learning models and contribute to model governance practices

  • Governance and Trust: Contribute to the implementation of robust model governance practices, version control systems, and adherence to compliance standards. Uphold data privacy and ethical considerations, fostering trust in our AI/ML solutions

  • Security and Compliance: Enforce security best practices and compliance standards in all aspects of MLOps, ensuring data privacy and platform security

  • Continuous Improvement: Identify opportunities for process automation, optimization, and implement strategies to enhance the overall MLOps lifecycle

  • Troubleshooting and Incident Response: Play a key role in identifying and resolving operational issues, contributing to incident response and system recovery

Minimum Qualifications

  • Educational Background: BS or MS in Computer Science, or related field

  • MLOps Experience: 4+ years of hands-on experience in DevOps and MLOps, with a focus on deploying and managing machine learning models in production environments

  • Infrastructure as Code (IaC): Proficiency in implementing Infrastructure as Code practices using tools such as Terraform or Ansible

  • Containerization: Strong expertise in containerization technologies (Docker, Kubernetes) for orchestrating and scaling machine learning workloads

  • CI/CD: Demonstrated experience in setting up and managing Continuous Integration and Continuous Deployment (CI/CD) pipelines for machine learning projects

  • Scripting and Automation: Strong scripting skills in Python, Bash, or similar languages for automating operational processes

  • Monitoring Tools: Familiarity with monitoring and logging tools (e.g., Prometheus, Grafana, ELK Stack) for tracking system and model performance

  • Security Awareness: Understanding of security best practices in MLOps, including data encryption, access controls, and compliance standards

  • Collaboration Skills: Excellent collaboration and communication skills, working effectively with cross-functional teams including data engineers, software developers, and researchers

  • Problem-solving Skills: Proven ability to troubleshoot and resolve complex operational issues in a timely manner

  • Analytical advisor role that requires understanding of the theories and concepts of a discipline and the ability to apply best practices

  • A common career stabilization point (AKA the “full-contributor” level) for Professional roles

  • Require knowledge and experience such that the incumbent can understand the full range of relevant principles, practices, and practical applications within their discipline

  • Solve complex problems of diverse scope by taking a new perspective on existing solutions and applying knowledge of best practices in practical situations.

  • Use data analysis, judgment, and interpretation to select the right course of action

  • Apply creativity in recommending variations in approach

  • “Connect the dots” of assignments to the bigger picture

  • May lead projects or key elements within a broader project

  • May also have accountability for leading and improving on-going processes

  • Build effective relationships with more senior practitioners and peers, and build a network of external peers

  • Work independently, with close guidance given at critical points

  • May begin to act as a mentor or resource for colleagues with less experience

Preferred Qualifications

  • Cloud Experience: Experience with cloud platforms, especially AWS or Azure, for deploying and managing machine learning infrastructure

  • Database Knowledge: Familiarity with databases and data storage solutions commonly used in MLOps, such as SQL, NoSQL, or data lakes

  • Machine Learning Frameworks: Exposure to popular machine learning frameworks (TensorFlow, PyTorch) and their integration into MLOps processes

  • Collaboration Tools: Previous experience with collaboration tools like Git for version control and Jira for project management

  • Agile Methodology: Familiarity with Agile development methodologies and working in an iterative, collaborative environment

______________________________________________________________________________

25WD86439, Ingénieur principal en opérations MLOps – Plateforme IA/ML

À propos d'Autodesk

Autodesk est un leader mondial des logiciels de conception, d'ingénierie, de fabrication et de divertissement en 3D. Nos clients utilisent les logiciels Autodesk pour concevoir et créer le monde physique dans lequel nous vivons, qu'il s'agisse de structures complexes telles que de grands gratte-ciel, de ponts solides, de voitures modernes ou même de films époustouflants. La plateforme IA/ML permet d'intégrer des solutions intelligentes dans nos logiciels afin d'améliorer le processus de conception et de fabrication.

Présentation du poste

Autodesk, leader mondial des logiciels de conception, d'ingénierie, de fabrication et de divertissement en 3D, recherche un ingénieur MLOps qualifié pour rejoindre son équipe de plateforme IA/AA. Ce poste est essentiel pour assurer la mise en œuvre harmonieuse des modèles d'apprentissage automatique et l'efficacité globale de notre plateforme IA/AA de nouvelle génération utilisée dans le développement de solutions d'apprentissage automatique et d'IA générative qui alimentent la suite de produits et services d'Autodesk. Vous collaborerez avec les équipes de recherche et d'ingénierie produit de divers domaines, notamment la conception, la construction, la fabrication et les médias et divertissements, pour soutenir les opérations de la plateforme. Ce poste offre une occasion unique de contribuer au succès opérationnel d'une plateforme stratégique d'IA/ML et de collaborer avec diverses équipes pour stimuler l'innovation dans les logiciels de conception 3D, d'ingénierie et de divertissement.

Responsabilités

  • Efficacité opérationnelle: Favoriser l'excellence opérationnelle de notre plateforme d'IA/ML en mettant en œuvre et en optimisant les pratiques MLOps

  • Automatisation du déploiement: concevoir et mettre en œuvre des pipelines de déploiement automatisés pour les modèles d'apprentissage automatique, en assurant des transitions fluides du développement à la production

  • Infrastructure évolutive: collaborer avec des équipes interfonctionnelles pour concevoir, mettre en œuvre et maintenir une infrastructure évolutive pour l'entraînement des modèles, l'inférence et le traitement des données

  • Surveillance et journalisation: développer et maintenir des systèmes de surveillance et de journalisation robustes pour suivre les performances des modèles, la santé du système et l'efficacité globale de la plateforme

  • Collaboration avec les ingénieurs de données: travailler en étroite collaboration avec les ingénieurs de données pour garantir des pipelines de données efficaces pour l'entraînement et la validation des modèles

  • Contrôle de version et gouvernance des modèles: mettre en œuvre des systèmes de contrôle de version pour les modèles d'apprentissage automatique et contribuer aux pratiques de gouvernance des modèles

  • Gouvernance et confiance: contribuer à la mise en œuvre de pratiques robustes de gouvernance des modèles, de systèmes de contrôle de version et de respect des normes de conformité

  • Respecter la confidentialité des données et les considérations éthiques, en favorisant la confiance dans nos solutions d'IA/AA

  • Sécurité et conformité: appliquer les meilleures pratiques en matière de sécurité et les normes de conformité dans tous les aspects des MLOps, en garantissant la confidentialité des données et la sécurité de la plateforme

  • Amélioration continue: identifier les possibilités d'automatisation et d'optimisation des processus, et mettre en œuvre des stratégies pour améliorer le cycle de vie global des MLOps

  • Dépannage et réponse aux incidents: jouer un rôle clé dans l'identification et la résolution des problèmes opérationnels, en contribuant à la réponse aux incidents et à la récupération du système

Qualifications minimales

  • Formation : licence ou master en informatique, ou dans un domaine connexe

  • Expérience MLOps: plus de 4 ans d'expérience pratique en DevOps et MLOps, avec un accent sur le déploiement et la gestion de modèles d'apprentissage automatique dans des environnements de production

  • Infrastructure as Code (IaC): maîtrise de la mise en œuvre des pratiques Infrastructure as Code à l'aide d'outils tels que Terraform ou Ansible

  • Conteneurisation: forte expertise des technologies de conteneurisation (Docker, Kubernetes) pour l'orchestration et la mise à l'échelle des charges de travail d'apprentissage automatique

  • CI/CD: Expérience avérée dans la mise en place et la gestion de pipelines d'intégration continue et de déploiement continu (CI/CD) pour des projets d'apprentissage automatique

  • Scripting et automatisation: Solides compétences en scripting en Python, Bash ou dans des langages similaires pour l'automatisation des processus opérationnels

  • Outils de surveillance: Familiarité avec les outils de surveillance et de journalisation (par exemple, Prometheus, Grafana, ELK Stack) pour le suivi des performances des systèmes et des modèles

  • Sensibilisation à la sécurité: Compréhension des meilleures pratiques de sécurité en matière de MLOps, y compris le cryptage des données, les contrôles d'accès et les normes de conformité

  • Compétences en matière de collaboration: Excellentes compétences en matière de collaboration et de communication, capacité à travailler efficacement avec des équipes interfonctionnelles comprenant des ingénieurs de données, des développeurs de logiciels et des chercheurs

  • Compétences en matière de résolution de problèmes: Capacité avérée à dépanner et à résoudre des problèmes opérationnels complexes en temps utile

  • Rôle de conseiller analytique qui nécessite la compréhension des théories et des concepts d'une discipline et la capacité à appliquer les meilleures pratiques

  • Un point commun de stabilisation de carrière (également appelé niveau de « contributeur à part entière ») pour les rôles professionnels

  • Exiger des connaissances et une expérience telles que le titulaire puisse comprendre l'ensemble des principes, pratiques et applications pratiques pertinents dans sa discipline

  • Résoudre des problèmes complexes de portée diverse en adoptant une nouvelle perspective sur les solutions existantes et en appliquant la connaissance des meilleures pratiques dans des situations pratiques

  • Utiliser l'analyse, le jugement et l'interprétation des données pour choisir la bonne ligne de conduite

  • Faire preuve de créativité en recommandant des variations d'approche

  • « Relier les points » des missions à une vision plus globale

  • Peut diriger des projets ou des éléments clés dans le cadre d'un projet plus vaste

  • Peut également être responsable de la direction et de l'amélioration des processus en cours

  • Établir des relations efficaces avec des praticiens et des pairs plus expérimentés, et constituer un réseau de pairs externes

  • Travailler de manière autonome, avec des conseils précis donnés aux moments critiques

  • Peut commencer à jouer le rôle de mentor ou de ressource pour des collègues moins expérimentés

Qualifications préférées

  • Expérience du cloud : expérience des plateformes cloud, en particulier AWS ou Azure, pour le déploiement et la gestion d'une infrastructure d'apprentissage automatique

  • Connaissance des bases de données: familiarité avec les bases de données et les solutions de stockage de données couramment utilisées dans les MLOps, telles que SQL, NoSQL ou les lacs de données

  • Cadres d'apprentissage automatique: exposition aux cadres d'apprentissage automatique populaires (TensorFlow, PyTorch) et à leur intégration dans les processus MLOps

  • Outils de collaboration: expérience préalable des outils de collaboration tels que Git pour le contrôle de version et Jira pour la gestion de projet

  • Méthodologie Agile: Familiarité avec les méthodologies de développement Agile et le travail dans un environnement itératif et collaboratif

Learn More

About Autodesk
Welcome to Autodesk! Amazing things are created every day with our software – from the greenest buildings and cleanest cars to the smartest factories and biggest hit movies. We help innovators turn their ideas into reality, transforming not only how things are made, but what can be made.

We take great pride in our culture here at Autodesk – our Culture Code is at the core of everything we do. Our values and ways of working help our people thrive and realize their potential, which leads to even better outcomes for our customers.

When you’re an Autodesker, you can be your whole, authentic self and do meaningful work that helps build a better future for all. Ready to shape the world and your future? Join us!

Salary transparency

Salary is one part of Autodesk’s competitive compensation package. For Canada-BC based roles, we expect a starting base salary between $106,500 and $156,200. Offers are based on the candidate’s experience and geographic location, and may exceed this range. In addition to base salaries, we also have a significant emphasis on annual cash bonuses, commissions for sales roles, stock grants, and a comprehensive benefits package.

Diversity & Belonging
We take pride in cultivating a culture of belonging and an equitable workplace where everyone can thrive. Learn more here: https://www.autodesk.com/company/diversity-and-belonging

Are you an existing contractor or consultant with Autodesk?

Please search for open jobs and apply internally (not on this external site).

Salary

$106,500 - $156,200

Yearly based

Location

AMER - Canada - Ontario - Toronto - University Ave

Job Overview
Job Posted:
1 day ago
Job Expires:
Job Type
Full Time

Share This Job: