42dot 의 Compiler Engineer 는 자율주행 스택 최적화 및 온디바이스(on-device) LLM(대규모 언어 모델) 최적화를 중심으로, NPU 기반 AI 모델 최적화 및 관련 도구를 개발할 엔지니어를 모집합니다. 본 직무는 딥러닝 모델을 하드웨어 가속기에 맞게 최적화하고, 효율적인 실행을 보장하는 툴 체인을 설계하여 자율주행 및 LLM과 같은 AI 기술의 발전을 지원합니다.
Responsibilities
AI 모델 최적화
자율주행 스택 및 온디바이스 LLM을 포함한 딥러닝 모델을 NPU 하드웨어에 맞게 최적화
모델 압축(양자화, 프루닝 등), 연산자 퓨전, 메모리 최적화 기법을 활용하여 성능 개선
툴 체인 개발
AI 모델 변환 및 최적화를 위한 툴체인 설계 및 구현
딥러닝 프레임워크(TensorFlow, PyTorch 등)와의 통합 및 효율적인 워크플로우 제공
NPU 대상 코드 생성 및 디버깅 도구 개발
자율주행 및 LLM 스택 최적화
자율주행에 필요한 AI 모듈(예: 객체 인식, 경로 계획 등)을 최적화하여 실시간 실행 성능 확보
LLM 추론 최적화를 통해 메모리 효율성과 속도 향상
멀티모달 AI 스택에서 모델 병렬화 및 분산 실행 기술 적용
성능 분석 및 개선
AI 모델의 런타임 성능 분석 및 병목현상 파악
하드웨어 리소스(NPU, GPU, 메모리 등) 활용률을 극대화할 수 있는 기술 구현
리서치 및 신기술 도입
AI 모델 최적화 및 NPU 관련 최신 기술 동향을 연구
NPU 성능을 극대화할 수 있는 새로운 기법 실험 및 도입
Qualifications
컴퓨터 공학, AI 또는 관련 분야 학사/석사 학위
AI 모델 최적화 및 하드웨어 가속기 경험 (3년 이상)
NPU, GPU, 또는 ASIC을 활용한 AI 최적화 경험
TensorFlow Lite, ONNX, PyTorch와 같은 딥러닝 프레임워크 및 모델 변환 도구 사용 경험
양자화, 프루닝, 지연 평가(Lazy Evaluation)와 같은 모델 압축 및 최적화 기술