We are looking for the best 42dot의 Audio Generation팀은 차량 안에서 사용자가 보다 편하게 차량과 소통할 수 있는 음성기술을 개발합니다. 42dot의 음성합성 기술은 주어진 텍스트를 보다 자연스럽고 명료한 소리로 전달하여, 차량으로부터의 다양한 피드백을 사용자가 화면을 보지 않고도 이해하고 소통할 수 있도록 돕습니다.
책임 (Responsibilities)
음성합성용 최적화 발성목록 설계 및 음성 데이터베이스 구축
SSML(Speech Synthesis Markup Language) 개발
운율모델 Encoder-Decoder 개발 및 최적화
Neural Vocoder 개발 및 최적화
자격요건 (Qualifications)
학사 이상의 학위 취득자
음성 신호처리에 대한 기본 개념/지식을 보유하신 분
음성합성 관련 분야에서 최신 기계학습/인공지능에 대한 연구경험을 보유하신 분
음성합성용 Acoustic Model(운율모델), Neural Vocoder를 연구/개발 경험을 보유하신 분
독창적인 기술 제시 및 문제 해결을 위한 프로그래밍 능력을 보유하신 분 (C/C++//Python/shell 등)
오픈소스 기반 딥 러닝 프레임워크 활용 능력을 보유하신 분 (PyTorch/TensorFlow/Keras/Caffe 등)
우대사항 (Preferred Qualifications)
vcs(git)에 대한 이해와 사용해본 경험이 있으신 분
단위 테스트, 정적 분석, 테스트 자동화 및 CI/CD에 대한 기본 개념을 알고 계신분
음성합성 기술을 개발하여 실제 상용화/서비스를 한 경험이 있으신 분
ESPNet, Tacotron2, FastSpeech, WaveGlow, Melgan 등의 E2E 음성합성 오픈소스의 활용 및 Contribution 경험이 있으신 분