We are looking for the best LLM Engineer(Reinforcement Learning)는 LLM학습 파이프라인을 설계하여 실서비스에서 활용 가능한 생성형 언어모델을 학습합니다. 지속적인 품질 향상을 위하여 끊임없이 새로운 방법론을 시도하여, 실사용자에게 꼭 필요한 서비스를 출시하고, LLM 스스로 품질을 개선할 수 있도록 가다듬는 일에 기여합니다.
책임 (Responsibilities)
LLM학습 과정의 효율 향상: PLM 또는 Fine-tuned LLM의 Direct Alignment Algorithm / PPO, GRPO, DPO 등을 이용한 학습 과정의 전반적인 효율 향상
생성 결과의 전반적인 정확성과 안정성 향상: 생성 결과의 품질 향상을 위하여 Reward Hacking을 방지하고, Self-Refine이 가능한 학습 구조 설계
외부 지식 및 API와 연동 가능한 기초 모델 개발: 지시의 종류에 따라 스스로 필요한 외부 연동 Tool을 선택하는 LLM 학습
자격요건 (Qualifications)
Deep Learning 또는 NLP 관련 경력 5년 이상
숙련된 프로그래밍 (Python & pytorch) 능력
PyTorch를 활용한 모델 설계, 학습, 평가 및 최적화 경험
GPU를 활용한 LLM 학습 및 Trouble shooting 능력
분산 학습 프레임워크(Slurm, DDP, Horovod 등) 사용 경험
동료와의 원활한 협업 능력
우대사항 (Preferred Qualifications)
Deep Learning/NLP 관련 논문 제출 또는 석박사 학위 소지자
주요 학술 대회(ACL, EMNLP, NeurIPS 등) 논문 발표 경험
Docker 및 Kubernetes에 대한 경험: GPU 클러스터를 활용한 학습 파이프라인 설계 및 관리 경험
GPU를 활용한 학습 및 서비스 개발 경험: GPU 기반의 Training 또는 Inference 시스템 구축 경험
LLM의 Post-training 관련 경험: Supervised Fine-Tuning 및 Parameter Efficient Fine-Tuning 활용 경험