LLM 번역 툴 MVP 개발
진행 기간: May 2023 ~ Nov 2023
프로젝트 배경
데브시스터즈의 로컬라이제이션 팀은 한정된 인력으로 다양한 언어의 번역을 담당하며 업무 부담이 증가하고 있었습니다. 특히 쿠키런 시리즈와 같은 라이브 게임에서는 빠른 업데이트 주기에 맞춰 대량의 텍스트를 번역해야 하는 상황이었습니다.
프로젝트 목표
LLM을 활용한 번역 도구를 개발하여 초벌 번역의 품질을 향상시키고, 번역 팀의 업무 효율성을 높이는 것이 목표였습니다.
해결 과정
MVP 기능 기획
당시 LLM의 성능과 잠재적 리스크를 고려하여 다음과 같은 전략을 수립했습니다:
- 타겟 선정: 지속적인 업데이트가 필요 없는 패키지 게임을 우선 대상으로 선정
- MVP 스펙 지정: 제한된 개발 인력을 고려한 최소 기능으로 시작
- 기존 프로세스 통합: 번역 업무 프로세스를 분석하여 자연스럽게 통합 가능한 범위 설정
MVP 개발
LLM 번역 워크플로우 설계
여러 task를 연결한 DAG(Directed Acyclic Graph) 형태의 워크플로우를 제안했습니다.
이 시점에서 워크플로우의 세부적인 설계 및 구현에는 크게 기여하지 못했습니다만, 대략적인 과정은 아래와 같습니다.
- 데이터 입력: Lokalise API 및 Google Spreadsheet API를 통한 원문 데이터 수집
- LLM 번역 작업: RAG을 활용해 기존의 번역 작업물들과 최대한 유사한 초벌 번역 생성
- 품질 향상을 위한 사후 교정: 게임 별, 언어 별로 적절하게 문법 및 특수 규칙을 적용
- 결과 전달: Slack 봇을 통한 번역 결과 및 알림 전송
라이브 게임 적용
Cross-team 커뮤니케이션
- 게임 개발 팀과 로컬라이제이션 팀 간의 협업 프로세스 개선
- 번역 일정과 게임 업데이트 일정의 효율적인 조율
리스크 관리
- AI 번역 도구 사용 시 발생할 수 있는 기술적, 사회적 위험 요소 분석
- 번역 팀에게 LLM 기반 도구의 한계점과 주의사항 교육
- 장애 발생 시 신속한 대응을 위한 프로세스 수립
지속적인 개선
- 번역 팀의 피드백을 바탕으로 한 기능 개선
- 게임 별, 언어 별 특성에 맞는 프롬프트, 사후 교정 최적화
- 사용법 가이드 및 베스트 프랙티스 문서화
주요 성과
- 번역 속도 향상: 초벌 번역 품질 개선으로 전체 번역 작업 시간 단축
- 프로세스 개선: 기존 로컬라이제이션 프로세스와의 원활한 통합
- 리스크 최소화: LLM을 사내 첫 도입하는 과정에서도 로컬라이제이션 과정에 영향이 미치지 않도록 리스크 관리
기술 스택
- LangChain: LLM API 통합 및 task 로직 구현
- FAISS: 번역 데이터 벡터 검색
- Databricks: 워크플로우 DAG 관리 / 실행
회고
- 기술적 성능뿐만 아니라 조직의 수용성과 기존 프로세스와의 호환성이 중요
- Cross-team 협업에서 명확한 커뮤니케이션과 위험 요소 사전 공유의 중요성