안드로이드 온디바이스 LLM 개발 중 GPU 가속을 위해 LiteRT-LM 포팅 작업을 진행했습니다. LiteRT-LM의 MTP 적용으로 속도가 상당히 빨라져 만족스러운 결과를 얻었습니다. 기존 whisper.cpp의 속도 문제를 해결하고 LLM 성능을 향상시키는 데 기여했습니다.