언어 처리 분야에서 언어 자원 활용이 늘면서, 코퍼스 외에 어휘 사전(WordNet)과 형식 문법(TAG) 등 다양한 자원이 활용되고 있어요.
어휘 사전과 문법은 수작업으로 구축되는데, 코퍼스 구축은 자동화된 방식이 일반적이며, 수작업 자원이 더 풍부한 정보를 담고 있어 정교한 처리가 가능해요.
언어 기술 전문가들은 수작업 자원을 다루거나, 어휘 사전과 문법을 산업적으로 자동화하는 두 가지 방향으로 발전할 가능성이 있으며, 이 과정에서 언어학자와 컴퓨터 과학자의 역할이 달라질 수 있어요.
본 기사에서는 실제 언어 자원 사례를 분석하고, 수작업과 산업적 생성 중 어떤 방식이 더 효과적인지, 혹은 현실적인지 논의해 볼 예정이에요.