Pulse · AI 뉴스

Jina-v5 모델, 슬로바키아 법률 데이터 학습 시 어려움 겪어

Jina · 2026-05-28

사용자가 Jina-v5 모델을 슬로바키아 법률 데이터로 파인튜닝했지만, 슬로바키아어 구문 뉘앙스를 학습하는 데 어려움을 겪고 있습니다.

특히 'krádež cigariet' (담배 절도) 관련 사례에서, 법률 조항에 따른 처벌 명칭 'prepadnutie'의 의미를 오해하여, 절도 또는 강도 사건으로 잘못 분류하는 오류가 발생합니다.

다양한 시도 (LLM 기반 쿼리 생성, Qwen/Qwen3.5-397b-a17b를 활용한 관련성 로짓 마이닝, LoRA 파인튜닝)에도 불구하고, 모델은 여전히 논리적 오류를 범하고 있으며, 코드 오류 가능성 및 아키텍처적 결함 가능성을 염두에 두고 문제 해결을 시도 중입니다.

##Jina##파인튜닝##슬로바키아어##법률##LLM
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기