ko

Please fill in your name

Mobile phone format error

전화번호를 입력해 주세요

회사 이름을 입력해 주세요

회사 이메일을 입력해 주세요

데이터 요구사항을 입력해 주세요

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

데이터 요구사항은 5자 이상이며 숫자만으로 구성될 수 없습니다

제2회 MLC-SLM 챌린지, 공식 베이스라인 공개… 총상금 2만 달러 규모

출처:넥스데이터 날짜: 06/08/2026

·제2회 MLC-SLM 챌린지, 공식 베이스라인 시스템 공개와 함께 본격 참가자 모집 돌입

·대회 총상금 2만 달러 확정, 글로벌 연구 역량 결집 예고

·음성 데이터셋 14개 언어·약 2100시간 규모로 대폭 확장, 실제 대화 환경 구현

·화자 분리·인식 및 대화 음성 이해 등 2개 트랙 운영, 음성 LLM 기술 고도화 지원

·참가 등록 세부 일정 공식 웹사이트에서 확인 가능


2회 다국어 대화형 음성 언어 모델 챌린지(MLC-SLM Challenge 2026)가 참가 등록을 진행 중인 가운데, 조직위원회가 공식 베이스라인 시스템을 공개했다. 앞서 학습용 및 개발용 데이터셋이 공개된 데 이어 베이스라인까지 제공되면서 참가 팀들은 본격적인 모델 개발과 성능 검증에 착수할 수 있게 됐다.

 

실환경 기반 다국어 음성 AI 연구 촉진


최근 대규모 언어 모델(LLM)과 음성 AI 기술이 빠르게 발전하면서 음성 인식과 음성 이해를 하나의 모델로 통합하려는 연구가 활발히 진행되고 있다. 그러나 실제 다국어 대화 환경에서는 언어별 특성, 지역별 억양과 발음 차이, 화자 전환, 대화 맥락 이해 등 여전히 해결해야 할 과제가 많다.

MLC-SLM Challenge 2026은 이러한 과제를 해결하기 위해 실환경 기반의 다국어 대화 음성 데이터를 활용하며, 화자 분리·음성 인식·음성 이해 분야의 연구를 지원한다. 또한 연구자와 개발자들이 성과를 객관적으로 비교·평가할 수 있는 공개 벤치마크 플랫폼 역할을 수행한다.

 

14개 언어·2,100시간 규모 데이터셋 제공


올해 챌린지 지난해보다 데이터 규모와 언어 범위를 대폭 확대했다. 학습 데이터셋은 2,100시간 규모로 구성됐으며, 영어·프랑스어·스페인어·포르투갈어·독일어·이탈리아어·일본어·한국어·러시아어·태국어·베트남어를 비롯해 올해 새롭게 추가된 타갈로그어·우르두어·튀르키예어 등 총 14개 언어를 지원한다.

 

특히 영어·프랑스어·스페인어·포르투갈어는 국가 및 지역별 발음 특성을 함께 반영해 실제 서비스 환경에 가까운 다국어 대화 데이터를 제공한다. 이를 통해 참가자들은 언어 간 차이뿐 아니라 다양한 억양과 뉘앙스 특성이 포함된 환경에서 모델 성능을 검증할 있다.

 

Task 1·Task 2 공식 베이스라인 공개

 

조직위원회는 참가자들의 빠른 실험과 모델 개발을 지원하기 위해 Task의 공식 베이스라인 시스템을 공개했다.

 

Task 1: 다국어 대화형 화자 분리 및 음성 인식

 

Task 1 베이스라인은 Microsoft의 오픈소스 모델인 VibeVoice-ASR을 기반으로 구축됐으며, 대회 학습 데이터셋을 활용해 파인튜닝을 수행했다. 평가에는 Meeteval 툴킷을 사용하며, 언어 특성에 따라 tcpWER 또는 tcpCER 기반의 tcpMER 지표를 산출한다. 해당 베이스라인은 다국어 대화 환경에서 화자 정보와 음성 인식을 동시에 처리하는 대표적인 참조 워크플로우를 제공한다.

 

Task 2: 다국어 대화 음성 이해

 

Task 2 베이스라인은 Gemini 2.5 Pro를 활용해 음향 이해 의미 이해 영역의 객관식 문제를 생성한 , ms-swift 프레임워크 기반으로 Qwen2.5-Omni-7B 모델을 파인튜닝했다. 조직위원회는 Dev 데이터셋의 객관식 문제와 정답을 공개하며, Eval 데이터셋은 동일한 형식으로 구성한 뒤 전문가 검수를 거쳐 최종 리더보드 산정에 활용할 예정이다.

 

총상금 2만 달러 규모… 최종 1~3위 팀 시상


올해 대회는 Huawei Technologies의 후원으로 운영되며, 총상금 2만 달러 규모로 진행된다.

최종 순위 기준 시상 내역은 다음과 같다.

1위: 5,000달러

2위: 3,000달러

3위: 2,000달러

 

참가 팀들은 글로벌 연구자 개발자들과 경쟁하며 모델 성능과 기술 역량을 검증할 있는 기회를 얻게 된다.

 

학계·산업계의 관심 집중

 

MLC-SLM Challenge 2026은 글로벌 기업과 연구기관의 관심 속에 다양한 국가와 분야의 연구자 및 개발자들이 참여하고 있다. 이번 대회는 음성 인식·화자 분리·음성 이해·멀티모달 LLM·다국어 데이터 구축 및 평가 방법론 등 다양한 연구 주제를 다루며, 차세대 대화형 음성 AI 기술 발전을 촉진할 것으로 기대된다.

 

참가 안내

연구자, 엔지니어, 대학 연구실 및 산업계 팀의 많은 관심과 참여를 바란다.

공식 웹사이트 :https://www.nexdata.ai/competition/mlc-slm

참가 등록:  https://forms.gle/jfAZ95abGy4ZiNHo7

문의: [email protected]

Slack 채널: https://join.slack.com/t/mlc-slm-challenge/shared_invite/zt-314nfsmhz-QjOJjhjK3OHYUtJyBRtPxA

28757495-b562-4aba-8519-851b98f1dd8f