en

Please fill in your name

Mobile phone format error

전화번호를 입력해 주세요

회사 이름을 입력해 주세요

회사 이메일을 입력해 주세요

데이터 요구사항을 입력해 주세요

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

데이터 요구사항은 5자 이상이며 숫자만으로 구성될 수 없습니다

Interspeech2025-MLC-SLM 다국어 대화 음성 데이터셋

워크숍 오디오 데이터셋
MLC-SLM 데이터셋
ASR 음성 인식 데이터

Interspeech2025-MLC-SLM 다국어 대화 음성 경진대회 데이터셋입니다. 이 데이터셋은 데이터당이 2025년에 개최한 MLC-SLM 다국어 대화 음성 경진대회용으로 제작되었으며, 자사 보유 15종 대화 음성 데이터셋에서 선별된 자료로 구성됩니다. 높은 정확도와 활용성을 갖추었으며, 다국어 음성 인식 및 장문 맥락 이해 기술의 한계를 극복하기 위해 설계되었습니다. 루마니아인 화자 중첩, 즉흥 발화 등 복잡한 상호작용 상황을 사실적으로 반영하며, 음성 인식 연구 및 응용에 풍부한 리소스를 제공합니다. GDPR, CCPA, PIPL 등 개인정보 보호 규정을 철저히 준수하여 데이터 수집·저장·활용 과정 전반에서 사용자 프라이버시와 합법적 권리를 보장합니다.

유료 데이터셋
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
사양사양
포맷
16kHz, 16bit, 비압축 wav, 모노
녹음 환경
비교적 조용한 실내, 울림 없음
녹음 내용
주제 목록 제시 후, 루마니아인 화자가 익숙한 주제를 선택해 자연스러운 대화 녹음
라벨링 특징
텍스트, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자
장비
안드로이드 폰, 아이폰
언어
미국 영어, 영국 영어, 필리핀 영어, 호주 영어, 인도 영어, 프랑스어, 독일어, 이탈리아어, 일본어, 한국어, 포르투갈어, 러시아어, 스페인어, 태국어, 베트남어
샘플 샘플
  • Audio

    one direction is the first thing like in the mind

  • Audio

    Parce que j'ai plus l'ancien, j'en ai que celui-là dorénavant.

  • Audio

    D'accord très bien l'autre, je vais l'effacer alors.

  • Audio

    조금 이제 날씨도 더워지는데 덜 답답하구

  • Audio

    이천치십 년이랑 이천이십일 년 진짜 학교 못 간게

추천 데이터셋추천 데이터셋
특별한 요청 사항을 알려주세요

제출함으로써,개인정보 보호 정책에 동의합니다

00b016b1-7730-4fe1-8781-cadd6806bf58

b9ba4210-eba9-406c-a1c2-2950ea2649a6