[{"@type":"PropertyValue","name":"포맷","value":"16kHz, 16bit, 비압축 wav, 모노"},{"@type":"PropertyValue","name":"녹음 환경","value":"비교적 조용한 실내, 울림 없음"},{"@type":"PropertyValue","name":"녹음 내용","value":"주제 목록 제시 후, 루마니아인 화자가 익숙한 주제를 선택해 자연스러운 대화 녹음"},{"@type":"PropertyValue","name":"라벨링 특징","value":"텍스트, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자"},{"@type":"PropertyValue","name":"장비","value":"안드로이드 폰, 아이폰"},{"@type":"PropertyValue","name":"언어","value":"미국 영어, 영국 영어, 필리핀 영어, 호주 영어, 인도 영어, 프랑스어, 독일어, 이탈리아어, 일본어, 한국어, 포르투갈어, 러시아어, 스페인어, 태국어, 베트남어"}]
{"id":1892,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"Interspeech2025-MLC-SLM 다국어 대화 음성 데이터셋","datazy":[{"title":"포맷","desc":"포맷","content":"16kHz, 16bit, 비압축 wav, 모노"},{"title":"녹음 환경","desc":"녹음 환경","content":"비교적 조용한 실내, 울림 없음"},{"title":"녹음 내용","desc":"녹음 내용","content":"주제 목록 제시 후, 루마니아인 화자가 익숙한 주제를 선택해 자연스러운 대화 녹음"},{"title":"라벨링 특징","desc":"라벨링 특징","content":"텍스트, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자"},{"title":"장비","desc":"장비","content":"안드로이드 폰, 아이폰"},{"title":"언어","desc":"언어","content":"미국 영어, 영국 영어, 필리핀 영어, 호주 영어, 인도 영어, 프랑스어, 독일어, 이탈리아어, 일본어, 한국어, 포르투갈어, 러시아어, 스페인어, 태국어, 베트남어"}],"datatag":"Challenge ,interspeech,mlc-slm,Conversational ","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"0022_001-1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0022_001-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=hzFnDSJljVWVQ0tPwyC0lHgLpLY%3D","intro":"one direction is the first thing like in the mind","size":89964,"progress":100,"type":"mp3"},{"name":"0019_001_phone-1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0019_001_phone-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=brQmectqi5gBtR5JBtozW2AZlcI%3D","intro":"Parce que j'ai plus l'ancien, j'en ai que celui-là dorénavant.","size":133452,"progress":100,"type":"mp3"},{"name":"0019_001_phone-2.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0019_001_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=PYIHEbEPwyvvnnaw3QcxA6RDBUI%3D","intro":"D'accord très bien l'autre, je vais l'effacer alors.","size":90220,"progress":100,"type":"mp3"},{"name":"0001_001-1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0001_001-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=N9kseFImwstZ6%2BVdh6JcvzEmqz8%3D","intro":"조금 이제 날씨도 더워지는데 덜 답답하구","size":136620,"progress":100,"type":"mp3"},{"name":"0001_001-6.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0001_001-6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=9WxMMMfd0avEp9uywfxFpTf7RZ4%3D","intro":"이천치십 년이랑 이천이십일 년 진짜 학교 못 간게","size":169036,"progress":100,"type":"mp3"}],"officialSummary":"Interspeech2025-MLC-SLM 다국어 대화 음성 경진대회 데이터셋입니다. 이 데이터셋은 데이터당이 2025년에 개최한 MLC-SLM 다국어 대화 음성 경진대회용으로 제작되었으며, 자사 보유 15종 대화 음성 데이터셋에서 선별된 자료로 구성됩니다. 높은 정확도와 활용성을 갖추었으며, 다국어 음성 인식 및 장문 맥락 이해 기술의 한계를 극복하기 위해 설계되었습니다. 루마니아인 화자 중첩, 즉흥 발화 등 복잡한 상호작용 상황을 사실적으로 반영하며, 음성 인식 연구 및 응용에 풍부한 리소스를 제공합니다. GDPR, CCPA, PIPL 등 개인정보 보호 규정을 철저히 준수하여 데이터 수집·저장·활용 과정 전반에서 사용자 프라이버시와 합법적 권리를 보장합니다.","dataexampl":null,"datakeyword":["워크숍 오디오 데이터셋"," MLC-SLM 데이터셋"," ASR 음성 인식 데이터"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"INTERSPEECH 2025 MLC-SLM Challenge Dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0022_001-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=hzFnDSJljVWVQ0tPwyC0lHgLpLY%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0019_001_phone-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=brQmectqi5gBtR5JBtozW2AZlcI%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0019_001_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=PYIHEbEPwyvvnnaw3QcxA6RDBUI%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0001_001-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=N9kseFImwstZ6%2BVdh6JcvzEmqz8%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0001_001-6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=9WxMMMfd0avEp9uywfxFpTf7RZ4%3D"}]
Interspeech2025-MLC-SLM 다국어 대화 음성 데이터셋
워크숍 오디오 데이터셋
MLC-SLM 데이터셋
ASR 음성 인식 데이터
Interspeech2025-MLC-SLM 다국어 대화 음성 경진대회 데이터셋입니다. 이 데이터셋은 데이터당이 2025년에 개최한 MLC-SLM 다국어 대화 음성 경진대회용으로 제작되었으며, 자사 보유 15종 대화 음성 데이터셋에서 선별된 자료로 구성됩니다. 높은 정확도와 활용성을 갖추었으며, 다국어 음성 인식 및 장문 맥락 이해 기술의 한계를 극복하기 위해 설계되었습니다. 루마니아인 화자 중첩, 즉흥 발화 등 복잡한 상호작용 상황을 사실적으로 반영하며, 음성 인식 연구 및 응용에 풍부한 리소스를 제공합니다. GDPR, CCPA, PIPL 등 개인정보 보호 규정을 철저히 준수하여 데이터 수집·저장·활용 과정 전반에서 사용자 프라이버시와 합법적 권리를 보장합니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
![사양]()
사양
포맷
16kHz, 16bit, 비압축 wav, 모노
녹음 내용
주제 목록 제시 후, 루마니아인 화자가 익숙한 주제를 선택해 자연스러운 대화 녹음
라벨링 특징
텍스트, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자
언어
미국 영어, 영국 영어, 필리핀 영어, 호주 영어, 인도 영어, 프랑스어, 독일어, 이탈리아어, 일본어, 한국어, 포르투갈어, 러시아어, 스페인어, 태국어, 베트남어
![샘플]()
샘플
Audio
one direction is the first thing like in the mind
Audio
Parce que j'ai plus l'ancien, j'en ai que celui-là dorénavant.
Audio
D'accord très bien l'autre, je vais l'effacer alors.
Audio
Audio
이천치십 년이랑 이천이십일 년 진짜 학교 못 간게
![추천 데이터셋]()
추천 데이터셋
b9ba4210-eba9-406c-a1c2-2950ea2649a6