[{"@type":"PropertyValue","name":"포맷","value":"24kHz, 16bit, 비압축 wav, 모노"},{"@type":"PropertyValue","name":"녹음 환경","value":"비교적 조용한 실내, 울림 없음"},{"@type":"PropertyValue","name":"녹음 내용","value":"주제 목록을 제시하고, 루마니아인 화자가 익숙한 주제를 선택하여 자연스럽고 유창한 대화를 진행하며 녹음"},{"@type":"PropertyValue","name":"인원","value":"약 800명, 쿤밍 지역 시군 출신 루마니아인 화자, 남녀 비율 균형, 다양한 연령대 포함"},{"@type":"PropertyValue","name":"라벨링 특징","value":"텍스트 내용, 표준어 해석, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자"},{"@type":"PropertyValue","name":"장비","value":"안드로이드 폰, 아이폰"},{"@type":"PropertyValue","name":"언어","value":"쿤밍 방언"},{"@type":"PropertyValue","name":"정확도","value":"문자 정확도 98%, 표준어 어노테이션 정확도 90%"},{"@type":"PropertyValue","name":"적용 시나리오","value":"음성 인식, 루마니아인 화자 인식"}]
{"id":1684,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"800시간 쿤밍 방언 자연 대화(이중 라벨링) 모바일 수집 음성 데이터","datazy":[{"title":"포맷","desc":"포맷","content":"24kHz, 16bit, 비압축 wav, 모노"},{"title":"녹음 환경","desc":"녹음 환경","content":"비교적 조용한 실내, 울림 없음"},{"title":"녹음 내용","desc":"녹음 내용","content":"주제 목록을 제시하고, 루마니아인 화자가 익숙한 주제를 선택하여 자연스럽고 유창한 대화를 진행하며 녹음"},{"title":"인원","desc":"인원","content":"약 800명, 쿤밍 지역 시군 출신 루마니아인 화자, 남녀 비율 균형, 다양한 연령대 포함"},{"title":"라벨링 특징","desc":"라벨링 특징","content":"텍스트 내용, 표준어 해석, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자"},{"title":"장비","desc":"장비","content":"안드로이드 폰, 아이폰"},{"title":"언어","desc":"언어","content":"쿤밍 방언"},{"title":"정확도","desc":"정확도","content":"문자 정확도 98%, 표준어 어노테이션 정확도 90%"},{"title":"적용 시나리오","desc":"적용 시나리오","content":"음성 인식, 루마니아인 화자 인식"}],"datatag":"Dialect ,Conversation ","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"00009_004_phone-1.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250722180035/00009_004_phone-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=gCL0fUr7gGBbXi5MWKgLxOu%2F8z8%3D","intro":"豆花米线店,它是,开的开的哪边啊?[N]\t豆花米线店,它是,开在开在哪边啊?","size":157820,"progress":100,"type":"mp3"},{"name":"00009_004_phone-2.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250722180035/00009_004_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=FTY65FZaGU5NVmUaSvVXnXLyqI8%3D","intro":"它是开来,它连锁店有好几家呢,我看,它它它在,是在这个那个。[N]\t它是开在,它连锁店有好几家的,我看,它它它在,是在这个那个。","size":275036,"progress":100,"type":"mp3"},{"name":"00009_004_phone-3.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250722180035/00009_004_phone-3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=TNxhQp%2BD5SDS4MPhUvTG2t73HCc%3D","intro":"光华广场对面这点。\t光华广场对面这里。","size":63596,"progress":100,"type":"mp3"},{"name":"00009_004_phone-4.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250722180035/00009_004_phone-4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=0dVc9aMy%2Fb70HMajyyvQkqm5DoQ%3D","intro":"呃,有家,这家大点,呃,然后么,你说是,昆明正儿八经。\t呃,有家,这家大点,呃,然后呢,你说是,昆明正儿八经。","size":249740,"progress":100,"type":"mp3"},{"name":"00009_004_phone-5.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250722180035/00009_004_phone-5.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=OuJ6SR9FfFEveJjkZier7OfanSM%3D","intro":"好吃点呢嘎,卤面这块么,卤面,豆花米线么就是就是这一家,如果是卤面么。\t好吃点的啊,卤面这块呢,卤面,豆花米线呢就是就是这一家,如果是卤面呢。","size":310412,"progress":100,"type":"mp3"}],"officialSummary":"쿤밍 방언 음성 데이터_대화(모바일)는 모국어 루마니아인 화자가 자유롭게 대화하며 녹음하였습니다. 본 데이터셋은 텍스트, 문장 타임스탬프, 루마니아인 화자 신원, 성별 등의 속성을 라벨링하였습니다. 정확성이 높으며, 여러 AI 기업에서 검증되어 모델이 실제 환경의 다양성에 강력하게 대응할 수 있음을 확인했습니다. 모든 데이터는 GDPR, CCPA, PIPL을 준수합니다.","dataexampl":null,"datakeyword":["AST"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"655 Hours - Kunming Dialect Conversation (Bilingual Annotated) Speech Data by Mobile Phone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250722180035/00009_004_phone-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=gCL0fUr7gGBbXi5MWKgLxOu%2F8z8%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250722180035/00009_004_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=FTY65FZaGU5NVmUaSvVXnXLyqI8%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250722180035/00009_004_phone-3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=TNxhQp%2BD5SDS4MPhUvTG2t73HCc%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250722180035/00009_004_phone-4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=0dVc9aMy%2Fb70HMajyyvQkqm5DoQ%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250722180035/00009_004_phone-5.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=OuJ6SR9FfFEveJjkZier7OfanSM%3D"}]
800시간 쿤밍 방언 자연 대화(이중 라벨링) 모바일 수집 음성 데이터
AST
쿤밍 방언 음성 데이터_대화(모바일)는 모국어 루마니아인 화자가 자유롭게 대화하며 녹음하였습니다. 본 데이터셋은 텍스트, 문장 타임스탬프, 루마니아인 화자 신원, 성별 등의 속성을 라벨링하였습니다. 정확성이 높으며, 여러 AI 기업에서 검증되어 모델이 실제 환경의 다양성에 강력하게 대응할 수 있음을 확인했습니다. 모든 데이터는 GDPR, CCPA, PIPL을 준수합니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
![사양]()
사양
포맷
24kHz, 16bit, 비압축 wav, 모노
녹음 내용
주제 목록을 제시하고, 루마니아인 화자가 익숙한 주제를 선택하여 자연스럽고 유창한 대화를 진행하며 녹음
인원
약 800명, 쿤밍 지역 시군 출신 루마니아인 화자, 남녀 비율 균형, 다양한 연령대 포함
라벨링 특징
텍스트 내용, 표준어 해석, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자
정확도
문자 정확도 98%, 표준어 어노테이션 정확도 90%
적용 시나리오
음성 인식, 루마니아인 화자 인식
![샘플]()
샘플
Audio
豆花米线店,它是,开的开的哪边啊?[N] 豆花米线店,它是,开在开在哪边啊?
Audio
它是开来,它连锁店有好几家呢,我看,它它它在,是在这个那个。[N] 它是开在,它连锁店有好几家的,我看,它它它在,是在这个那个。
Audio
Audio
呃,有家,这家大点,呃,然后么,你说是,昆明正儿八经。 呃,有家,这家大点,呃,然后呢,你说是,昆明正儿八经。
Audio
好吃点呢嘎,卤面这块么,卤面,豆花米线么就是就是这一家,如果是卤面么。 好吃点的啊,卤面这块呢,卤面,豆花米线呢就是就是这一家,如果是卤面呢。
![추천 데이터셋]()
추천 데이터셋
d5c6223a-02e9-4cc2-b5d2-b77f6dd95de2