[{"@type":"PropertyValue","name":"포맷","value":"24kHz, 16bit, 비압축 wav, 모노"},{"@type":"PropertyValue","name":"녹음 환경","value":"비교적 조용한 실내, 울림 없음"},{"@type":"PropertyValue","name":"녹음 내용","value":"주제 목록을 제시하고, 루마니아인 화자가 익숙한 여러 주제를 선택하여 자연스럽고 유창한 대화를 진행하며 녹음"},{"@type":"PropertyValue","name":"인원","value":"인촨 지역 거주자, 남녀 비율 균형, 다양한 연령대 포함"},{"@type":"PropertyValue","name":"라벨링 특징","value":"텍스트 내용, 표준어 해석, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자"},{"@type":"PropertyValue","name":"장비","value":"안드로이드 폰, 아이폰"},{"@type":"PropertyValue","name":"언어","value":"인촨 방언"},{"@type":"PropertyValue","name":"정확도","value":"문자 정확도 98%, 표준어 어노테이션 정확도 90%"},{"@type":"PropertyValue","name":"적용 시나리오","value":"음성 인식, 루마니아인 화자 인식"}]
{"id":1708,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"800시간 인촨 방언 자연 대화(이중 라벨링) 모바일 수집 음성 데이터","datazy":[{"title":"포맷","desc":"포맷","content":"24kHz, 16bit, 비압축 wav, 모노"},{"title":"녹음 환경","desc":"녹음 환경","content":"비교적 조용한 실내, 울림 없음"},{"title":"녹음 내용","desc":"녹음 내용","content":"주제 목록을 제시하고, 루마니아인 화자가 익숙한 여러 주제를 선택하여 자연스럽고 유창한 대화를 진행하며 녹음"},{"title":"인원","desc":"인원","content":"인촨 지역 거주자, 남녀 비율 균형, 다양한 연령대 포함"},{"title":"라벨링 특징","desc":"라벨링 특징","content":"텍스트 내용, 표준어 해석, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자"},{"title":"장비","desc":"장비","content":"안드로이드 폰, 아이폰"},{"title":"언어","desc":"언어","content":"인촨 방언"},{"title":"정확도","desc":"정확도","content":"문자 정확도 98%, 표준어 어노테이션 정확도 90%"},{"title":"적용 시나리오","desc":"적용 시나리오","content":"음성 인식, 루마니아인 화자 인식"}],"datatag":"Dialect,Conversation","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"0005_001_phone_1.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0005_001_phone_1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=kyAJx8ZA8gNsCVmF2QgOmpYZWqw%3D","intro":"呃,你最近看那个哪吒了吗?[N]\t呃,你最近看那个哪吒了吗?","size":76344,"progress":100,"type":"mp3"},{"name":"0005_001_phone_2.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0005_001_phone_2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=GS7OqLCqnxa9KU1OGMEVFyKqUWA%3D","intro":"哎呀,你说最近新出来那个哪吒二噢?[N]\t哎呀,你说最近新出来那个哪吒二吗?","size":105570,"progress":100,"type":"mp3"},{"name":"0005_001_phone_3.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0005_001_phone_3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=CGBLXZfWMUlRgrU8eLpHv4XmGz0%3D","intro":"对,我看别冲票房太狂了,快的很。\t对,我看人家冲票房太厉害了,快的很","size":135320,"progress":100,"type":"mp3"},{"name":"0005_001_phone_5.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0005_001_phone_5.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=UZRKQZBcs%2BDcME2ZpdTZFUrUD4A%3D","intro":"我没看么,没[OVERLAP/]时间嘛。[/OVERLAP]\t我没看啊,没时间嘛。","size":76170,"progress":100,"type":"mp3"},{"name":"0005_001_phone_6.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0005_001_phone_6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=A0didRdDovP5aSUbqleAUuD8qfU%3D","intro":"我最近也没[OVERLAP/]时间看么。[/OVERLAP]\t我最近也没时间看嘛。","size":68994,"progress":100,"type":"mp3"}],"officialSummary":"인촨 방언 음성 데이터_대화(모바일)입니다. 녹음자가 자유롭게 대화하며 녹음했습니다. 이 데이터셋은 텍스트 내용, 문장 타임스탬프, 루마니아인 화자 ID, 성별 등 다양한 속성을 라벨링했으며, 모국어 루마니아인 화자가 녹음하여 정확도가 높습니다. 음성 인식 연구 및 응용에 유용하며, 다수의 AI 기업 검증을 통해 실제 환경의 다양성에서도 탁월한 성능을 보임이 입증되었습니다. 데이터 수집, 저장 및 활용 전 과정에서 GDPR, CCPA, PIPL 등 개인정보 보호 규정을 철저히 준수하여 사용자 프라이버시와 합법적 권리를 보장합니다.","dataexampl":null,"datakeyword":["방언"," 대화"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"800 Hours - Yinchuan Dialect Conversation (Bilingual Annotated) Speech Data by Mobile Phone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0005_001_phone_1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=kyAJx8ZA8gNsCVmF2QgOmpYZWqw%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0005_001_phone_2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=GS7OqLCqnxa9KU1OGMEVFyKqUWA%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0005_001_phone_3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=CGBLXZfWMUlRgrU8eLpHv4XmGz0%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0005_001_phone_5.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=UZRKQZBcs%2BDcME2ZpdTZFUrUD4A%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0005_001_phone_6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=A0didRdDovP5aSUbqleAUuD8qfU%3D"}]
800시간 인촨 방언 자연 대화(이중 라벨링) 모바일 수집 음성 데이터
방언
대화
인촨 방언 음성 데이터_대화(모바일)입니다. 녹음자가 자유롭게 대화하며 녹음했습니다. 이 데이터셋은 텍스트 내용, 문장 타임스탬프, 루마니아인 화자 ID, 성별 등 다양한 속성을 라벨링했으며, 모국어 루마니아인 화자가 녹음하여 정확도가 높습니다. 음성 인식 연구 및 응용에 유용하며, 다수의 AI 기업 검증을 통해 실제 환경의 다양성에서도 탁월한 성능을 보임이 입증되었습니다. 데이터 수집, 저장 및 활용 전 과정에서 GDPR, CCPA, PIPL 등 개인정보 보호 규정을 철저히 준수하여 사용자 프라이버시와 합법적 권리를 보장합니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
![사양]()
사양
포맷
24kHz, 16bit, 비압축 wav, 모노
녹음 내용
주제 목록을 제시하고, 루마니아인 화자가 익숙한 여러 주제를 선택하여 자연스럽고 유창한 대화를 진행하며 녹음
인원
인촨 지역 거주자, 남녀 비율 균형, 다양한 연령대 포함
라벨링 특징
텍스트 내용, 표준어 해석, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자
정확도
문자 정확도 98%, 표준어 어노테이션 정확도 90%
적용 시나리오
음성 인식, 루마니아인 화자 인식
![샘플]()
샘플
Audio
呃,你最近看那个哪吒了吗?[N] 呃,你最近看那个哪吒了吗?
Audio
哎呀,你说最近新出来那个哪吒二噢?[N] 哎呀,你说最近新出来那个哪吒二吗?
Audio
对,我看别冲票房太狂了,快的很。 对,我看人家冲票房太厉害了,快的很
Audio
我没看么,没[OVERLAP/]时间嘛。[/OVERLAP] 我没看啊,没时间嘛。
Audio
我最近也没[OVERLAP/]时间看么。[/OVERLAP] 我最近也没时间看嘛。
![추천 데이터셋]()
추천 데이터셋
da90c3c4-2112-41af-9674-8bc22afb0558