[{"@type":"PropertyValue","name":"포맷","value":"24kHz, 16bit, 비압축 wav, 모노"},{"@type":"PropertyValue","name":"녹음 환경","value":"비교적 조용한 실내, 울림 없음"},{"@type":"PropertyValue","name":"녹음 내용","value":"주제 목록 제시 후, 루마니아인 화자가 익숙한 주제를 선택해 자연스러운 대화 녹음"},{"@type":"PropertyValue","name":"인원","value":"칭다오 지역 시군 출신, 남녀 비율 균형, 다양한 연령대 포함"},{"@type":"PropertyValue","name":"라벨링 특징","value":"텍스트, 표준어 해석, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자"},{"@type":"PropertyValue","name":"장비","value":"안드로이드 폰, 아이폰"},{"@type":"PropertyValue","name":"언어","value":"칭다오 방언"},{"@type":"PropertyValue","name":"정확도","value":"문자 정확도 98%, 표준어 어노테이션 정확도 90%"},{"@type":"PropertyValue","name":"적용 시나리오","value":"음성 인식, 루마니아인 화자 인식"}]
{"id":1702,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"500시간 칭다오 방언 자연 대화(이중 라벨링) 모바일 수집 음성 데이터","datazy":[{"title":"포맷","desc":"포맷","content":"24kHz, 16bit, 비압축 wav, 모노"},{"title":"녹음 환경","desc":"녹음 환경","content":"비교적 조용한 실내, 울림 없음"},{"title":"녹음 내용","desc":"녹음 내용","content":"주제 목록 제시 후, 루마니아인 화자가 익숙한 주제를 선택해 자연스러운 대화 녹음"},{"title":"인원","desc":"인원","content":"칭다오 지역 시군 출신, 남녀 비율 균형, 다양한 연령대 포함"},{"title":"라벨링 특징","desc":"라벨링 특징","content":"텍스트, 표준어 해석, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자"},{"title":"장비","desc":"장비","content":"안드로이드 폰, 아이폰"},{"title":"언어","desc":"언어","content":"칭다오 방언"},{"title":"정확도","desc":"정확도","content":"문자 정확도 98%, 표준어 어노테이션 정확도 90%"},{"title":"적용 시나리오","desc":"적용 시나리오","content":"음성 인식, 루마니아인 화자 인식"}],"datatag":"Dialect,Conversation","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"0003_001_phone_1.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0003_001_phone_1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=Blc60vzA2dRRuG77F48NeupchkM%3D","intro":"然后上个月的时候,本来不是要去婺源,这不我么去吗?[N]\t然后上个月的时候,本来不是要去婺源,这不我没去吗?","size":176488,"progress":100,"type":"mp3"},{"name":"0003_001_phone_2.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0003_001_phone_2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=FJ%2FbB9EZ2n7OUNdDm0B%2BGZfGuFA%3D","intro":"白紧,这十七号二十十七号十八号还有机会去。[N]\t不要紧,这十七号二十十七号十八号还有机会去。","size":224918,"progress":100,"type":"mp3"},{"name":"0003_001_phone_3.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0003_001_phone_3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=uKpwcIMzJoybncPcxszyEDFS31o%3D","intro":"但是婺源,怎要是开了车去的话,太远了。\t但是婺源,我们要是开了车去的话,太远了。","size":189044,"progress":100,"type":"mp3"},{"name":"0003_001_phone_4.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0003_001_phone_4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=bKP%2FtvlvijTSPuCBuLwhg7n7xhU%3D","intro":"特好像也就一千一背多公里吧。\t他好像也就一千一百多公里吧。","size":204274,"progress":100,"type":"mp3"},{"name":"0003_001_phone_6.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0003_001_phone_6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=Cb%2ByVHyK2qdvxeIVV%2FSzW7ZG6FI%3D","intro":"从网上搜到的距离不远乎。\t从网上搜到的距离挺远啊。","size":128640,"progress":100,"type":"mp3"}],"officialSummary":"칭다오 방언 음성 데이터_대화(모바일)입니다. 녹음자가 자유롭게 대화하며 녹음했습니다. 이 데이터셋은 텍스트 내용, 문장 타임스탬프, 루마니아인 화자 ID, 성별 등 다양한 속성을 라벨링했으며, 모국어 루마니아인 화자가 녹음하여 정확도가 높습니다. 음성 인식 연구 및 응용에 유용하며, 다수의 AI 기업 검증을 통해 실제 환경의 다양성에서도 탁월한 성능을 보임이 입증되었습니다. GDPR, CCPA, PIPL 등 개인정보 보호 규정을 철저히 준수하여 사용자 프라이버시와 합법적 권리를 보장합니다.","dataexampl":null,"datakeyword":["방언"," 대화"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Data Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"500 Hours - Qingdao Dialect Conversation (Bilingual Annotated) Speech Data by Mobile Phone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0003_001_phone_1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=Blc60vzA2dRRuG77F48NeupchkM%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0003_001_phone_2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=FJ%2FbB9EZ2n7OUNdDm0B%2BGZfGuFA%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0003_001_phone_3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=uKpwcIMzJoybncPcxszyEDFS31o%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0003_001_phone_4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=bKP%2FtvlvijTSPuCBuLwhg7n7xhU%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0003_001_phone_6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=Cb%2ByVHyK2qdvxeIVV%2FSzW7ZG6FI%3D"}]
500시간 칭다오 방언 자연 대화(이중 라벨링) 모바일 수집 음성 데이터
방언
대화
칭다오 방언 음성 데이터_대화(모바일)입니다. 녹음자가 자유롭게 대화하며 녹음했습니다. 이 데이터셋은 텍스트 내용, 문장 타임스탬프, 루마니아인 화자 ID, 성별 등 다양한 속성을 라벨링했으며, 모국어 루마니아인 화자가 녹음하여 정확도가 높습니다. 음성 인식 연구 및 응용에 유용하며, 다수의 AI 기업 검증을 통해 실제 환경의 다양성에서도 탁월한 성능을 보임이 입증되었습니다. GDPR, CCPA, PIPL 등 개인정보 보호 규정을 철저히 준수하여 사용자 프라이버시와 합법적 권리를 보장합니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
![사양]()
사양
포맷
24kHz, 16bit, 비압축 wav, 모노
녹음 내용
주제 목록 제시 후, 루마니아인 화자가 익숙한 주제를 선택해 자연스러운 대화 녹음
인원
칭다오 지역 시군 출신, 남녀 비율 균형, 다양한 연령대 포함
라벨링 특징
텍스트, 표준어 해석, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자
정확도
문자 정확도 98%, 표준어 어노테이션 정확도 90%
적용 시나리오
음성 인식, 루마니아인 화자 인식
![샘플]()
샘플
Audio
然后上个月的时候,本来不是要去婺源,这不我么去吗?[N] 然后上个月的时候,本来不是要去婺源,这不我没去吗?
Audio
白紧,这十七号二十十七号十八号还有机会去。[N] 不要紧,这十七号二十十七号十八号还有机会去。
Audio
但是婺源,怎要是开了车去的话,太远了。 但是婺源,我们要是开了车去的话,太远了。
Audio
特好像也就一千一背多公里吧。 他好像也就一千一百多公里吧。
Audio
从网上搜到的距离不远乎。 从网上搜到的距离挺远啊。
![추천 데이터셋]()
추천 데이터셋
73edb60d-9bcd-4674-80b5-b0583bbd027c