[{"@type":"PropertyValue","name":"포맷","value":"24kHz, 16bit, 비압축 wav, 모노"},{"@type":"PropertyValue","name":"녹음 환경","value":"비교적 조용한 실내, 울림 없음"},{"@type":"PropertyValue","name":"녹음 내용","value":"주제 목록을 제시하고, 루마니아인 화자가 익숙한 여러 주제를 선택하여 자연스럽고 유창한 대화를 진행하며 녹음"},{"@type":"PropertyValue","name":"인원","value":"지난 지역의 시군 출신 루마니아인 화자, 남녀 비율 균형, 다양한 연령대 포함"},{"@type":"PropertyValue","name":"라벨링 특징","value":"텍스트 내용, 표준어 해석, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자"},{"@type":"PropertyValue","name":"장비","value":"안드로이드 폰, 아이폰"},{"@type":"PropertyValue","name":"언어","value":"지난 방언"},{"@type":"PropertyValue","name":"정확도","value":"문자 정확도 98%, 표준어 어노테이션 정확도 90%"},{"@type":"PropertyValue","name":"적용 시나리오","value":"음성 인식, 루마니아인 화자 인식"}]
{"id":1716,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"500시간 지난 방언 자연 대화(이중 라벨링) 모바일 수집 음성 데이터","datazy":[{"title":"포맷","desc":"포맷","content":"24kHz, 16bit, 비압축 wav, 모노"},{"title":"녹음 환경","desc":"녹음 환경","content":"비교적 조용한 실내, 울림 없음"},{"title":"녹음 내용","desc":"녹음 내용","content":"주제 목록을 제시하고, 루마니아인 화자가 익숙한 여러 주제를 선택하여 자연스럽고 유창한 대화를 진행하며 녹음"},{"title":"인원","desc":"인원","content":"지난 지역의 시군 출신 루마니아인 화자, 남녀 비율 균형, 다양한 연령대 포함"},{"title":"라벨링 특징","desc":"라벨링 특징","content":"텍스트 내용, 표준어 해석, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자"},{"title":"장비","desc":"장비","content":"안드로이드 폰, 아이폰"},{"title":"언어","desc":"언어","content":"지난 방언"},{"title":"정확도","desc":"정확도","content":"문자 정확도 98%, 표준어 어노테이션 정확도 90%"},{"title":"적용 시나리오","desc":"적용 시나리오","content":"음성 인식, 루마니아인 화자 인식"}],"datatag":"Dialect,Conversation","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"0013_001_phone_2.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0013_001_phone_2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=qZz9V3VprHzwGqRAKXQ3lvDebYg%3D","intro":"咱聊聊旅游。\t我们聊聊旅游。","size":69462,"progress":100,"type":"mp3"},{"name":"0013_001_phone_4.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0013_001_phone_4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=5pMpCQTV1mWB%2F3Kn5as47f0kgXE%3D","intro":"旅游你都是去过哪里?\t旅游你都是去过哪里?","size":104170,"progress":100,"type":"mp3"},{"name":"0013_001_phone_5.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0013_001_phone_5.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=jdbWgcxdSufgtWTWURfBW4cCdtk%3D","intro":"哎呀,去过老老多地方了。\t哎呀,去过老老多地方了。","size":126150,"progress":100,"type":"mp3"},{"name":"0013_001_phone_6.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0013_001_phone_6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=ZLGzmm%2BmndfXZxlG48sRyiIopEg%3D","intro":"哦,我基本上我也是不少不少地方,我有印象去过北京啊,天津啊。[N]\t哦,我基本上我也是不少不少地方,我有印象去过北京啊,天津啊。","size":345360,"progress":100,"type":"mp3"},{"name":"0013_001_phone_7.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0013_001_phone_7.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=Md6diU0E7%2FNT40SliTvXK%2FL9Jfk%3D","intro":"云南啊,福建啊广东啊哦反正不少地方。[N]\t云南啊,福建啊广东啊哦反正不少地方。","size":294250,"progress":100,"type":"mp3"}],"officialSummary":"지난 방언 음성 데이터_대화(모바일)입니다. 녹음자가 자유롭게 대화하며 녹음했습니다. 이 데이터셋은 텍스트 내용, 문장 타임스탬프, 루마니아인 화자 ID, 성별 등 다양한 속성을 라벨링했으며, 모국어 루마니아인 화자가 녹음하여 정확도가 높습니다. 음성 인식 연구 및 응용에 유용하며, 다수의 AI 기업 검증을 통해 실제 환경의 다양성에서도 탁월한 성능을 보임이 입증되었습니다. GDPR, CCPA, PIPL 등 개인정보 보호 규정을 철저히 준수하여 사용자 프라이버시와 합법적 권리를 보장합니다.","dataexampl":null,"datakeyword":["방언"," 대화"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"500 Hours - Jinan Dialect Conversation (Bilingual Annotated) Speech Data by Mobile Phone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0013_001_phone_2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=qZz9V3VprHzwGqRAKXQ3lvDebYg%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0013_001_phone_4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=5pMpCQTV1mWB%2F3Kn5as47f0kgXE%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0013_001_phone_5.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=jdbWgcxdSufgtWTWURfBW4cCdtk%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0013_001_phone_6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=ZLGzmm%2BmndfXZxlG48sRyiIopEg%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250814094030/0013_001_phone_7.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=Md6diU0E7%2FNT40SliTvXK%2FL9Jfk%3D"}]
500시간 지난 방언 자연 대화(이중 라벨링) 모바일 수집 음성 데이터
방언
대화
지난 방언 음성 데이터_대화(모바일)입니다. 녹음자가 자유롭게 대화하며 녹음했습니다. 이 데이터셋은 텍스트 내용, 문장 타임스탬프, 루마니아인 화자 ID, 성별 등 다양한 속성을 라벨링했으며, 모국어 루마니아인 화자가 녹음하여 정확도가 높습니다. 음성 인식 연구 및 응용에 유용하며, 다수의 AI 기업 검증을 통해 실제 환경의 다양성에서도 탁월한 성능을 보임이 입증되었습니다. GDPR, CCPA, PIPL 등 개인정보 보호 규정을 철저히 준수하여 사용자 프라이버시와 합법적 권리를 보장합니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
![사양]()
사양
포맷
24kHz, 16bit, 비압축 wav, 모노
녹음 내용
주제 목록을 제시하고, 루마니아인 화자가 익숙한 여러 주제를 선택하여 자연스럽고 유창한 대화를 진행하며 녹음
인원
지난 지역의 시군 출신 루마니아인 화자, 남녀 비율 균형, 다양한 연령대 포함
라벨링 특징
텍스트 내용, 표준어 해석, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자
정확도
문자 정확도 98%, 표준어 어노테이션 정확도 90%
적용 시나리오
음성 인식, 루마니아인 화자 인식
![샘플]()
샘플
![추천 데이터셋]()
추천 데이터셋
fdd84d23-6370-43a0-ba2e-b98af1c01366