[{"@type":"PropertyValue","name":"포맷","value":"16kHz/24kHz, 16bit, 비압축 wav, 모노"},{"@type":"PropertyValue","name":"녹음 환경","value":"비교적 조용한 실내, 울림 없음"},{"@type":"PropertyValue","name":"녹음 내용","value":"주제 목록을 제시하고, 루마니아인 화자가 익숙한 주제를 선택하여 자연스럽고 유창한 대화를 진행하며 녹음"},{"@type":"PropertyValue","name":"인원","value":"약 500명, 구이린 지역 시군 출신 루마니아인 화자, 남녀 비율 균형, 다양한 연령대 포함"},{"@type":"PropertyValue","name":"라벨링 특징","value":"텍스트 내용, 표준어 해석, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자"},{"@type":"PropertyValue","name":"장비","value":"안드로이드 폰, 아이폰"},{"@type":"PropertyValue","name":"언어","value":"구이린 방언"},{"@type":"PropertyValue","name":"정확도","value":"문자 정확도 98%, 표준어 어노테이션 정확도 90%"},{"@type":"PropertyValue","name":"적용 시나리오","value":"음성 인식, 루마니아인 화자 인식"}]
{"id":1682,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"500시간 구이린 방언 자연 대화(이중 라벨링) 모바일 수집 음성 데이터","datazy":[{"title":"포맷","desc":"포맷","content":"16kHz/24kHz, 16bit, 비압축 wav, 모노"},{"title":"녹음 환경","desc":"녹음 환경","content":"비교적 조용한 실내, 울림 없음"},{"title":"녹음 내용","desc":"녹음 내용","content":"주제 목록을 제시하고, 루마니아인 화자가 익숙한 주제를 선택하여 자연스럽고 유창한 대화를 진행하며 녹음"},{"title":"인원","desc":"인원","content":"약 500명, 구이린 지역 시군 출신 루마니아인 화자, 남녀 비율 균형, 다양한 연령대 포함"},{"title":"라벨링 특징","desc":"라벨링 특징","content":"텍스트 내용, 표준어 해석, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자"},{"title":"장비","desc":"장비","content":"안드로이드 폰, 아이폰"},{"title":"언어","desc":"언어","content":"구이린 방언"},{"title":"정확도","desc":"정확도","content":"문자 정확도 98%, 표준어 어노테이션 정확도 90%"},{"title":"적용 시나리오","desc":"적용 시나리오","content":"음성 인식, 루마니아인 화자 인식"}],"datatag":"ast,Dialect ,guilin","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"wea_001_00428_16k-1.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728104926/wea_001_00428_16k-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=hrwhkGRxXISVobVkRDURULYmswY%3D","intro":"就是特别特别冷滴时候,那你,出去,\t就是特别特别冷的时候,那你,出去,","size":77164,"progress":100,"type":"mp3"},{"name":"wea_001_00428_16k-2.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728104926/wea_001_00428_16k-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=0TOE62FZNkDOIAh0%2BBeujeXl8rA%3D","intro":"开电动车倒是没有。\t骑电动车倒是没有。","size":45516,"progress":100,"type":"mp3"},{"name":"wea_001_00428_16k-3.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728104926/wea_001_00428_16k-3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=gLsxIqegpSGeAMVvHbtWQsMlhFc%3D","intro":"那不是就是穿起多多哩。\t那不是就是穿得多多的。","size":61196,"progress":100,"type":"mp3"},{"name":"wea_001_00428_16k-4.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728104926/wea_001_00428_16k-4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=2Q39u6rWZn7DJFQ8tbymuIxF1OY%3D","intro":"然后桂林南方这种就是湿冷天气,这不[OVERLAP/]是,不[/OVERLAP]是你穿好多就能够解决问题哩。\t然后桂林南方这种就是湿冷天气,这不是,不是你穿很多就能够解决问题的。","size":179116,"progress":100,"type":"mp3"},{"name":"wea_001_00428_16k-5.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728104926/wea_001_00428_16k-5.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=OrylBVGjLZr3bMPU0J6mcMNT34w%3D","intro":"但是我们去去北方,去北方其实北方也是,北方是真滴冷但人家室内有有地暖。\t但是我们去去北方,去北方其实北方也是,北方是真的冷但人家室内有有地暖。","size":176780,"progress":100,"type":"mp3"}],"officialSummary":"구이린 방언 음성 데이터_대화(모바일)는 자유 대화로 녹음되었으며, 텍스트, 타임스탬프, 루마니아인 화자 정보, 성별 등의 라벨링이 되어 있습니다. 모국어 루마니아인 화자가 직접 녹음하였으며 정확도가 높습니다. AI 기업 검증을 통해 모델이 실제 환경의 다양성에 대응할 수 있음을 입증했습니다. 모든 데이터는 GDPR, CCPA, PIPL 등 규정을 준수합니다.","dataexampl":null,"datakeyword":["AST"," 방언"," 구이린"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"100 Hours - Guilin Dialect Conversation (Bilingual Annotated) Speech Data by Mobile Phone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728104926/wea_001_00428_16k-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=hrwhkGRxXISVobVkRDURULYmswY%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728104926/wea_001_00428_16k-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=0TOE62FZNkDOIAh0%2BBeujeXl8rA%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728104926/wea_001_00428_16k-3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=gLsxIqegpSGeAMVvHbtWQsMlhFc%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728104926/wea_001_00428_16k-4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=2Q39u6rWZn7DJFQ8tbymuIxF1OY%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728104926/wea_001_00428_16k-5.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=OrylBVGjLZr3bMPU0J6mcMNT34w%3D"}]
500시간 구이린 방언 자연 대화(이중 라벨링) 모바일 수집 음성 데이터
AST
방언
구이린
구이린 방언 음성 데이터_대화(모바일)는 자유 대화로 녹음되었으며, 텍스트, 타임스탬프, 루마니아인 화자 정보, 성별 등의 라벨링이 되어 있습니다. 모국어 루마니아인 화자가 직접 녹음하였으며 정확도가 높습니다. AI 기업 검증을 통해 모델이 실제 환경의 다양성에 대응할 수 있음을 입증했습니다. 모든 데이터는 GDPR, CCPA, PIPL 등 규정을 준수합니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
![사양]()
사양
포맷
16kHz/24kHz, 16bit, 비압축 wav, 모노
녹음 내용
주제 목록을 제시하고, 루마니아인 화자가 익숙한 주제를 선택하여 자연스럽고 유창한 대화를 진행하며 녹음
인원
약 500명, 구이린 지역 시군 출신 루마니아인 화자, 남녀 비율 균형, 다양한 연령대 포함
라벨링 특징
텍스트 내용, 표준어 해석, 유효 문장 시작·종료 시점, 루마니아인 화자 식별자
정확도
문자 정확도 98%, 표준어 어노테이션 정확도 90%
적용 시나리오
음성 인식, 루마니아인 화자 인식
![샘플]()
샘플
![추천 데이터셋]()
추천 데이터셋
dbc79a53-337a-45b7-bcc9-a5e68cd38e0b