[{"@type":"PropertyValue","name":"형식","value":"16kHz, 16bit, 무압축 WAV, 모노"},{"@type":"PropertyValue","name":"녹음 환경","value":"비교적 조용한 실내 환경, 할덤 없음"},{"@type":"PropertyValue","name":"녹음 내용","value":"주제 목록을 제공하여 화자가 자신이 익숙한 여러 주제를 선정하여 대화의 자연스러운 흐름을 보장하며, 각 주제별로 대화를 진행하고 녹음함"},{"@type":"PropertyValue","name":"인원","value":"총 480명의 대만 지역 인원이 참여하였으며, 남녀 비율은 균형을 이루고 있습니다."},{"@type":"PropertyValue","name":"라벨링 특성","value":"유효한 단문을 발췌하여 라벨링하며, 라벨링 결과에는 유효 단문의 시작 및 종료 시점, 화자 식별, 텍스트 내용 및 잡음 라벨링을 포함"},{"@type":"PropertyValue","name":"국가","value":"중국"},{"@type":"PropertyValue","name":"언어","value":"보통화"},{"@type":"PropertyValue","name":"적용 장면","value":"음성 인식, 음성 특징 인식"},{"@type":"PropertyValue","name":"정확도","value":"문장 정확도 95%"}]
{"id":1631,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"534시간 대만 사투리 보통화 자연 대화 스마트폰 수집 음성 데이터","datazy":[{"title":"형식","desc":"형식","content":"16kHz, 16bit, 무압축 WAV, 모노"},{"title":"녹음 환경","desc":"녹음 환경","content":"비교적 조용한 실내 환경, 할덤 없음"},{"title":"녹음 내용","desc":"녹음 내용","content":"주제 목록을 제공하여 화자가 자신이 익숙한 여러 주제를 선정하여 대화의 자연스러운 흐름을 보장하며, 각 주제별로 대화를 진행하고 녹음함"},{"title":"인원","desc":"인원","content":"총 480명의 대만 지역 인원이 참여하였으며, 남녀 비율은 균형을 이루고 있습니다."},{"title":"라벨링 특성","desc":"라벨링 특성","content":"유효한 단문을 발췌하여 라벨링하며, 라벨링 결과에는 유효 단문의 시작 및 종료 시점, 화자 식별, 텍스트 내용 및 잡음 라벨링을 포함"},{"title":"국가","desc":"국가","content":"중국"},{"title":"언어","desc":"언어","content":"보통화"},{"title":"적용 장면","desc":"적용 장면","content":"음성 인식, 음성 특징 인식"},{"title":"정확도","desc":"정확도","content":"문장 정확도 95%"}],"datatag":"Accent Mandarin,Taiwanese,Spontaneous Dialogue","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"534시간 분량의 대만 억양 표준 중국어 자연 대화 스마트폰 녹음 음성 데이터는 30개 이상의 일반적인 주제를 바탕으로 시뮬레이션 녹음을 진행하였습니다. 이 데이터셋은 텍스트 내용, 문장 타임스탬프, 화자 정보, 성별 등 다양한 속성이 라벨링되어 있으며, 대만 지역 출신 화자들이 참여했습니다. 높은 정확도로 음성 인식 관련 연구 및 응용에 유용하며, 여러 AI 기업의 검증을 통해 실제 세계의 다양성에 직면했을 때 우수한 성능을 발휘하는 데 도움이 됨이 입증되었습니다. 데이터 수집, 저장 및 사용 과정에서 사용자 프라이버시와 법적 권리를 보호하기 위해 GDPR, CCPA, PIPL을 철저히 준수하고 있습니다.","dataexampl":null,"datakeyword":["사투리 보통화"," 대만"," 자연 대화"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"534 Hours - Taiwanese Accent Mandarin Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[]
534시간 대만 사투리 보통화 자연 대화 스마트폰 수집 음성 데이터
사투리 보통화
대만
자연 대화
534시간 분량의 대만 억양 표준 중국어 자연 대화 스마트폰 녹음 음성 데이터는 30개 이상의 일반적인 주제를 바탕으로 시뮬레이션 녹음을 진행하였습니다. 이 데이터셋은 텍스트 내용, 문장 타임스탬프, 화자 정보, 성별 등 다양한 속성이 라벨링되어 있으며, 대만 지역 출신 화자들이 참여했습니다. 높은 정확도로 음성 인식 관련 연구 및 응용에 유용하며, 여러 AI 기업의 검증을 통해 실제 세계의 다양성에 직면했을 때 우수한 성능을 발휘하는 데 도움이 됨이 입증되었습니다. 데이터 수집, 저장 및 사용 과정에서 사용자 프라이버시와 법적 권리를 보호하기 위해 GDPR, CCPA, PIPL을 철저히 준수하고 있습니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
![사양]()
사양
형식
16kHz, 16bit, 무압축 WAV, 모노
녹음 환경
비교적 조용한 실내 환경, 할덤 없음
녹음 내용
주제 목록을 제공하여 화자가 자신이 익숙한 여러 주제를 선정하여 대화의 자연스러운 흐름을 보장하며, 각 주제별로 대화를 진행하고 녹음함
인원
총 480명의 대만 지역 인원이 참여하였으며, 남녀 비율은 균형을 이루고 있습니다.
라벨링 특성
유효한 단문을 발췌하여 라벨링하며, 라벨링 결과에는 유효 단문의 시작 및 종료 시점, 화자 식별, 텍스트 내용 및 잡음 라벨링을 포함
![샘플]()
샘플
![추천 데이터셋]()
추천 데이터셋
09a53cca-7735-42b7-88a3-70dc2f730d9c