[{"@type":"PropertyValue","name":"형식","value":"16kHz, 16bit, wav, 모노"},{"@type":"PropertyValue","name":"녹음 환경","value":"저소음"},{"@type":"PropertyValue","name":"국가","value":"중국"},{"@type":"PropertyValue","name":"언어 지역 코드","value":"kk-CN"},{"@type":"PropertyValue","name":"언어","value":"카자흐어"},{"@type":"PropertyValue","name":"라벨링 특성","value":"텍스트 내용, 문장 타임스탬프, 화자 식별자, 성별 라벨링"},{"@type":"PropertyValue","name":"정확도","value":"문장 정확도 95%"}]
{"id":1119,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"557시간 카자흐어 음성 데이터_구어체","datazy":[{"title":"형식","desc":"형식","content":"16kHz, 16bit, wav, 모노"},{"title":"녹음 환경","desc":"녹음 환경","content":"저소음"},{"title":"국가","desc":"국가","content":"중국"},{"title":"언어 지역 코드","desc":"언어 지역 코드","content":"kk-CN"},{"title":"언어","desc":"언어","content":"카자흐어"},{"title":"라벨링 특성","desc":"라벨링 특성","content":"텍스트 내용, 문장 타임스탬프, 화자 식별자, 성별 라벨링"},{"title":"정확도","desc":"정확도","content":"문장 정확도 95%"}],"datatag":"Kazakh,Colloquial Video,Conversation","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"카자흐어 음성 데이터_구어체는 실제 세계의 상호작용 상황을 반영합니다. 본 데이터셋은 텍스트 콘텐츠, 화자 신원, 성별 등 다양한 속성이 라벨링되어 있으며, 서로 다른 지역과 문화적 배경을 가진 카자흐족 화자가 녹음하였습니다. 높은 정확도와 사용 편의성을 자랑하며, 음성 인식 관련 연구 및 응용에 풍부한 리소스를 제공합니다. 실제 환경의 다양성에 직면한 모델이 우수한 성능을 발휘할 수 있도록 지원합니다. 데이터 수집, 저장 및 사용 과정에서 개인정보 보호법 및 관련 규정을 엄격히 준수하며, 모든 데이터는 GDPR, CCPA, PIPL을 따릅니다.","dataexampl":null,"datakeyword":["카자흐어"," 구어체 영상"," 텍스트 주석"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"535 Hours - Kazakh Spontaneous Speech Data","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[]
557시간 카자흐어 음성 데이터_구어체
카자흐어
구어체 영상
텍스트 주석
카자흐어 음성 데이터_구어체는 실제 세계의 상호작용 상황을 반영합니다. 본 데이터셋은 텍스트 콘텐츠, 화자 신원, 성별 등 다양한 속성이 라벨링되어 있으며, 서로 다른 지역과 문화적 배경을 가진 카자흐족 화자가 녹음하였습니다. 높은 정확도와 사용 편의성을 자랑하며, 음성 인식 관련 연구 및 응용에 풍부한 리소스를 제공합니다. 실제 환경의 다양성에 직면한 모델이 우수한 성능을 발휘할 수 있도록 지원합니다. 데이터 수집, 저장 및 사용 과정에서 개인정보 보호법 및 관련 규정을 엄격히 준수하며, 모든 데이터는 GDPR, CCPA, PIPL을 따릅니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
![사양]()
사양
라벨링 특성
텍스트 내용, 문장 타임스탬프, 화자 식별자, 성별 라벨링
![샘플]()
샘플
![추천 데이터셋]()
추천 데이터셋
155552b7-1fb1-4b0b-a92b-00f1987c5526