{"id":954,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"1,044시간 브라질 포르투갈어 음성 데이터_낭독(모바일)","datazy":[{"title":"형식","desc":"형식","content":"16kHz, 16bit, 비압축 wav, 모노"},{"title":"내용 분류","desc":"내용 분류","content":"구어 클래스;뉴스 클래스;대화형 클래스;홈 커맨드 클래스;차량 내 커맨드 클래스;디지털 클래스"},{"title":"녹음 조건","desc":"녹음 조건","content":"상대적으로 조용한 실내, 울림 없음"},{"title":"녹음 장비","desc":"녹음 장비","content":"안드로이드 폰, 아이폰"},{"title":"화자 정보","desc":"화자 정보","content":"2,038명;남성 비율 47%, 여성 비율 53%;16~25세 47%, 26~45세 48%, 46~64세 5%;"},{"title":"국가","desc":"국가","content":"브라질"},{"title":"언어 지역 코드","desc":"언어 지역 코드","content":"pt-BR"},{"title":"언어","desc":"언어","content":"포르투갈어"},{"title":"라벨링 특성","desc":"라벨링 특성","content":"텍스트 내용 라벨링"},{"title":"정확도","desc":"정확도","content":"문장 정확도 95%"}],"datatag":"Portuguese,Brazil,Mobile Phone,Reading,Scripted Monologue","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY181231015_demo1721815200169/G00798S3274.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY181231015_demo1721815200169/G00798S3274.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ndT%2BlzuKRvdfWH2gRjG3DLhlyYM%3D","intro":"Porque Douradoquara é tão famoso para os viajantes","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY181231015_demo1721815200169/G00798S2138.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY181231015_demo1721815200169/G00798S2138.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ffquoPKrRXHjuHNwgbvspbF%2Fsw4%3D","intro":"Ao chegar sentou-se na cama abaixo de pôsteres de Dirk Nowitzki e Porzingis","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY181231015_demo1721815200169/G40223S0449.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY181231015_demo1721815200169/G40223S0449.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=AcUnmdokFnx2fGE9Whi8cOzXL3I%3D","intro":"quatrocentos e quarenta e um mil ducentos e trinta e dois reais","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY181231015_demo1721815200169/G10314S0237.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY181231015_demo1721815200169/G10314S0237.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=HPLeRUVU1O5R02kR7hexJR1htvQ%3D","intro":"Na comunicação ela cita artigos das leis russas que apontam para punição quanto à humilhação ou insulto.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY181231015_demo1721815200169/G00180S0002.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY181231015_demo1721815200169/G00180S0002.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=LuAJRe%2BAoOvI5rE%2B%2Fqa938ACsLs%3D","intro":"Joy nós estamos casados há vinte anos.","size":0,"progress":100,"type":"mp3"}],"officialSummary":"브라질 포르투갈어 음성 데이터_낭독(모바일), 주어진 스크립트를 기반으로 낭독 및 모의 녹음하였으며, 일반, 대화형, 차량 내, 홈 등 다양한 카테고리를 포함합니다. 본 데이터셋은 텍스트 내용 등 여러 속성이 라벨링되어 있으며, 2,038명의 다양한 지역과 문화적 배경을 가진 브라질 원어민이 참여해 녹음했습니다. 발음은 정통하며, 텍스트는 인력 교정을 거쳐 정확도가 높습니다. 음성 인식 관련 연구 및 응용에 풍부한 자원을 제공하며, 다수 AI 기업 검증을 통해 실제 환경의 다양성에 강한 모델 개발에 기여함이 입증되었습니다. 데이터 수집, 저장 및 사용 과정에서 사용자 프라이버시와 법적 권리를 엄격히 준수하며, 모든 데이터는 GDPR, CCPA, PIPL 규정을 준수합니다.","dataexampl":null,"datakeyword":["포르투갈어 수집"," 포르투갈어 데이터"," 포르투갈어 식별"," ASR"," 음성-텍스트"," 텍스트-음성"," 브라질 대화 데이터"," 브라질 대화 데이터셋"," 브라질 대화 기록"," 브라질 대화 데이터"," 브라질 대화 데이터셋"," 포르투갈어 대화 데이터셋"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Data Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"1,044 Hours - Brazilian Portuguese Speech Data by Mobile Phone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
브라질 포르투갈어 음성 데이터_낭독(모바일), 주어진 스크립트를 기반으로 낭독 및 모의 녹음하였으며, 일반, 대화형, 차량 내, 홈 등 다양한 카테고리를 포함합니다. 본 데이터셋은 텍스트 내용 등 여러 속성이 라벨링되어 있으며, 2,038명의 다양한 지역과 문화적 배경을 가진 브라질 원어민이 참여해 녹음했습니다. 발음은 정통하며, 텍스트는 인력 교정을 거쳐 정확도가 높습니다. 음성 인식 관련 연구 및 응용에 풍부한 자원을 제공하며, 다수 AI 기업 검증을 통해 실제 환경의 다양성에 강한 모델 개발에 기여함이 입증되었습니다. 데이터 수집, 저장 및 사용 과정에서 사용자 프라이버시와 법적 권리를 엄격히 준수하며, 모든 데이터는 GDPR, CCPA, PIPL 규정을 준수합니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
사양
형식
16kHz, 16bit, 비압축 wav, 모노
내용 분류
구어 클래스;뉴스 클래스;대화형 클래스;홈 커맨드 클래스;차량 내 커맨드 클래스;디지털 클래스