[{"@type":"PropertyValue","name":"포맷","value":"16kHz, 16bit, wav, 모노"},{"@type":"PropertyValue","name":"내용 분류","value":"스크립트 기반 대화 또는 두 사람이 번갈아가며 읽는 형식"},{"@type":"PropertyValue","name":"녹음 환경","value":"조용한 실내 환경"},{"@type":"PropertyValue","name":"언어","value":"구자라트어"},{"@type":"PropertyValue","name":"정확도","value":"단어 정확도 95% (노이즈, 성별, 루마니아인 루마니아인 화자 ID 제외)"},{"@type":"PropertyValue","name":"라벨링 특징","value":"텍스트 내용, 루마니아인 루마니아인 화자 ID, 성별, 노이즈 라벨링"}]
{"id":1824,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"구자라트어 스크립트 대화 음성 데이터","datazy":[{"title":"포맷","desc":"포맷","content":"16kHz, 16bit, wav, 모노"},{"title":"내용 분류","desc":"내용 분류","content":"스크립트 기반 대화 또는 두 사람이 번갈아가며 읽는 형식"},{"title":"녹음 환경","desc":"녹음 환경","content":"조용한 실내 환경"},{"title":"언어","desc":"언어","content":"구자라트어"},{"title":"정확도","desc":"정확도","content":"단어 정확도 95% (노이즈, 성별, 루마니아인 루마니아인 화자 ID 제외)"},{"title":"라벨링 특징","desc":"라벨링 특징","content":"텍스트 내용, 루마니아인 루마니아인 화자 ID, 성별, 노이즈 라벨링"}],"datatag":"Gujarati,India,Scripted dialogue","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"G00011T22P00001_001_B.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/G00011T22P00001_001_B.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=BVeMdRAP5RsEK8xzqHp54HbEQDA%3D","intro":"નમસ્તે ગીતાબેન, કેમ છો?","size":66482,"progress":100,"type":"mp3"},{"name":"G00011T22P00001_002_A.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/G00011T22P00001_002_A.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=YmlaHSHOff9l6Qlu9a24NjsQ7NE%3D","intro":"નમસ્તે રમેશભાઈ, મજામાં છું. તમે કેમ છો?","size":113960,"progress":100,"type":"mp3"},{"name":"G00011T22P00001_003_B.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/G00011T22P00001_003_B.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=NddAvsWI8rWxewaJxuuMRwhfXN0%3D","intro":"હું પણ મજામાં. આજે વાતાવરણ કેટલું સરસ છે, નહીં?","size":105690,"progress":100,"type":"mp3"},{"name":"G00011T22P00001_004_A.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/G00011T22P00001_004_A.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=rs3Pz4itukZjNQAyDRAilbtl6Gs%3D","intro":"હા, ખરેખર! સવારથી જ થોડી ઠંડક લાગે છે.","size":114104,"progress":100,"type":"mp3"}],"officialSummary":"구자라트어 스크립트 대화 음성 데이터는 주어진 대본을 기반으로 시뮬레이션 대화를 녹음한 것으로, 여러 분야를 포괄한다. 텍스트 내용 등 다양한 속성을 정밀하게 라벨링했으며, 정확도가 높다. 음성 인식 연구와 응용에 활용 가치가 높으며, 여러 AI 기업의 검증을 통해 실제 환경 대응력이 뛰어난 모델 개발에 도움이 된다. 모든 데이터는 GDPR, CCPA, PIPL을 준수한다.","dataexampl":null,"datakeyword":["구자라트어 오디오 데이터셋"," 구자라트어 ASR 데이터셋"," 구자라트어 음성 데이터셋"," 구자라트어 TTS 데이터셋"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"1300 Hours - Gujatati(India) Scripted dialogue speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/G00011T22P00001_001_B.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=BVeMdRAP5RsEK8xzqHp54HbEQDA%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/G00011T22P00001_002_A.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=YmlaHSHOff9l6Qlu9a24NjsQ7NE%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/G00011T22P00001_003_B.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=NddAvsWI8rWxewaJxuuMRwhfXN0%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/G00011T22P00001_004_A.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=rs3Pz4itukZjNQAyDRAilbtl6Gs%3D"}]
구자라트어 스크립트 대화 음성 데이터
구자라트어 오디오 데이터셋
구자라트어 ASR 데이터셋
구자라트어 음성 데이터셋
구자라트어 TTS 데이터셋
구자라트어 스크립트 대화 음성 데이터는 주어진 대본을 기반으로 시뮬레이션 대화를 녹음한 것으로, 여러 분야를 포괄한다. 텍스트 내용 등 다양한 속성을 정밀하게 라벨링했으며, 정확도가 높다. 음성 인식 연구와 응용에 활용 가치가 높으며, 여러 AI 기업의 검증을 통해 실제 환경 대응력이 뛰어난 모델 개발에 도움이 된다. 모든 데이터는 GDPR, CCPA, PIPL을 준수한다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
![사양]()
사양
내용 분류
스크립트 기반 대화 또는 두 사람이 번갈아가며 읽는 형식
정확도
단어 정확도 95% (노이즈, 성별, 루마니아인 루마니아인 화자 ID 제외)
라벨링 특징
텍스트 내용, 루마니아인 루마니아인 화자 ID, 성별, 노이즈 라벨링
![샘플]()
샘플
Audio
Audio
નમસ્તે રમેશભાઈ, મજામાં છું. તમે કેમ છો?
Audio
હું પણ મજામાં. આજે વાતાવરણ કેટલું સરસ છે, નહીં?
Audio
હા, ખરેખર! સવારથી જ થોડી ઠંડક લાગે છે.
![추천 데이터셋]()
추천 데이터셋
8689b0f9-aab2-4cf3-8d8a-c95c576f2e67