[{"@type":"PropertyValue","name":"형식","value":"16kHz, 16bit, 무압축 WAV, 모노"},{"@type":"PropertyValue","name":"내용 분류","value":"녹음자가 자유롭게 대화하며 자연스럽고 원활한 대화를 녹음"},{"@type":"PropertyValue","name":"녹음 조건","value":"비교적 조용한 실내 환경, 할덤 없음"},{"@type":"PropertyValue","name":"녹음 장비","value":"안드로이드 폰, 아이폰"},{"@type":"PropertyValue","name":"화자 정보","value":"총 654명, 이 중 남성 183명, 여성 471명"},{"@type":"PropertyValue","name":"국가","value":"태국"},{"@type":"PropertyValue","name":"언어","value":"태국어"},{"@type":"PropertyValue","name":"라벨링 특성","value":"텍스트 내용 라벨링, 문장 타임스탬프, 화자 식별, 성별"},{"@type":"PropertyValue","name":"정확도","value":"단어 정확도 98%"}]
{"id":1594,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"211시간 태국어 분리 트랙 자연 대화 스마트폰 수집 음성 데이터","datazy":[{"title":"형식","desc":"형식","content":"16kHz, 16bit, 무압축 WAV, 모노"},{"title":"내용 분류","desc":"내용 분류","content":"녹음자가 자유롭게 대화하며 자연스럽고 원활한 대화를 녹음"},{"title":"녹음 조건","desc":"녹음 조건","content":"비교적 조용한 실내 환경, 할덤 없음"},{"title":"녹음 장비","desc":"녹음 장비","content":"안드로이드 폰, 아이폰"},{"title":"화자 정보","desc":"화자 정보","content":"총 654명, 이 중 남성 183명, 여성 471명"},{"title":"국가","desc":"국가","content":"태국"},{"title":"언어","desc":"언어","content":"태국어"},{"title":"라벨링 특성","desc":"라벨링 특성","content":"텍스트 내용 라벨링, 문장 타임스탬프, 화자 식별, 성별"},{"title":"정확도","desc":"정확도","content":"단어 정확도 98%"}],"datatag":"thai,Dialogue ,full duplex","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"0001_001_A-1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_A-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=bWqqa7r0%2BO1wQKcLI5kYoiDMOGE%3D","intro":"คนหนีไปเติมต่าง นอกต่างประเทศมา มาเลถูกกว่าเท่าตัว","size":222828,"progress":100,"type":"mp3"},{"name":"0001_001_A-3.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_A-3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=HVBcGXkQEAxfoOdM40GKFaiGH10%3D","intro":"มึงขับแก๊สนั่นแก๊สหรือว่ารถน้ำมันรถไฟฟ้า","size":174764,"progress":100,"type":"mp3"},{"name":"0001_001_A-6.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_A-6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=3gLRPgSTnWGSTLPtvFlGbdX91zA%3D","intro":"มึงต้องไปเติมมาเลเซียน้ำมันไม่แพง","size":143692,"progress":100,"type":"mp3"},{"name":"0001_001_B-1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_B-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=jCQM%2BMSDHXfHWOE5MqxTDWXXyKQ%3D","intro":"อือน้ำมันแพงด้วย","size":146796,"progress":100,"type":"mp3"},{"name":"0001_001_B-10.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_B-10.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=f83CovJuK5JqYXe0hD7czI0l%2FRw%3D","intro":"ยังทำถนนยังไม่เสร็จอีกเหรอนี่","size":95628,"progress":100,"type":"mp3"}],"officialSummary":"태국어 채널 분리 자연 대화 음성 데이터(스마트폰 녹음)는 일반적인 주제를 기반으로 시뮬레이션 녹음을 진행하였으며, 텍스트 내용, 문장 타임스탬프, 화자 정보, 성별 등 다양한 속성을 라벨링하였습니다. 654명의 서로 다른 지역과 문화적 배경을 지닌 태국 현지인이 녹음에 참여하였습니다. 높은 정확도로 음성 인식 관련 연구 및 응용에 유용하며, 다수의 AI 기업을 통해 실제 환경에서의 다양성 대응에 효과적임이 검증되었습니다. 데이터 수집, 저장, 활용 전 과정에서 사용자 개인정보와 권리를 보호하기 위해 GDPR, CCPA, PIPL 등 관련 법규를 철저히 준수하고 있습니다.","dataexampl":null,"datakeyword":["태국어","대화"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Data Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES,JP\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"211 Hours - Thai(Thailand) Full-Duplex Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_A-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=bWqqa7r0%2BO1wQKcLI5kYoiDMOGE%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_A-3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=HVBcGXkQEAxfoOdM40GKFaiGH10%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_A-6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=3gLRPgSTnWGSTLPtvFlGbdX91zA%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_B-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=jCQM%2BMSDHXfHWOE5MqxTDWXXyKQ%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_B-10.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=f83CovJuK5JqYXe0hD7czI0l%2FRw%3D"}]
211시간 태국어 분리 트랙 자연 대화 스마트폰 수집 음성 데이터
태국어
대화
태국어 채널 분리 자연 대화 음성 데이터(스마트폰 녹음)는 일반적인 주제를 기반으로 시뮬레이션 녹음을 진행하였으며, 텍스트 내용, 문장 타임스탬프, 화자 정보, 성별 등 다양한 속성을 라벨링하였습니다. 654명의 서로 다른 지역과 문화적 배경을 지닌 태국 현지인이 녹음에 참여하였습니다. 높은 정확도로 음성 인식 관련 연구 및 응용에 유용하며, 다수의 AI 기업을 통해 실제 환경에서의 다양성 대응에 효과적임이 검증되었습니다. 데이터 수집, 저장, 활용 전 과정에서 사용자 개인정보와 권리를 보호하기 위해 GDPR, CCPA, PIPL 등 관련 법규를 철저히 준수하고 있습니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
![사양]()
사양
형식
16kHz, 16bit, 무압축 WAV, 모노
내용 분류
녹음자가 자유롭게 대화하며 자연스럽고 원활한 대화를 녹음
녹음 조건
비교적 조용한 실내 환경, 할덤 없음
화자 정보
총 654명, 이 중 남성 183명, 여성 471명
라벨링 특성
텍스트 내용 라벨링, 문장 타임스탬프, 화자 식별, 성별
![샘플]()
샘플
Audio
คนหนีไปเติมต่าง นอกต่างประเทศมา มาเลถูกกว่าเท่าตัว
Audio
มึงขับแก๊สนั่นแก๊สหรือว่ารถน้ำมันรถไฟฟ้า
Audio
มึงต้องไปเติมมาเลเซียน้ำมันไม่แพง
Audio
Audio
ยังทำถนนยังไม่เสร็จอีกเหรอนี่
![추천 데이터셋]()
추천 데이터셋
b455c741-41c7-41d1-8556-44f3087aab6e