ko

Please fill in your name

Mobile phone format error

전화번호를 입력해 주세요

회사 이름을 입력해 주세요

회사 이메일을 입력해 주세요

데이터 요구사항을 입력해 주세요

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

데이터 요구사항은 5자 이상이며 숫자만으로 구성될 수 없습니다

211시간 태국어 분리 트랙 자연 대화 스마트폰 수집 음성 데이터

태국어
대화

태국어 채널 분리 자연 대화 음성 데이터(스마트폰 녹음)는 일반적인 주제를 기반으로 시뮬레이션 녹음을 진행하였으며, 텍스트 내용, 문장 타임스탬프, 화자 정보, 성별 등 다양한 속성을 라벨링하였습니다. 654명의 서로 다른 지역과 문화적 배경을 지닌 태국 현지인이 녹음에 참여하였습니다. 높은 정확도로 음성 인식 관련 연구 및 응용에 유용하며, 다수의 AI 기업을 통해 실제 환경에서의 다양성 대응에 효과적임이 검증되었습니다. 데이터 수집, 저장, 활용 전 과정에서 사용자 개인정보와 권리를 보호하기 위해 GDPR, CCPA, PIPL 등 관련 법규를 철저히 준수하고 있습니다.

유료 데이터셋
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
사양사양
형식
16kHz, 16bit, 무압축 WAV, 모노
내용 분류
녹음자가 자유롭게 대화하며 자연스럽고 원활한 대화를 녹음
녹음 조건
비교적 조용한 실내 환경, 할덤 없음
녹음 장비
안드로이드 폰, 아이폰
화자 정보
총 654명, 이 중 남성 183명, 여성 471명
국가
태국
언어
태국어
라벨링 특성
텍스트 내용 라벨링, 문장 타임스탬프, 화자 식별, 성별
정확도
단어 정확도 98%
샘플 샘플
  • Audio

    คนหนีไปเติมต่าง นอกต่างประเทศมา มาเลถูกกว่าเท่าตัว

  • Audio

    มึงขับแก๊สนั่นแก๊สหรือว่ารถน้ำมันรถไฟฟ้า

  • Audio

    มึงต้องไปเติมมาเลเซียน้ำมันไม่แพง

  • Audio

    อือน้ำมันแพงด้วย

  • Audio

    ยังทำถนนยังไม่เสร็จอีกเหรอนี่

추천 데이터셋추천 데이터셋
특별한 요청 사항을 알려주세요

프로젝트 성숙도

초기 검토 단계 (구체적인 사양은 아직 없음)
목표는 명확하나 전문적인 가이드가 필요함
개발 또는 최적화 단계
명확한 데이터 사양을 보유한 데이터/라벨링 전문가 팀

제출함으로써,개인정보 보호 정책에 동의합니다

93ef7be2-c249-413f-b8ad-0577386259fa

b455c741-41c7-41d1-8556-44f3087aab6e