en

Please fill in your name

Mobile phone format error

전화번호를 입력해 주세요

회사 이름을 입력해 주세요

회사 이메일을 입력해 주세요

데이터 요구사항을 입력해 주세요

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

데이터 요구사항은 5자 이상이며 숫자만으로 구성될 수 없습니다

373시간 다리어 음성 데이터 대화(스마트폰)

자동 음성 인식
오디오
대화
음성 인식 학습용 데이터셋
다리어

달리어 음성 데이터 대화(스마트폰)로, 약 20가지 흔한 주제를 기반으로 시뮬레이션 녹음되었습니다. 본 데이터셋은 텍스트 내용, 문장 타임스탬프, 화자 신원, 성별 등 다양한 속성으로 라벨링되었으며, 504명의 다양한 지역과 문화 배경을 가진 아프가니스탄 현지인이 녹음하였습니다. 정확도가 높아 음성 인식 관련 연구 및 응용에 풍부한 자원을 제공합니다. 여러 AI 기업의 검증을 거쳐, 모델이 실제 세계의 다양성에 대응하는 데 큰 도움이 됩니다. 저희는 데이터 보호법과 개인정보 규정을 엄격히 준수하며, 데이터 수집, 저장 및 사용 과정에서 사용자 개인정보와 합법 권리를 철저히 보호합니다. 모든 데이터는 GDPR, CCPA, PIPL을 준수합니다.

유료 데이터셋
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
사양사양
형식
16kHz, 16bit, WAV, 모노
내용 분류
녹음 참여자는 주어진 주제 목록 중 익숙한 몇 가지를 선택하여, 각각 자연스럽고 유창한 대화를 녹음함
녹음 조건
비교적 조용한 실내 환경, 할덤 없음
녹음 장비
안드로이드 폰, 아이폰
화자 정보
총 504명의 아프가니스탄 현지인이 참여했으며, 이 중 남성은 83%, 여성은 17%입니다.
국가
아프가니스탄
언어
다리어
라벨링 특성
텍스트 내용 라벨링, 문장 타임스탬프, 화자 식별, 성별
정확도
단어 정확도 95%
샘플 샘플
  • Audio

    یا انسان ها ره کمک کنه نام شه ماشین می مانیم

  • Audio

    یا ای که از توته چوب گرفته

  • Audio

    موتر یکی طبق که گفتیم یکی از نوع ماشین است

  • Audio

    هر چیزی که

  • Audio

    تا هواپیما های پیشرفته

추천 데이터셋추천 데이터셋
특별한 요청 사항을 알려주세요

제출함으로써,개인정보 보호 정책에 동의합니다

58aacd4c-6a3e-4005-af7d-ebad6a23f370

9886fe74-b334-4365-9e06-d3a873adfa8c