en

Please fill in your name

Mobile phone format error

전화번호를 입력해 주세요

회사 이름을 입력해 주세요

회사 이메일을 입력해 주세요

데이터 요구사항을 입력해 주세요

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

데이터 요구사항은 5자 이상이며 숫자만으로 구성될 수 없습니다

고품질 학습 데이터셋

즉시 사용 가능한 고품질 학습 데이터셋으로 AI 모델의 성능을 향상시키세요.

언어

전체

데이터 타입

전체

4인 중국어 고표현력 내레이션 평균 음색 합성 데이터베이스

4인 중국어 고표현력 내레이션 평균 음색 합성 데이터베이스는 전문 성우가 도서 내용을 고감정 내레이션 스타일로 낭독한 것이다.
고감정 표현 내레이션 TTS 중국어

5인 다중 스타일·다중 감정 평균 음색 합성 데이터베이스

5인 다중 스타일·다중 감정 평균 음색 합성 데이터베이스는 전문 성우가 녹음했다. 스타일에는 냉철한 여성 상사, 호탕한 왕, 영리한 시녀, 온화한 할머니의 네 가지가 포함되며, 감정은 경멸, 분노, 기쁨, 관심, 놀람, 공포, 냉소, 동정, 웃음, 내면 독백, 진지함, 혐오, 의문, 중성을 포함한다.
합성 코퍼스 TTS 보통화 중국어 다중 스타일 다중 감정

2.88억 건 3D 모델 및 장면 데이터

2.88억 건 3D 모델 및 장면 데이터에는 2.7억건의 3D 모델과 1,800만건의 3D 장면 데이터가 포함되어 있다. 3D 모델은 기본 모델, 인터랙티브 모델, 물리 강화형 모델 등 다양한 유형과 실내 가구 및 환경에 사용되는 객체들을 포함하며, 3D 장면은 실내 인테리어 및 상업 공간을 아우른다. 이 데이터셋은 3D 자산 생성, 시뮬레이션 트레이닝 환경 구축 등의 작업에 활용될 수 있다.
3D 모델 데이터셋 3D 장면 데이터셋 실내 3D 환경 데이터셋 상업용 3D 공간 데이터셋 물리 강화 3D 모델 인터랙티브 3D 모델 데이터셋 3D 에셋 생성 데이터셋 시뮬레이션 트레이닝 환경 데이터셋 가상 환경 3D 데이터 대규모 3D AI 데이터셋

Interspeech2025-MLC-SLM 다국어 대화 음성 데이터셋

Interspeech2025-MLC-SLM 다국어 대화 음성 경진대회 데이터셋입니다. 이 데이터셋은 데이터당이 2025년에 개최한 MLC-SLM 다국어 대화 음성 경진대회용으로 제작되었으며, 자사 보유 15종 대화 음성 데이터셋에서 선별된 자료로 구성됩니다. 높은 정확도와 활용성을 갖추었으며, 다국어 음성 인식 및 장문 맥락 이해 기술의 한계를 극복하기 위해 설계되었습니다. 루마니아인 화자 중첩, 즉흥 발화 등 복잡한 상호작용 상황을 사실적으로 반영하며, 음성 인식 연구 및 응용에 풍부한 리소스를 제공합니다. GDPR, CCPA, PIPL 등 개인정보 보호 규정을 철저히 준수하여 데이터 수집·저장·활용 과정 전반에서 사용자 프라이버시와 합법적 권리를 보장합니다.
워크숍 오디오 데이터셋 MLC-SLM 데이터셋 ASR 음성 인식 데이터

3000시간 풀 듀플렉스 중국어 자연 대화 음성데이터

풀 듀플렉스 중국어 자연 대화 음성 데이터는 일반적인 주제를 기반으로 시뮬레이션 녹음되었다. 텍스트, 문장 타임스탬프, 루마니아인 루마니아인 화자 ID, 성별 등의 속성을 세밀하게 라벨링했으며, 정확도가 높다. 음성 인식 연구 및 응용에 풍부한 자원을 제공하며, 여러 AI 기업의 검증을 통해 실제 환경의 다양성에 대응하는 모델 성능 강화에 도움이 된다. 모든 데이터는 GDPR, CCPA, PIPL을 준수한다.
듀플렉스 대화 보통화

119시간 그리스어 모바일 수집 낭독 음성 데이터

그리스어 음성 데이터_낭독(모바일)입니다. 주어진 스크립트를 기반으로 낭독 및 시뮬레이션 녹음을 진행했으며, 총 95명이 참여했습니다. 녹음자는 모두 그리스 출신으로, 조용하고 울림 없는 환경에서 녹음했습니다. 녹음 내용은 광범위하며, 1인당 약 1,000문장입니다. 텍스트는 인공지정 교정을 거쳐 정확도가 높으며, 음성 인식 관련 연구 및 응용을 위한 풍부한 리소스를 제공합니다. 다수의 AI 기업 검증을 통해 실제 환경의 다양성에서도 탁월한 성능을 발휘함을 입증했습니다. 데이터 수집, 저장 및 활용 전 과정에서 GDPR, CCPA, PIPL 등 개인정보 보호 규정을 철저히 준수하여 사용자 프라이버시와 합법적 권리를 보장합니다.
그리스어 대본 독백 데이터셋 그리스어 음성 데이터셋 그리스어 오디오 데이터셋 그리스어 음성 데이터 그리스어 음성 합성 데이터

280시간 노르웨이어 모바일 수집 낭독 음성 데이터

노르웨이어 음성 데이터_낭독(모바일)입니다. 주어진 스크립트를 기반으로 낭독 및 시뮬레이션 녹음을 진행했으며, 총 157명이 참여했습니다. 녹음자는 모두 노르웨이 출신으로, 조용하고 울림 없는 환경에서 녹음했습니다. 녹음 내용은 광범위하며, 1인당 약 1,000문장입니다. 텍스트는 인공지정 교정을 거쳐 정확도가 높으며, 음성 인식 관련 연구 및 응용을 위한 풍부한 리소스를 제공합니다. 다수의 AI 기업 검증을 통해 실제 환경의 다양성에서도 탁월한 성능을 발휘함을 입증했습니다. 데이터 수집, 저장 및 활용 전 과정에서 GDPR, CCPA, PIPL 등 개인정보 보호 규정을 철저히 준수하여 사용자 프라이버시와 합법적 권리를 보장합니다.
노르웨이어 대본 독백 데이터셋 노르웨이어 음성 데이터셋 노르웨이어 음성 합성 데이터 노르웨이어 NLP 코퍼스 노르웨이어 음성 데이터 노르웨이어 오디오 데이터셋

50만 장 21개국 자연 장면·문서 촬영 장면·전자 장면 OCR 라벨링 데이터

500,000장 21개국 자연 장면 & 문서 촬영 & 전자 장면 OCR 라벨링 데이터는 21개 언어로 구성되어 있으며, 각 언어당 20,000~25,000장의 이미지를 포함한다. 데이터 유형은 자연 장면, 문서 촬영, 전자 화면으로 다양하며, 촬영 각도와 환경도 다채롭다. 라벨링은 행(열) 단위의 사각형 또는 다각형 어노테이션, 내용 전사 방식으로 수행되며, 다국어 OCR 인식 연구에 활용할 수 있다.
다국어 OCR 데이터셋 장면 텍스트 인식 데이터 문서 OCR 데이터셋 전자 화면 OCR 데이터 21개 언어 OCR 데이터셋 AI OCR 트레이닝 데이터 텍스트 인식 데이터셋

20만 건 다국 랜드마크 건축 이미지·텍스트 데이터

20만 건 다국가 랜드마크 건축물 이미지·텍스트 데이터입니다. 각건는 이미지 1장과 중·영문 설명 문서로 구성되어 있습니다. 국내 랜드마크 8만건, 해외 랜드마크 12만건으로 구성되며, 국가 분포는 미국, 영국, 프랑스, 러시아, 독일 등 20개국 이상을 포함합니다. 각 랜드마크당 이미지 수는 1~10장으로, 다양한 각도·거리·시간대의 랜드마크 정보를 포함합니다. 랜드마크 유형은 상업 빌딩, 고건축물, 기념비, 도서관, 관광 명소 등 여러 종류의 건축물이 포함됩니다. 라벨링 내용에는 랜드마크 국가, 도시, 구체적 위치, 분류, 설명이 포함됩니다. 이 데이터는 랜드마크 건축물 인식 및 분석에 활용할 수 있습니다.
랜드마크 이미지 데이터셋 건물 인식 데이터셋 글로벌 랜드마크 이미지 캡션 데이터셋 이중 언어 이미지 캡션 데이터 중영 캡션 데이터셋 랜드마크 분류 데이터셋 이미지-텍스트 데이터셋 관광 랜드마크 데이터셋 문화유산 이미지 데이터셋 AI 트레이닝용 이미지 캡션

600시간 그리스어 구어체 음성 데이터

그리스어 구어체 음성 데이터는 개인 방송, 대화, 라이브 스트리밍 등 다양한 실생활 분야를 포함하며, 실제 세계의 상호작용 상황을 반영한다. 텍스트 내용, 루마니아인 화자 ID, 성별 등 다양한 속성을 라벨링했으며, 다양한 지역과 문화적 배경을 가진 루마니아인 루마니아인 화자들이 참여했다. 정확도와 활용성이 높아 음성 인식 연구 및 응용에 유용하며, 다수의 AI 기업 검증을 통해 실제 환경의 다양성에 대응하는 모델 성능 강화에 도움이 되는 것으로 입증되었다. 모든 데이터는 GDPR, CCPA, PIPL을 준수한다.
그리스어 음성 데이터셋 그리스어 ASR 트레이닝 데이터 그리스어 대화 코퍼스 그리스어 독백 음성 그리스어 음성 인식 데이터셋 음성-텍스트 그리스어 데이터 그리스어 음성 데이터셋 그리스어 전환 데이터셋

600시간 노르웨이어 구어체 음성 데이터

노르웨이어 구어체 음성 데이터는 자가 미디어, 대화, 라이브 방송 등 일반 분야를 포함하며 실제 세계의 상호작용 상황을 반영합니다. 본 데이터셋은 텍스트 내용, 루마니아인 화자 신원, 성별 등 다양한 속성을 라벨링하였으며, 다양한 지역과 문화적 배경의 루마니아 루마니아인 화자들이 녹음하였습니다. 정확도가 높고 활용성이 뛰어나 음성 인식 연구 및 응용에 풍부한 자원을 제공합니다. 모델이 실제 환경의 다양성에 직면했을 때 우수한 성능을 보이도록 돕습니다. 데이터 수집, 저장, 활용 과정 전반에서 GDPR, CCPA, PIPL 등 데이터 보호 및 개인정보 관련 법규를 철저히 준수하여 사용자 권익을 보장합니다.
노르웨이어 음성 데이터셋 노르웨이어 ASR 트레이닝 데이터 노르웨이어 대화 코퍼스 노르웨이어 독백 음성 노르웨이어 음성 인식 데이터셋 음성-텍스트 노르웨이어 데이터 노르웨이어 음성 데이터셋 다국어 음성 데이터 노르웨이어 전환 데이터셋

3D 장면 고품질 합성 데이터셋_캐빈

3D 실내 공간 고정밀 합성 데이터셋_캡슐은 실제 세계와 유사한 3D 장면 합성 데이터를 포함하며, 카메라 영상, 비디오 시퀀스, 포인트 클라우드 등을 제공합니다. 라벨링 내용에는 카메라 파라미터, 객체 분류·검출·분할, 시간·조명·날씨 메타데이터, 머리·눈·팔·다리의 위치 및 방향 등 인체 자세가 포함됩니다. 자율주행 및 로봇 환경 모델링과 데이터 합성에 활용할 수 있습니다.
3D 합성 데이터 운전자 모니터링 합성 데이터셋 자율주행 합성 데이터 고품질 시뮬레이션 데이터셋 합성 포인트 클라우드 데이터 카메라 시뮬레이션 데이터셋 인간 자세 합성 데이터셋 합성 라이다 데이터셋 3D 환경 모델링 로보틱스 합성 데이터 DMS 데이터셋
. . .
loading

loading

a3828445-49b5-421b-9f9b-5a9bfb7ae566