표준 데이터셋, Nexdata와 함께 경쟁력 있는 AI 배포 - Nexdata

ko

Please fill in your name

Mobile phone format error

전화번호를 입력해 주세요

회사 이름을 입력해 주세요

회사 이메일을 입력해 주세요

데이터 요구사항을 입력해 주세요

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

데이터 요구사항은 5자 이상이며 숫자만으로 구성될 수 없습니다

홈 > 모든 카테고리 데이터셋

2.88억 건 3D 모델 및 장면 데이터

2.88억 건 3D 모델 및 장면 데이터에는 2.7억건의 3D 모델과 1,800만건의 3D 장면 데이터가 포함되어 있다. 3D 모델은 기본 모델, 인터랙티브 모델, 물리 강화형 모델 등 다양한 유형과 실내 가구 및 환경에 사용되는 객체들을 포함하며, 3D 장면은 실내 인테리어 및 상업 공간을 아우른다. 이 데이터셋은 3D 자산 생성, 시뮬레이션 트레이닝 환경 구축 등의 작업에 활용될 수 있다.

3D 모델 데이터셋 3D 장면 데이터셋 실내 3D 환경 데이터셋 상업용 3D 공간 데이터셋 물리 강화 3D 모델 인터랙티브 3D 모델 데이터셋 3D 에셋 생성 데이터셋 시뮬레이션 트레이닝 환경 데이터셋 가상 환경 3D 데이터 대규모 3D AI 데이터셋

Interspeech2025-MLC-SLM 다국어 대화 음성 데이터셋

Interspeech2025-MLC-SLM 다국어 대화 음성 경진대회 데이터셋입니다. 이 데이터셋은 데이터당이 2025년에 개최한 MLC-SLM 다국어 대화 음성 경진대회용으로 제작되었으며, 자사 보유 15종 대화 음성 데이터셋에서 선별된 자료로 구성됩니다. 높은 정확도와 활용성을 갖추었으며, 다국어 음성 인식 및 장문 맥락 이해 기술의 한계를 극복하기 위해 설계되었습니다. 루마니아인 화자 중첩, 즉흥 발화 등 복잡한 상호작용 상황을 사실적으로 반영하며, 음성 인식 연구 및 응용에 풍부한 리소스를 제공합니다. GDPR, CCPA, PIPL 등 개인정보 보호 규정을 철저히 준수하여 데이터 수집·저장·활용 과정 전반에서 사용자 프라이버시와 합법적 권리를 보장합니다.

워크숍 오디오 데이터셋 MLC-SLM 데이터셋 ASR 음성 인식 데이터

111시간 그리스어 모바일 수집 낭독 음성 데이터

그리스어 음성 데이터_낭독(모바일)입니다. 주어진 스크립트를 기반으로 낭독 및 시뮬레이션 녹음을 진행했으며, 총 95명이 참여했습니다. 녹음자는 모두 그리스 출신으로, 조용하고 울림 없는 환경에서 녹음했습니다. 녹음 내용은 광범위하며, 1인당 약 1,000문장입니다. 텍스트는 인공지정 교정을 거쳐 정확도가 높으며, 음성 인식 관련 연구 및 응용을 위한 풍부한 리소스를 제공합니다. 다수의 AI 기업 검증을 통해 실제 환경의 다양성에서도 탁월한 성능을 발휘함을 입증했습니다. 데이터 수집, 저장 및 활용 전 과정에서 GDPR, CCPA, PIPL 등 개인정보 보호 규정을 철저히 준수하여 사용자 프라이버시와 합법적 권리를 보장합니다.

그리스어 대본 독백 데이터셋 그리스어 음성 데이터셋 그리스어 오디오 데이터셋 그리스어 음성 데이터 그리스어 음성 합성 데이터

280시간 노르웨이어 모바일 수집 낭독 음성 데이터

노르웨이어 음성 데이터_낭독(모바일)입니다. 주어진 스크립트를 기반으로 낭독 및 시뮬레이션 녹음을 진행했으며, 총 157명이 참여했습니다. 녹음자는 모두 노르웨이 출신으로, 조용하고 울림 없는 환경에서 녹음했습니다. 녹음 내용은 광범위하며, 1인당 약 1,000문장입니다. 텍스트는 인공지정 교정을 거쳐 정확도가 높으며, 음성 인식 관련 연구 및 응용을 위한 풍부한 리소스를 제공합니다. 다수의 AI 기업 검증을 통해 실제 환경의 다양성에서도 탁월한 성능을 발휘함을 입증했습니다. 데이터 수집, 저장 및 활용 전 과정에서 GDPR, CCPA, PIPL 등 개인정보 보호 규정을 철저히 준수하여 사용자 프라이버시와 합법적 권리를 보장합니다.

노르웨이어 대본 독백 데이터셋 노르웨이어 음성 데이터셋 노르웨이어 음성 합성 데이터 노르웨이어 NLP 코퍼스 노르웨이어 음성 데이터 노르웨이어 오디오 데이터셋

50만 장 21개국 자연 장면·문서 촬영 장면·전자 장면 OCR 라벨링 데이터

500,000장 21개국 자연 장면 & 문서 촬영 & 전자 장면 OCR 라벨링 데이터는 21개 언어로 구성되어 있으며, 각 언어당 20,000~25,000장의 이미지를 포함한다. 데이터 유형은 자연 장면, 문서 촬영, 전자 화면으로 다양하며, 촬영 각도와 환경도 다채롭다. 라벨링은 행(열) 단위의 사각형 또는 다각형 어노테이션, 내용 전사 방식으로 수행되며, 다국어 OCR 인식 연구에 활용할 수 있다.

다국어 OCR 데이터셋 장면 텍스트 인식 데이터 문서 OCR 데이터셋 전자 화면 OCR 데이터 21개 언어 OCR 데이터셋 AI OCR 트레이닝 데이터 텍스트 인식 데이터셋

20만 건 다국 랜드마크 건축 이미지·텍스트 데이터

20만 건 다국가 랜드마크 건축물 이미지·텍스트 데이터입니다. 각건는 이미지 1장과 중·영문 설명 문서로 구성되어 있습니다. 국내 랜드마크 8만건, 해외 랜드마크 12만건으로 구성되며, 국가 분포는 미국, 영국, 프랑스, 러시아, 독일 등 20개국 이상을 포함합니다. 각 랜드마크당 이미지 수는 1~10장으로, 다양한 각도·거리·시간대의 랜드마크 정보를 포함합니다. 랜드마크 유형은 상업 빌딩, 고건축물, 기념비, 도서관, 관광 명소 등 여러 종류의 건축물이 포함됩니다. 라벨링 내용에는 랜드마크 국가, 도시, 구체적 위치, 분류, 설명이 포함됩니다. 이 데이터는 랜드마크 건축물 인식 및 분석에 활용할 수 있습니다.

랜드마크 이미지 데이터셋 건물 인식 데이터셋 글로벌 랜드마크 이미지 캡션 데이터셋 이중 언어 이미지 캡션 데이터 중영 캡션 데이터셋 랜드마크 분류 데이터셋 이미지-텍스트 데이터셋 관광 랜드마크 데이터셋 문화유산 이미지 데이터셋 AI 트레이닝용 이미지 캡션

581시간 그리스어 구어체 음성 데이터

그리스어 구어체 음성 데이터는 개인 방송, 대화, 라이브 스트리밍 등 다양한 실생활 분야를 포함하며, 실제 세계의 상호작용 상황을 반영한다. 텍스트 내용, 루마니아인 화자 ID, 성별 등 다양한 속성을 라벨링했으며, 다양한 지역과 문화적 배경을 가진 루마니아인 루마니아인 화자들이 참여했다. 정확도와 활용성이 높아 음성 인식 연구 및 응용에 유용하며, 다수의 AI 기업 검증을 통해 실제 환경의 다양성에 대응하는 모델 성능 강화에 도움이 되는 것으로 입증되었다. 모든 데이터는 GDPR, CCPA, PIPL을 준수한다.

그리스어 음성 데이터셋 그리스어 ASR 트레이닝 데이터 그리스어 대화 코퍼스 그리스어 독백 음성 그리스어 음성 인식 데이터셋 음성-텍스트 그리스어 데이터 그리스어 음성 데이터셋 그리스어 전환 데이터셋

600시간 노르웨이어 구어체 음성 데이터

노르웨이어 구어체 음성 데이터는 자가 미디어, 대화, 라이브 방송 등 일반 분야를 포함하며 실제 세계의 상호작용 상황을 반영합니다. 본 데이터셋은 텍스트 내용, 루마니아인 화자 신원, 성별 등 다양한 속성을 라벨링하였으며, 다양한 지역과 문화적 배경의 루마니아 루마니아인 화자들이 녹음하였습니다. 정확도가 높고 활용성이 뛰어나 음성 인식 연구 및 응용에 풍부한 자원을 제공합니다. 모델이 실제 환경의 다양성에 직면했을 때 우수한 성능을 보이도록 돕습니다. 데이터 수집, 저장, 활용 과정 전반에서 GDPR, CCPA, PIPL 등 데이터 보호 및 개인정보 관련 법규를 철저히 준수하여 사용자 권익을 보장합니다.

노르웨이어 음성 데이터셋 노르웨이어 ASR 트레이닝 데이터 노르웨이어 대화 코퍼스 노르웨이어 독백 음성 노르웨이어 음성 인식 데이터셋 음성-텍스트 노르웨이어 데이터 노르웨이어 음성 데이터셋 다국어 음성 데이터 노르웨이어 전환 데이터셋

3D 장면 고품질 합성 데이터셋_캐빈

3D 실내 공간 고정밀 합성 데이터셋_캡슐은 실제 세계와 유사한 3D 장면 합성 데이터를 포함하며, 카메라 영상, 비디오 시퀀스, 포인트 클라우드 등을 제공합니다. 라벨링 내용에는 카메라 파라미터, 객체 분류·검출·분할, 시간·조명·날씨 메타데이터, 머리·눈·팔·다리의 위치 및 방향 등 인체 자세가 포함됩니다. 자율주행 및 로봇 환경 모델링과 데이터 합성에 활용할 수 있습니다.

3D 합성 데이터 운전자 모니터링 합성 데이터셋 자율주행 합성 데이터 고품질 시뮬레이션 데이터셋 합성 포인트 클라우드 데이터 카메라 시뮬레이션 데이터셋 인간 자세 합성 데이터셋 합성 라이다 데이터셋 3D 환경 모델링 로보틱스 합성 데이터 DMS 데이터셋

일본 OKWAVE 문답 플랫폼 텍스트 데이터

일본 OKWAVE 질의응답 플랫폼의 텍스트 데이터는 질문, 답변, 카테고리, 게시 날짜, 작성자 등 여러 필드를 포함하며, 데이터는 지속적으로 업데이트 되고 있습니다. 2025년 4월 말까지 질문 840만 세트, 230억 자, 답변 2,700만 세트, 760억 자, 감사 표시(질문자가 답변자에게 감사를 표한 것) 1,550만 세트, 170억 자, 보충 설명 210만 세트, 36억 자가 수집되어 있습니다. 이 데이터는 범용 대규모 모델 훈련에 활용될 수 있습니다.

문답 텍스트 일본어

500시간 타밀어 모바일 수집 낭독 음성 데이터

타밀어 음성 데이터_낭독(모바일)은 주어진 스크립트를 바탕으로 시뮬레이션 낭독을 수행했다. 479명의 현지인이 참여하여 텍스트 등 다양한 속성을 라벨링했으며, 정확도가 높다. 음성 인식 연구 및 응용에 유용하며, 다수의 AI 기업 검증을 통해 실제 환경의 다양성에 대응하는 모델 성능 강화에 기여한다. 모든 데이터는 GDPR, CCPA, PIPL을 준수한다.

타밀어 음성 데이터셋 타밀어 오디오 데이터셋 타밀어 언어 데이터셋 타밀어 독백 데이터셋 타밀어 음성 코퍼스 타밀어 ASR 데이터 대본 기반 타밀어 음성 스마트폰 타밀어 데이터셋 음성 인식 타밀어 데이터셋 다국어 음성 데이터

500시간 라오어 모바일 수집 낭독 음성 데이터

라오스어 음성 데이터_낭독(모바일)은 주어진 스크립트를 기반으로 시뮬레이션 낭독을 수행했다. 418명의 현지 루마니아인 화자가 참여했으며, 텍스트 등 다양한 속성이 포함되어 있다. 정확도가 높고, 음성 인식 연구 및 응용에 유용하다. 모든 데이터는 GDPR, CCPA, PIPL을 준수한다.

라오스어 음성 데이터셋 라오스어 독백 음성 데이터셋 라오스어 대본 음성 데이터셋 라오스어 스마트폰 음성 데이터셋 TTS용 라오스어 음성 데이터셋 라오스어 오디오 데이터셋 ASR용 라오스어 음성 데이터셋

. . .

loading

뉴스레터 구독하기

Nexdata의 최신 제품 출시, 데이터 솔루션 및 기업 소식을 가장 먼저 받아보세요.

완제품 데이터셋: 모든 카테고리 데이터셋; LLM 데이터셋; 컴퓨터 비전 데이터셋; 음성 인식 데이터셋; 음성 합성 데이터셋; OCR 데이터셋; 발음 사전; NLU 데이터셋

데이터 서비스: 3D 포인트 클라우드 데이터; 스트리트 뷰 데이터; OCR 데이터; 행동 인식 데이터; 신원 인식 데이터; 음성 인식 데이터; 음성 합성 데이터; 멀티모달 데이터

산업: 임바디드AI; 생성형 AI; 자율주행차; AR/VR; 대화형 AI; 스마트 홈; 리테일; 지능형 헬스케어

회사: 회사 소개; 뉴스; 파트너; 품질 및 보안; 이벤트
링크: OPENMPD; DataPlus; Datarade

플랫폼: 플랫폼
경쟁: 경쟁
자료: 스폰서 데이터셋

더 나은 데이터로 당신의 AI를 향상시키세요

+1(626)594-5598

[email protected]

nexdata_ai facebook

nexdata_ai twitter

nexdata_ai linkedin

nexdata_ai youtube

저작권 © 2023넥스데이터 테크놀로지 주식회사

사이트맵 이용 약관

당사는 귀하의 브라우징 경험을 향상시키고, 맞춤형 광고 또는 콘텐츠를 제공하며, 트래픽을 분석하기 위해 쿠키를 사용합니다. “모두 허용”을 클릭하면 당사의 쿠키 사용에 동의하는 것입니다.

db59f30f-a1b0-4481-a9bd-f2a78cd3d79d