자연어 이해 데이터셋, 최고의 NLU 데이터셋 - Nexdata

ko

Please fill in your name

Mobile phone format error

전화번호를 입력해 주세요

회사 이름을 입력해 주세요

회사 이메일을 입력해 주세요

데이터 요구사항을 입력해 주세요

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

데이터 요구사항은 5자 이상이며 숫자만으로 구성될 수 없습니다

홈 > 모든 카테고리 데이터셋 > NLU 데이터셋

유형

전체

26

의도 이해

3

병렬 코퍼스

23

531만 세트의 중국어-독일어 병렬 코퍼스 데이터

514만 세트의 중국어-독일어 병렬 코퍼스 데이터로,텍스트(txt) 파일 형식으로 저장되어 있으며 관광,의료,일상,뉴스 등 다양한 분야를 포함합니다. 데이터 정제,익명화 및 품질 검증이 완료된 상태로,기계 번역 등 텍스트 기반 데이터 분석용 기본 코퍼스로 활용 가능합니다.

중국어-독일어 병렬 코퍼스 데이터 중국어-독일어 병렬 코퍼스 병렬 코퍼스 데이터 정렬 코퍼스 데이터

84,516개의 인터랙션 장면 영어 단문 의도 라벨링 데이터

영어 의도 인식 데이터 총 규모는 84,516개 문장이며,의도 클래스 라벨링은 슬롯 및 슬롯 값 정보를 포함합니다. 의도 분야에는 음악,날씨,날짜,일정,가전 기기 등이 포함됩니다. 본 데이터는 의도 인식 관련 분야 연구에 활용할 수 있습니다.

영어 의도 라벨링 데이터 인터랙션 의도 라벨링 데이터 의도 인식 자연어 처리 의도 인식 데이터 자연어 이해 데이터

108만 세트의 영어-러시아어 병렬 코퍼스 데이터

총 108만 세트의 영어 - 러시아어 병렬 코퍼스 데이터로,정치,음란,개인정보 등 민감한 어휘를 제외하였습니다. 텍스트 분석 기반 코퍼스로 활용 가능하며,기계 번역 등 분야에 사용할 수 있습니다.

영어-러시아어 병렬 코퍼스 데이터 영어-러시아어 코퍼스 수집 영어-러시아어 병렬 코퍼스 병렬 코퍼스 데이터 정렬 코퍼스 데이터

134만 쌍 영-한 평행 코퍼스 데이터

영한 평행 코퍼스 데이터는 총 1,340,000쌍으로 구성되어 있으며, 정치, 선정적 내용, 개인 정보 등 민감한 단어를 제외하였습니다. 본 데이터는 텍스트 기반 데이터 분석의 기초 코퍼스로서 기계 번역 등 다양한 분야에 활용될 수 있습니다.

영어-한국어 병렬 코퍼스 데이터 영어-한국어 코퍼스 수집 정렬 코퍼스 병렬 코퍼스 데이터 정렬 코퍼스 데이터

380,000쌍 일본어-영어 평행 코퍼스 데이터

일본어-영어 병렬 말뭉치 총 38만 쌍으로 구성되어 있으며, 정치, 음란물, 개인정보 등 민감한 단어는 제외하였습니다. 본 데이터셋은 텍스트 분석의 기초 말뭉치로 활용 가능하며, 기계 번역 등 다양한 분야에 적용할 수 있습니다.

일본어-영어 병렬 코퍼스 데이터 일본어-영어 병렬 코퍼스 수집 정렬 코퍼스 병렬 코퍼스 데이터 정렬 코퍼스 데이터

47,811문장 상호작용 장면 단일 발화 의도 라벨링 데이터

인터랙션(대화형) 상황 단문 의도 라벨링 데이터는 총 47,811문장으로 구성되어 있으며, 의도 유형에 대한 라벨링이 이루어졌고, 슬롯 및 슬롯 값 정보가 포함되어 있습니다. 의도 도메인은 음악, 날씨, 날짜, 일정, 스마트홈 기기 등 다양한 분야를 포함합니다. 본 데이터는 의도 인식 등 관련 분야 연구에 활용될 수 있습니다.

의도 주석 데이터 상호작용 의도 주석 데이터 의도 인식 NLP 의도 인식 데이터 NLU 데이터

8,012만 쌍 중-영 평행 코퍼스 데이터

중영 평행 번역 코퍼스는 txt 포맷으로 저장되었으며, 관광, 의료, 일상, 드라마 등 다양한 분야를 포함합니다. 데이터는 정제, 비식별화 및 품질 검수를 완료하였으며, 텍스트 분석의 기본 코퍼스로 사용 가능하며, 기계 번역 등 다양한 분야에 활용됩니다.

중영 병렬 코퍼스 데이터 중영 정렬 코퍼스

중국어-체코어 병행 언어 자료 199만 세트

중국어-체코어 평행 언어 자료 데이터는 199만 세트의 중국어 및 체코어 평행 번역 자료를 포함하며, 데이터 저장 형식은 txt 문서입니다. 데이터 세척 및 탈감작 품질 검사가 수행되었으며 기계 번역 및 기타 분야에서 텍스트 데이터 분석을 위한 기본 코퍼스로 사용할 수 있습니다.

중국 및 체코 병렬 말뭉치 데이터 정렬 말뭉치 병렬 말뭉치 데이터 정렬 말뭉치 데이터

85만 쌍의 영어-일본어 병렬 코퍼스 데이터

85만 쌍의 영어-일본어 병렬 코퍼스,데이터 저장 형식은 txt 이며 관광,의약,일상,뉴스 등 다양한 분야를 포함합니다. 데이터 정제,비식별화 및 품질 검수를 완료하여 텍스트 데이터 분석의 기초 코퍼스로 사용 가능하며 기계 번역 등 분야에 활용할 수 있습니다.

영어-일본어 병렬 코퍼스 데이터 영어-일본어 병렬 코퍼스 병렬 코퍼스 데이터 정렬 코퍼스 데이터

loading

지금 바로 데이터를 맞춤 설정하세요

표준 데이터셋을 선택하는 이유

저작권
명확한 저작권 쉽게 확인 가능
보안
적절한 권한 부여 안전하게 사용 가능
전문성
AI 데이터 전문가들이 설계 및 제작
다양성
다양한 실제 장면에서 수집
비용 효율성
맞춤형 데이터보다 비용 효율적
효율성
즉시 제공, 빠른 납품

뉴스레터 구독하기

Nexdata의 최신 제품 출시, 데이터 솔루션 및 기업 소식을 가장 먼저 받아보세요.

완제품 데이터셋: 모든 카테고리 데이터셋; LLM 데이터셋; 컴퓨터 비전 데이터셋; 음성 인식 데이터셋; 음성 합성 데이터셋; OCR 데이터셋; 발음 사전; NLU 데이터셋

데이터 서비스: 3D 포인트 클라우드 데이터; 스트리트 뷰 데이터; OCR 데이터; 행동 인식 데이터; 신원 인식 데이터; 음성 인식 데이터; 음성 합성 데이터; 멀티모달 데이터

산업: 임바디드AI; 생성형 AI; 자율주행차; AR/VR; 대화형 AI; 스마트 홈; 리테일; 지능형 헬스케어

회사: 회사 소개; 뉴스; 파트너; 품질 및 보안; 이벤트
링크: OPENMPD; DataPlus; Datarade

플랫폼: 플랫폼
경쟁: 경쟁
자료: 스폰서 데이터셋

더 나은 데이터로 당신의 AI를 향상시키세요

+1(626)594-5598

[email protected]

nexdata_ai facebook

nexdata_ai twitter

nexdata_ai linkedin

nexdata_ai youtube

저작권 © 2023넥스데이터 테크놀로지 주식회사

사이트맵 이용 약관

당사는 귀하의 브라우징 경험을 향상시키고, 맞춤형 광고 또는 콘텐츠를 제공하며, 트래픽을 분석하기 위해 쿠키를 사용합니다. “모두 허용”을 클릭하면 당사의 쿠키 사용에 동의하는 것입니다.

86e5ac89-bebd-4ba3-a926-01a3d0a34b0d