en

Please fill in your name

Mobile phone format error

전화번호를 입력해 주세요

회사 이름을 입력해 주세요

회사 이메일을 입력해 주세요

데이터 요구사항을 입력해 주세요

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

데이터 요구사항은 5자 이상이며 숫자만으로 구성될 수 없습니다

NLU 데이터셋

고품질 표준 데이터셋으로 AI 모델 성능을 즉시 향상시키세요.

유형

전체
34
엔티티 식별
4
대화 텍스트
1
의도 이해
1
기타
2
병렬 코퍼스
23

531만 세트의 중국어-독일어 병렬 코퍼스 데이터

514만 세트의 중국어-독일어 병렬 코퍼스 데이터로,텍스트(txt) 파일 형식으로 저장되어 있으며 관광,의료,일상,뉴스 등 다양한 분야를 포함합니다. 데이터 정제,익명화 및 품질 검증이 완료된 상태로,기계 번역 등 텍스트 기반 데이터 분석용 기본 코퍼스로 활용 가능합니다.
중국어-독일어 병렬 코퍼스 데이터 중국어-독일어 병렬 코퍼스 병렬 코퍼스 데이터 정렬 코퍼스 데이터

84,516개의 인터랙션 장면 영어 단문 의도 라벨링 데이터

영어 의도 인식 데이터 총 규모는 84,516개 문장이며,의도 클래스 라벨링은 슬롯 및 슬롯 값 정보를 포함합니다. 의도 분야에는 음악,날씨,날짜,일정,가전 기기 등이 포함됩니다. 본 데이터는 의도 인식 관련 분야 연구에 활용할 수 있습니다.
영어 의도 라벨링 데이터 인터랙션 의도 라벨링 데이터 의도 인식 자연어 처리 의도 인식 데이터 자연어 이해 데이터

108만 세트의 영어-러시아어 병렬 코퍼스 데이터

총 108만 세트의 영어 - 러시아어 병렬 코퍼스 데이터로,정치,음란,개인정보 등 민감한 어휘를 제외하였습니다. 텍스트 분석 기반 코퍼스로 활용 가능하며,기계 번역 등 분야에 사용할 수 있습니다.
영어-러시아어 병렬 코퍼스 데이터 영어-러시아어 코퍼스 수집 영어-러시아어 병렬 코퍼스 병렬 코퍼스 데이터 정렬 코퍼스 데이터

134만 쌍 영-한 평행 코퍼스 데이터

영한 평행 코퍼스 데이터는 총 1,340,000쌍으로 구성되어 있으며, 정치, 선정적 내용, 개인 정보 등 민감한 단어를 제외하였습니다. 본 데이터는 텍스트 기반 데이터 분석의 기초 코퍼스로서 기계 번역 등 다양한 분야에 활용될 수 있습니다.
영어-한국어 병렬 코퍼스 데이터 영어-한국어 코퍼스 수집 정렬 코퍼스 병렬 코퍼스 데이터 정렬 코퍼스 데이터

380,000쌍 일본어-영어 평행 코퍼스 데이터

일본어-영어 병렬 말뭉치 총 38만 쌍으로 구성되어 있으며, 정치, 음란물, 개인정보 등 민감한 단어는 제외하였습니다. 본 데이터셋은 텍스트 분석의 기초 말뭉치로 활용 가능하며, 기계 번역 등 다양한 분야에 적용할 수 있습니다.
일본어-영어 병렬 코퍼스 데이터 일본어-영어 병렬 코퍼스 수집 정렬 코퍼스 병렬 코퍼스 데이터 정렬 코퍼스 데이터

687,694문장 오픈 도메인 의도 라벨링 데이터

개방형 도메인 의도 라벨링 데이터는 모바일 환경에서 실제 생성된 687,694건의 사용자 텍스트를 대상으로 라벨링을 수행하였으며, 할 일(TO-DO), 장소, 일정 등의 장면을 포함합니다. 본 데이터는 자연어 이해 등 다양한 연구 및 응용에 활용될 수 있습니다.
오픈 도메인 데이터 의도 주석 데이터 텍스트 데이터 주석 SMS 텍스트 데이터 NLU 데이터 의도 이해 데이터

47,811문장 상호작용 장면 단일 발화 의도 라벨링 데이터

인터랙션(대화형) 상황 단문 의도 라벨링 데이터는 총 47,811문장으로 구성되어 있으며, 의도 유형에 대한 라벨링이 이루어졌고, 슬롯 및 슬롯 값 정보가 포함되어 있습니다. 의도 도메인은 음악, 날씨, 날짜, 일정, 스마트홈 기기 등 다양한 분야를 포함합니다. 본 데이터는 의도 인식 등 관련 분야 연구에 활용될 수 있습니다.
의도 주석 데이터 상호작용 의도 주석 데이터 의도 인식 NLP 의도 인식 데이터 NLU 데이터

중국어-체코어 병행 언어 자료 199만 세트

중국어-체코어 평행 언어 자료 데이터는 199만 세트의 중국어 및 체코어 평행 번역 자료를 포함하며, 데이터 저장 형식은 txt 문서입니다. 데이터 세척 및 탈감작 품질 검사가 수행되었으며 기계 번역 및 기타 분야에서 텍스트 데이터 분석을 위한 기본 코퍼스로 사용할 수 있습니다.
중국 및 체코 병렬 말뭉치 데이터 정렬 말뭉치 병렬 말뭉치 데이터 정렬 말뭉치 데이터

1,000만 건 번체 중국어 SMS 코퍼스 데이터

번체 문자 메시지 코퍼스 총 1,000만 건으로, 실제 번체 구어체 문자 메시지 데이터를 포함합니다. 문자 메시지 텍스트만 포함되어 있으며, 라벨링 내용은 txt 포맷으로 저장되어 있습니다. 본 데이터는 자연어 이해 등 다양한 연구 및 응용에 활용 가능합니다.
번체 중국어 SMS 코퍼스 번체 중국어 SMS 데이터 번체 중국어 SMS 수집 번체 중국어 코퍼스 데이터

loading

지금 바로 데이터를 맞춤 설정하세요

표준 데이터셋을 선택하는 이유

  • 저작권

    저작권

    명확한 저작권 쉽게 확인 가능
  • 보안

    보안

    적절한 권한 부여 안전하게 사용 가능
  • 전문성

    전문성

    AI 데이터 전문가들이 설계 및 제작
  • 다양성

    다양성

    다양한 실제 장면에서 수집
  • 비용 효율성

    비용 효율성

    맞춤형 데이터보다 비용 효율적
  • 효율성

    효율성

    즉시 제공, 빠른 납품
a0cbe129-cc69-451f-8c8c-87877b64c134