en

Please fill in your name

Mobile phone format error

전화번호를 입력해 주세요

회사 이름을 입력해 주세요

회사 이메일을 입력해 주세요

데이터 요구사항을 입력해 주세요

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

데이터 요구사항은 5자 이상이며 숫자만으로 구성될 수 없습니다

3,100만 세트 동남아시아어 뉴스 텍스트 데이터

소수민족 언어
동남아시아
뉴스
뉴스 산업

본 데이터셋은 동남아시아 다국어 뉴스 데이터로, 인도네시아어, 말레이어, 태국어, 베트남어 등 4개 언어를 포함하며, 총 3,100만 세트 이상의 데이터를 포함하고 있습니다. JSONL 포맷으로 저장되어 있으며, 각 기록이 한 줄로 구성되어 효율적인 읽기와 처리가 가능합니다. 뉴스 주제는 매우 다양하며, 동남아 지역의 사회 동향, 문화 이슈, 경제 트렌드를 폭넓게 반영합니다. 본 데이터는 대형 모델의 다국어 처리 능력 향상, 문화 지식 확장, 성능 최적화, 동남아 시장 적용 확대 및 다국어 연구 촉진에 기여할 수 있습니다.

유료 데이터셋
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
사양사양
언어 종류
인도네시아어, 말레이어, 태국어, 베트남어
데이터 양
인도네시아어 14,447,771개, 말레이어 1,239,420개, 태국어 6,467,564개, 베트남어 8,942,813개, 총량 3,100만+개
필드
URL, 제목, 게시 시간, 기사 내용, 카테고리
형식
Jsonl
샘플 샘플
  • 3,100만 세트 동남아시아어 뉴스 텍스트 데이터
  • 3,100만 세트 동남아시아어 뉴스 텍스트 데이터
  • 3,100만 세트 동남아시아어 뉴스 텍스트 데이터
추천 데이터셋추천 데이터셋
특별한 요청 사항을 알려주세요

제출함으로써,개인정보 보호 정책에 동의합니다

b8c2ff12-e4fb-4404-95c8-a60782ab8bb5

677d8509-b0e0-47c0-a8ba-647d6cd8e2b9