en

Please fill in your name

Mobile phone format error

전화번호를 입력해 주세요

회사 이름을 입력해 주세요

회사 이메일을 입력해 주세요

데이터 요구사항을 입력해 주세요

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

데이터 요구사항은 5자 이상이며 숫자만으로 구성될 수 없습니다

50만 장 다국가 자연 환경 및 문서 OCR 데이터

자연 환경
문서
OCR

500,000장의 다국적 자연 장면 및 문서 OCR 데이터는 번체 중국어, 일본어, 한국어, 인도네시아어, 말레이어, 태국어, 베트남어, 폴란드어 등 총 20개 언어를 포함합니다. 다양한 자연 장면과 촬영 각도를 반영한 수집 방식으로, 다국어 OCR 과제에 활용될 수 있는 데이터입니다.

유료 데이터셋
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
사양사양
데이터 규모
50만 장, 각 언어별로 자연 환경과 문서 각각 12,500장 포함
언어 종류 분포
번체 중국어, 일본어, 한국어, 인도네시아어, 말레이시아어, 태국어, 베트남어, 프랑스어, 독일어, 이탈리아어, 포르투갈어, 러시아어, 스페인어, 아랍어, 터키어, 폴란드어, 네덜란드어, 그리스어, 체코어, 필리핀어(따갈로그어)
수집 환경
자연 환경: 슬로건, 영수증, 포스터, 경고문, 도로 표지판, 식품 포장, 광고판, 정류장 표지판 및 간판 등, 문서: 전자 문서, 회의 기록, 보고서, 설명서, 사용자 매뉴얼, 서적 및 신문, 교재 등
수집 다양성
다양한 자연 환경 및 촬영 각도
수집 장비
스마트폰, 스캐너 사용
촬영 각도
앙각, 부감, 평시
데이터 형식
이미지 형식은 .jpg 등 일반 이미지 포맷
정확도
수집 요구 사항에 따라 수집 정확도는 97% 이상
샘플 샘플
  • 50만 장 다국가 자연 환경 및 문서 OCR 데이터
  • 50만 장 다국가 자연 환경 및 문서 OCR 데이터
  • 50만 장 다국가 자연 환경 및 문서 OCR 데이터
추천 데이터셋추천 데이터셋
특별한 요청 사항을 알려주세요

제출함으로써,개인정보 보호 정책에 동의합니다

0985763c-55e2-4a8c-97d7-e089df565d94

7b25ade7-c1b2-467e-95e3-0bfa3dc40af0