en

Please fill in your name

Mobile phone format error

전화번호를 입력해 주세요

회사 이름을 입력해 주세요

회사 이메일을 입력해 주세요

데이터 요구사항을 입력해 주세요

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

데이터 요구사항은 5자 이상이며 숫자만으로 구성될 수 없습니다

104,320장 한국어 및 힌디어 자연 환경 OCR 데이터

한국어
힌디어
OCR 데이터
자연 환경
OCR 전사 데이터

104,320장의 한국어 및 힌디어 자연 환경 OCR 데이터 수집 장면에는 상품 포장, 포스터, 차표, 안내문, 메뉴, 건물 표지 등이 포함됩니다. 데이터 다양성에는 다양한 장면, 다양한 촬영 각도, 다양한 조명 조건이 포함됩니다. 언어 분포는 한국어, 힌디어 및 영어(소량)입니다. 라벨링 측면에서 데이터는 행 단위 다각형 박스(또는 사각형 박스, 직사각형 박스) 라벨링, 행 단위 내용 전사, 텍스트 속성(언어 종류), 열 단위 다각형 박스(또는 사각형 박스, 직사각형 박스) 라벨링, 열 단위 내용 전사, 텍스트 속성(언어 종류)이 포함됩니다. 본 한국어 및 힌디어 자연 환경 OCR 데이터는 한국어 및 힌디어 자연 환경에서의 OCR 작업에 활용 가능합니다.

유료 데이터셋
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
사양사양
데이터 규모
한국어 76,861장, 555,913개 박스, 힌디어 27,459장, 200,453개 박스
수집 환경
상품 포장, 포스터, 차표, 안내문, 메뉴, 건물 표지 등 포함
수집 다양성
다양한 자연 환경, 촬영 각도, 조명 조건
수집 장비
스마트폰
촬영 각도
앙각, 부감, 평시
언어 분포
한국어, 힌디어, 영어(소량)
데이터 형식
이미지 형식은 .jpg, 라벨링 문서 형식은 .json
라벨링 박스 형태 분포
한국어 315,822개 사각형 박스, 240,091개 다각형 박스, 힌디어 780개 사각형 박스, 199,671개 다각형 박스, 2개 직사각형 박스
라벨링 내용
행 단위 다각형 박스(또는 사각형 박스, 직사각형 박스) 라벨링, 행 단위 내용 전사, 텍스트 속성(언어 종류), 열 단위 다각형 박스(또는 사각형 박스, 직사각형 박스) 라벨링, 열 단위 내용 전사, 텍스트 속성(언어 종류)
정확도
라벨링 박스 꼭짓점 편차가 5픽셀 이내일 경우 정확한 검출로 간주하며, 검출 박스 정확도는 97% 이상, 텍스트 전사 정확도는 97% 이상
샘플 샘플
  • 104,320장 한국어 및 힌디어 자연 환경 OCR 데이터
  • 104,320장 한국어 및 힌디어 자연 환경 OCR 데이터
  • 104,320장 한국어 및 힌디어 자연 환경 OCR 데이터
추천 데이터셋추천 데이터셋
특별한 요청 사항을 알려주세요

제출함으로써,개인정보 보호 정책에 동의합니다

dba1216a-e00e-43ab-804a-fa0fa29a2929

4e609b1e-4b82-4dce-80b3-e748af7f4f2a