en

Please fill in your name

Mobile phone format error

전화번호를 입력해 주세요

회사 이름을 입력해 주세요

회사 이메일을 입력해 주세요

데이터 요구사항을 입력해 주세요

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

데이터 요구사항은 5자 이상이며 숫자만으로 구성될 수 없습니다

105,941장 12개 언어 자연 장면 OCR 데이터

일본어
한국어
인도네시아어
말레이시아어
베트남어
태국어
프랑스어
독일어
이탈리아어
포르투갈어
러시아어
스페인어
OCR
자연 장면
다양한 촬영 각도
텍스트에 대한 라인 수준 사각형 바운딩 박스 주석 및 전사

105,941장의 12개 언어 자연 환경 OCR 데이터는 6개 아시아어와 6개 유럽어를 포함한 12개 언어를 포함하며, 다양한 자연 환경과 촬영 각도에서 수집되었습니다. 라벨링 측면에서는 행 단위 텍스트의 사각형 박스와 행 단위 텍스트 전사가 포함되어 있습니다. 본 데이터셋은 다국어 OCR 작업에 활용될 수 있습니다.

유료 데이터셋
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
사양사양
데이터 규모
105,941장, 아시아 언어 계열: 일본어 9,997장, 한국어 10,231장, 인도네시아어 7,591장, 말레이어 5,650장, 베트남어 8,822장, 태국어 9,645장; 유럽 언어 계열: 프랑스어 10,015장, 독일어 7,213장, 이탈리아어 8,824장, 포르투갈어 7,754장, 러시아어 10,376장, 스페인어 9,823장
수집 환경
상점 간판, 표지판, 포스터, 승차권, 도로 표지, 만화, 맨홀 그림, 안내문, 경고문, 포장 설명, 메뉴판, 건물 표시 등 포함
수집 다양성
12개 언어, 다양한 자연 장면, 다양한 촬영 각도(앙각, 부감, 수평) 포함
수집 장비
모바일, 카메라
영상 파라미터
이미지 포맷은 .jpg, 라벨링 포맷은 .json
라벨링 내용
행 단위 사각형 라벨링, 행 단위 내용 전사
정확도
사각형 박스 꼭짓점 오차가 5픽셀 이하일 경우 정확한 검출로 간주, 검출 박스 정확도는 97% 이상; 텍스트 전사 정확도는 97% 이상
샘플 샘플
  • 105,941장 12개 언어 자연 장면 OCR 데이터
  • 105,941장 12개 언어 자연 장면 OCR 데이터
  • 105,941장 12개 언어 자연 장면 OCR 데이터
추천 데이터셋추천 데이터셋
특별한 요청 사항을 알려주세요

제출함으로써,개인정보 보호 정책에 동의합니다

5312a24c-1169-4286-b1a1-7f739c17f61b

66004586-17cd-462c-86c1-7e2c10a7a6be