ko

Please fill in your name

Mobile phone format error

전화번호를 입력해 주세요

회사 이름을 입력해 주세요

회사 이메일을 입력해 주세요

데이터 요구사항을 입력해 주세요

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

데이터 요구사항은 5자 이상이며 숫자만으로 구성될 수 없습니다

OCR 데이터셋

고품질 표준 데이터셋으로 AI 모델 성능을 즉시 향상시키세요.

데이터 타입

전체
28
문서
3
일반 시나리오
13
손글씨
15
인터넷 이미지
1
송장
3
기타
4
시험지
1
1

언어

전체
28
중국어
6
영어
4
힌디어
4
일본어
7
한국어
7
기타
20
베트남어
4

4,995장 베트남어 OCR 라벨링 및 전사 데이터

4,995장의 베트남어 OCR 라벨링 및 전사 데이터는 자연 장면 이미지 258장, 인터넷 이미지 2,553장, 텍스트 이미지 2,184장을 포함합니다. 라벨링 측면에서는 행 단위 내용에 대해 행 단위 사각형 박스 라벨링과 행 단위 내용 전사가 이루어지며, 세로열 내용에 대해서는 세로열 사각형 박스 라벨링과 세로열 내용 전사가 포함됩니다. 본 베트남어 OCR 라벨링 및 전사 데이터는 다양한 장면에서의 베트남어 인식 및 베트남어 촬영 번역 등 작업에 활용될 수 있습니다.
베트남어 OCR 문서 이미지 인터넷 이미지 자연 장면 다양한 각도 다른 조도 조건 사각형 바운딩 박스 주석 텍스트 라인 수준 전사 컬럼 수준 전사

3,506장 힌디어 OCR 라벨링 및 전사 데이터

3,506장의 힌디어 OCR 라벨링 및 전사 데이터는 자연 장면 이미지 2,056장, 인터넷 이미지 1,103장, 텍스트 이미지 347장을 포함합니다. 라벨링 측면에서는 행 단위 내용에 대해 행 단위 사각형 박스 라벨링과 행 단위 내용 전사가 이루어지며, 세로열 내용에 대해서는 세로열 사각형 박스 라벨링과 세로열 내용 전사가 포함됩니다. 본 힌디어 OCR 라벨링 및 전사 데이터는 다양한 장면에서의 힌디어 인식 및 힌디어 촬영 번역 등 작업에 활용될 수 있습니다.
힌디어 OCR 문서 이미지 인터넷 이미지 자연 장면 다양한 각도 다른 조도 조건 사각형 바운딩 박스 주석 텍스트 라인 수준 전사 컬럼 수준 전사

57,645장 수직 텍스트 OCR 데이터

57,645장의 수직 문서 OCR 데이터로, 거리 풍경, 간판, 광고판, 포스터, 장식, 예술 글씨, 잡지 표지 등 다양한 환경에서 수집되었습니다. 언어는 중국어를 위주로 하며 소량의 영어도 포함되어 있습니다. 라벨은 열 단위 직사각형 박스(다각형/평행사변형) 라벨링 및 내용 전사, 비수직 직사각형 박스(다각형/평행사변형) 라벨링 및 내용 전사하였습니다. 본 데이터셋은 다양한 수직 텍스트 OCR 작업에 활용 가능합니다.
수직 텍스트 OCR 데이터 OCR 이미지 데이터 OCR 데이터 OCR 데이터셋 OCR 라벨링 데이터 OCR 수집 데이터 OCR 데이터 처리 OCR 재작성 데이터

14,980장 8개 언어 PPT OCR 데이터

14,980장 8개 언어 PPT OCR 데이터는 8개 언어, 다양한 장면, 여러 촬영 각도, 다양한 촬영 거리, 다양한 조명 조건을 포함합니다. 라벨링 측면에서는 행 단위 텍스트의 사각형(4각형) 박스와 행 단위 텍스트 전사를 포함합니다. 본 다국어 PPT OCR 데이터는 다국어 OCR 작업에 활용할 수 있습니다.
PPT OCR 회의실 컨퍼런스 룸 다양한 촬영 각도 다른 촬영 거리 다양한 조도 조건 텍스트에 대한 라인 수준 사각형 바운딩 박스 주석 및 전사

100명 한일 손글씨 데이터

100명 한일 손글씨 데이터로, 총 100명의 입력자가 참여했으며, 일본인 50명, 한국인 49명, 아프가니스탄인 1명으로 구성되어 있습니다. 각 개인이 작성한 말뭉치는 모두 다릅니다. 데이터 다양성은 여러 종류의 모바일 기기와 다양한 말뭉치를 포함합니다. 본 한일 손글씨 데이터는 일본어 및 한국어 손글씨 OCR 인식에 활용될 수 있습니다.
일본어 한국어 필기 OCR 필적

5,147장의 일본어 필기체 OCR 데이터

5,147장의 일본어 필기체 OCR 데이터로, A4 용지, 가로줄 노트, 모눈종이 등에 기재되었으며, 수집 장비는 스마트폰이고 촬영 각도는 정면 시점입니다. 데이터 내용은 일본어 작문, 시, 산문, 뉴스, 이야기 등 분야를 포함하며, 라벨링 측면에서는 행 단위 텍스트의 사각형 박스와 행 단위 전사를 표기했습니다. 본 데이터는 일본어 필기체 OCR 작업에 활용 가능합니다.
일본어 필기체 OCR 행 단위 라벨링 행 단위 텍스트 전사

101명 4,538장 일본어 손글씨 OCR 데이터

101명 4,538장의 일본어 필기체 OCR 데이터는 텍스트 매체로 A4 용지를 사용하였습니다. 해당 데이터는 사회 민생, 엔터테인먼트, 여행, 스포츠 경기, 영화, 작곡 등 다양한 분야의 내용을 포함하고 있습니다. 라벨링 측면에서는 문자 단위 사각형 박스 라벨링 및 문자 단위 텍스트 전사, 행 단위 사각형 박스 라벨링 및 행 단위 텍스트 전사를 수행하였습니다. 본 데이터셋은 일본어 필기체 OCR 과제에 활용될 수 있습니다.
일본어 필기 OCR 문자 수준 사각형 바운딩 박스 주석 텍스트 전사 서예 낙서 원고 일본어 OCR 데이터

105,941장 12개 언어 자연 장면 OCR 데이터

105,941장의 12개 언어 자연 환경 OCR 데이터는 6개 아시아어와 6개 유럽어를 포함한 12개 언어를 포함하며, 다양한 자연 환경과 촬영 각도에서 수집되었습니다. 라벨링 측면에서는 행 단위 텍스트의 사각형 박스와 행 단위 텍스트 전사가 포함되어 있습니다. 본 데이터셋은 다국어 OCR 작업에 활용될 수 있습니다.
일본어 한국어 인도네시아어 말레이시아어 베트남어 태국어 프랑스어 독일어 이탈리아어 포르투갈어 러시아어 스페인어 OCR 자연 장면 다양한 촬영 각도 텍스트에 대한 라인 수준 사각형 바운딩 박스 주석 및 전사

50만 장 다국가 자연 환경 및 문서 OCR 데이터

500,000장의 다국적 자연 장면 및 문서 OCR 데이터는 번체 중국어, 일본어, 한국어, 인도네시아어, 말레이어, 태국어, 베트남어, 폴란드어 등 총 20개 언어를 포함합니다. 다양한 자연 장면과 촬영 각도를 반영한 수집 방식으로, 다국어 OCR 과제에 활용될 수 있는 데이터입니다.
자연 환경 문서 OCR

loading

지금 바로 데이터를 맞춤 설정하세요

표준 데이터셋을 선택하는 이유

  • 저작권

    저작권

    명확한 저작권 쉽게 확인 가능
  • 보안

    보안

    적절한 권한 부여 안전하게 사용 가능
  • 전문성

    전문성

    AI 데이터 전문가들이 설계 및 제작
  • 다양성

    다양성

    다양한 실제 장면에서 수집
  • 비용 효율성

    비용 효율성

    맞춤형 데이터보다 비용 효율적
  • 효율성

    효율성

    즉시 제공, 빠른 납품
ad6c64ed-0e44-4d35-aba8-2225eb6c191f