[{"@type":"PropertyValue","name":"데이터 규모","value":"한국어 76,861장, 555,913개 박스, 힌디어 27,459장, 200,453개 박스"},{"@type":"PropertyValue","name":"수집 환경","value":"상품 포장, 포스터, 차표, 안내문, 메뉴, 건물 표지 등 포함"},{"@type":"PropertyValue","name":"수집 다양성","value":"다양한 자연 환경, 촬영 각도, 조명 조건"},{"@type":"PropertyValue","name":"수집 장비","value":"스마트폰"},{"@type":"PropertyValue","name":"촬영 각도","value":"앙각, 부감, 평시"},{"@type":"PropertyValue","name":"언어 분포","value":"한국어, 힌디어, 영어(소량)"},{"@type":"PropertyValue","name":"데이터 형식","value":"이미지 형식은 .jpg, 라벨링 문서 형식은 .json"},{"@type":"PropertyValue","name":"라벨링 박스 형태 분포","value":"한국어 315,822개 사각형 박스, 240,091개 다각형 박스, 힌디어 780개 사각형 박스, 199,671개 다각형 박스, 2개 직사각형 박스"},{"@type":"PropertyValue","name":"라벨링 내용","value":"행 단위 다각형 박스(또는 사각형 박스, 직사각형 박스) 라벨링, 행 단위 내용 전사, 텍스트 속성(언어 종류), 열 단위 다각형 박스(또는 사각형 박스, 직사각형 박스) 라벨링, 열 단위 내용 전사, 텍스트 속성(언어 종류)"},{"@type":"PropertyValue","name":"정확도","value":"라벨링 박스 꼭짓점 편차가 5픽셀 이내일 경우 정확한 검출로 간주하며, 검출 박스 정확도는 97% 이상, 텍스트 전사 정확도는 97% 이상"}]
{"id":1254,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"104,320장 한국어 및 힌디어 자연 환경 OCR 데이터","datazy":[{"title":"데이터 규모","desc":"데이터 규모","content":"한국어 76,861장, 555,913개 박스, 힌디어 27,459장, 200,453개 박스"},{"title":"수집 환경","desc":"수집 환경","content":"상품 포장, 포스터, 차표, 안내문, 메뉴, 건물 표지 등 포함"},{"title":"수집 다양성","desc":"수집 다양성","content":"다양한 자연 환경, 촬영 각도, 조명 조건"},{"title":"수집 장비","desc":"수집 장비","content":"스마트폰"},{"title":"촬영 각도","desc":"촬영 각도","content":"앙각, 부감, 평시"},{"title":"언어 분포","desc":"언어 분포","content":"한국어, 힌디어, 영어(소량)"},{"title":"데이터 형식","desc":"데이터 형식","content":"이미지 형식은 .jpg, 라벨링 문서 형식은 .json"},{"title":"라벨링 박스 형태 분포","desc":"라벨링 박스 형태 분포","content":"한국어 315,822개 사각형 박스, 240,091개 다각형 박스, 힌디어 780개 사각형 박스, 199,671개 다각형 박스, 2개 직사각형 박스"},{"title":"라벨링 내용","desc":"라벨링 내용","content":"행 단위 다각형 박스(또는 사각형 박스, 직사각형 박스) 라벨링, 행 단위 내용 전사, 텍스트 속성(언어 종류), 열 단위 다각형 박스(또는 사각형 박스, 직사각형 박스) 라벨링, 열 단위 내용 전사, 텍스트 속성(언어 종류)"},{"title":"정확도","desc":"정확도","content":"라벨링 박스 꼭짓점 편차가 5픽셀 이내일 경우 정확한 검출로 간주하며, 검출 박스 정확도는 97% 이상, 텍스트 전사 정확도는 97% 이상"}],"datatag":"Multiple natural scenes,Multiple shooting angles,Multiple light conditions","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/2.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/2.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1xXx3CKukYZpXUoWeGQa3UM5%2F5A%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/3.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/3.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=k36XqpwImWbppq62S04QPeMPSEA%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/1.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/1.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=zyhyQSDYy6jTbpF3nc4f%2F09ufT4%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"104,320장의 한국어 및 힌디어 자연 환경 OCR 데이터 수집 장면에는 상품 포장, 포스터, 차표, 안내문, 메뉴, 건물 표지 등이 포함됩니다. 데이터 다양성에는 다양한 장면, 다양한 촬영 각도, 다양한 조명 조건이 포함됩니다. 언어 분포는 한국어, 힌디어 및 영어(소량)입니다. 라벨링 측면에서 데이터는 행 단위 다각형 박스(또는 사각형 박스, 직사각형 박스) 라벨링, 행 단위 내용 전사, 텍스트 속성(언어 종류), 열 단위 다각형 박스(또는 사각형 박스, 직사각형 박스) 라벨링, 열 단위 내용 전사, 텍스트 속성(언어 종류)이 포함됩니다. 본 한국어 및 힌디어 자연 환경 OCR 데이터는 한국어 및 힌디어 자연 환경에서의 OCR 작업에 활용 가능합니다.","dataexampl":null,"datakeyword":["한국어"," 힌디어"," OCR 데이터"," 자연 환경"," OCR 전사 데이터"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"104,320 Images - Korean and Hindi OCR Data in Natural Scenes","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/5.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/5.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=59499xW%2FRbwxe18fQPgO5cjSQFE%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
104,320장의 한국어 및 힌디어 자연 환경 OCR 데이터 수집 장면에는 상품 포장, 포스터, 차표, 안내문, 메뉴, 건물 표지 등이 포함됩니다. 데이터 다양성에는 다양한 장면, 다양한 촬영 각도, 다양한 조명 조건이 포함됩니다. 언어 분포는 한국어, 힌디어 및 영어(소량)입니다. 라벨링 측면에서 데이터는 행 단위 다각형 박스(또는 사각형 박스, 직사각형 박스) 라벨링, 행 단위 내용 전사, 텍스트 속성(언어 종류), 열 단위 다각형 박스(또는 사각형 박스, 직사각형 박스) 라벨링, 열 단위 내용 전사, 텍스트 속성(언어 종류)이 포함됩니다. 본 한국어 및 힌디어 자연 환경 OCR 데이터는 한국어 및 힌디어 자연 환경에서의 OCR 작업에 활용 가능합니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
사양
데이터 규모
한국어 76,861장, 555,913개 박스, 힌디어 27,459장, 200,453개 박스
수집 환경
상품 포장, 포스터, 차표, 안내문, 메뉴, 건물 표지 등 포함
수집 다양성
다양한 자연 환경, 촬영 각도, 조명 조건
수집 장비
스마트폰
촬영 각도
앙각, 부감, 평시
언어 분포
한국어, 힌디어, 영어(소량)
데이터 형식
이미지 형식은 .jpg, 라벨링 문서 형식은 .json
라벨링 박스 형태 분포
한국어 315,822개 사각형 박스, 240,091개 다각형 박스, 힌디어 780개 사각형 박스, 199,671개 다각형 박스, 2개 직사각형 박스
라벨링 내용
행 단위 다각형 박스(또는 사각형 박스, 직사각형 박스) 라벨링, 행 단위 내용 전사, 텍스트 속성(언어 종류), 열 단위 다각형 박스(또는 사각형 박스, 직사각형 박스) 라벨링, 열 단위 내용 전사, 텍스트 속성(언어 종류)
정확도
라벨링 박스 꼭짓점 편차가 5픽셀 이내일 경우 정확한 검출로 간주하며, 검출 박스 정확도는 97% 이상, 텍스트 전사 정확도는 97% 이상