[{"@type":"PropertyValue","name":"데이터 규모","value":"57,645장의 이미지,528,553개의 바운딩 박스"},{"@type":"PropertyValue","name":"수집 환경","value":"거리 풍경, 간판, 광고판, 포스터, 장식, 예술 글씨, 잡지 표지 등"},{"@type":"PropertyValue","name":"수집 다양성","value":"다양한 장면 및 글씨체"},{"@type":"PropertyValue","name":"언어 분포","value":"중국어, 영어(소량)"},{"@type":"PropertyValue","name":"라벨 박스 방향별 수량","value":"수직 박스 324,399개, 비수직 박스 204,154개"},{"@type":"PropertyValue","name":"라벨링 박스 형태 분포","value":"직사각형 박스 34,936개, 다각형 박스 220,716개, 평행사변형 272,901개"},{"@type":"PropertyValue","name":"데이터 형식","value":"이미지 데이터 형식은 .jpg, 라벨링 문서 형식은 .json"},{"@type":"PropertyValue","name":"라벨링 내용","value":"열 단위 직사각형 박스(다각형/평행사변형) 라벨링 및 내용 전사, 비수직 직사각형 박스(다각형/평행사변형) 라벨링 및 내용 전사"},{"@type":"PropertyValue","name":"정확도","value":"라벨링 박스 꼭짓점 편차가 5픽셀 이내일 경우 정확한 검출로 간주하며, 검출 박스 정확도는 97% 이상, 텍스트 전사 정확도는 97% 이상"}]
{"id":1226,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"57,645장 수직 텍스트 OCR 데이터","datazy":[{"title":"데이터 규모","desc":"데이터 규모","content":"57,645장의 이미지,528,553개의 바운딩 박스"},{"title":"수집 환경","desc":"수집 환경","content":"거리 풍경, 간판, 광고판, 포스터, 장식, 예술 글씨, 잡지 표지 등"},{"title":"수집 다양성","desc":"수집 다양성","content":"다양한 장면 및 글씨체"},{"title":"언어 분포","desc":"언어 분포","content":"중국어, 영어(소량)"},{"title":"라벨 박스 방향별 수량","desc":"라벨 박스 방향별 수량","content":"수직 박스 324,399개, 비수직 박스 204,154개"},{"title":"라벨링 박스 형태 분포","desc":"라벨링 박스 형태 분포","content":"직사각형 박스 34,936개, 다각형 박스 220,716개, 평행사변형 272,901개"},{"title":"데이터 형식","desc":"데이터 형식","content":"이미지 데이터 형식은 .jpg, 라벨링 문서 형식은 .json"},{"title":"라벨링 내용","desc":"라벨링 내용","content":"열 단위 직사각형 박스(다각형/평행사변형) 라벨링 및 내용 전사, 비수직 직사각형 박스(다각형/평행사변형) 라벨링 및 내용 전사"},{"title":"정확도","desc":"정확도","content":"라벨링 박스 꼭짓점 편차가 5픽셀 이내일 경우 정확한 검출로 간주하며, 검출 박스 정확도는 97% 이상, 텍스트 전사 정확도는 97% 이상"}],"datatag":"OCR,Multiple scenes,Multiple fonts","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/054889_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/054889_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=tDNg2Jmp1JEEZiTMQB2hIFr17SI%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/056472_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/056472_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=sGLSMlt8%2BocGKzLN0YYIgRrTg78%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/054886_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/054886_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2t3vBygA4k0HDuTQq9h%2ByOBmO8E%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"57,645장의 수직 문서 OCR 데이터로, 거리 풍경, 간판, 광고판, 포스터, 장식, 예술 글씨, 잡지 표지 등 다양한 환경에서 수집되었습니다. 언어는 중국어를 위주로 하며 소량의 영어도 포함되어 있습니다. 라벨은 열 단위 직사각형 박스(다각형/평행사변형) 라벨링 및 내용 전사, 비수직 직사각형 박스(다각형/평행사변형) 라벨링 및 내용 전사하였습니다. 본 데이터셋은 다양한 수직 텍스트 OCR 작업에 활용 가능합니다.","dataexampl":null,"datakeyword":["수직 텍스트 OCR 데이터"," OCR 이미지 데이터"," OCR 데이터"," OCR 데이터셋"," OCR 라벨링 데이터"," OCR 수집 데이터"," OCR 데이터 처리"," OCR 재작성 데이터"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"57,645 Images - Vertical OCR Data in Text Scenes","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/056480_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/056480_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2d2r3%2FYQASEMnhCBsTgJBTu2y74%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
57,645장의 수직 문서 OCR 데이터로, 거리 풍경, 간판, 광고판, 포스터, 장식, 예술 글씨, 잡지 표지 등 다양한 환경에서 수집되었습니다. 언어는 중국어를 위주로 하며 소량의 영어도 포함되어 있습니다. 라벨은 열 단위 직사각형 박스(다각형/평행사변형) 라벨링 및 내용 전사, 비수직 직사각형 박스(다각형/평행사변형) 라벨링 및 내용 전사하였습니다. 본 데이터셋은 다양한 수직 텍스트 OCR 작업에 활용 가능합니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
사양
데이터 규모
57,645장의 이미지,528,553개의 바운딩 박스
수집 환경
거리 풍경, 간판, 광고판, 포스터, 장식, 예술 글씨, 잡지 표지 등
수집 다양성
다양한 장면 및 글씨체
언어 분포
중국어, 영어(소량)
라벨 박스 방향별 수량
수직 박스 324,399개, 비수직 박스 204,154개
라벨링 박스 형태 분포
직사각형 박스 34,936개, 다각형 박스 220,716개, 평행사변형 272,901개
데이터 형식
이미지 데이터 형식은 .jpg, 라벨링 문서 형식은 .json
라벨링 내용
열 단위 직사각형 박스(다각형/평행사변형) 라벨링 및 내용 전사, 비수직 직사각형 박스(다각형/평행사변형) 라벨링 및 내용 전사
정확도
라벨링 박스 꼭짓점 편차가 5픽셀 이내일 경우 정확한 검출로 간주하며, 검출 박스 정확도는 97% 이상, 텍스트 전사 정확도는 97% 이상