[{"@type":"PropertyValue","name":"데이터 규모","value":"3,506장, 자연 장면 이미지 2,056장; 인터넷 이미지 텍스트 1,103장; 텍스트 이미지 347장 포함"},{"@type":"PropertyValue","name":"수집 환경","value":"자연 장면(간판, 포장 설명, 전단지, 메뉴판, 포스터 등), 인터넷 이미지(잡지 표지, 만화 표지 등), 텍스트 이미지(문서 등)"},{"@type":"PropertyValue","name":"수집 다양성","value":"다양한 장면, 다양한 각도, 다양한 조명 조건 포함"},{"@type":"PropertyValue","name":"수집 장비","value":"모바일"},{"@type":"PropertyValue","name":"수집 각도","value":"앙각,수평"},{"@type":"PropertyValue","name":"데이터 형식","value":"이미지 포맷은 .jpg, 라벨링 문서 포맷은 .json"},{"@type":"PropertyValue","name":"라벨링 내용","value":"행 단위 사각형 라벨링, 행 단위 내용 전사; 열 단위 사각형 라벨링, 열 단위 내용 전사"},{"@type":"PropertyValue","name":"정확도","value":"사각형 박스 꼭짓점의 오차가 10픽셀 이하일 경우 정확한 검출로 간주, 검출 박스 정확도는 97% 이상; 텍스트 전사 정확도는 97% 이상"}]
{"id":1058,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"3,506장 힌디어 OCR 라벨링 및 전사 데이터","datazy":[{"title":"데이터 규모","desc":"데이터 규모","content":"3,506장, 자연 장면 이미지 2,056장; 인터넷 이미지 텍스트 1,103장; 텍스트 이미지 347장 포함"},{"title":"수집 환경","desc":"수집 환경","content":"자연 장면(간판, 포장 설명, 전단지, 메뉴판, 포스터 등), 인터넷 이미지(잡지 표지, 만화 표지 등), 텍스트 이미지(문서 등)"},{"title":"수집 다양성","desc":"수집 다양성","content":"다양한 장면, 다양한 각도, 다양한 조명 조건 포함"},{"title":"수집 장비","desc":"수집 장비","content":"모바일"},{"title":"수집 각도","desc":"수집 각도","content":"앙각,수평"},{"title":"데이터 형식","desc":"데이터 형식","content":"이미지 포맷은 .jpg, 라벨링 문서 포맷은 .json"},{"title":"라벨링 내용","desc":"라벨링 내용","content":"행 단위 사각형 라벨링, 행 단위 내용 전사; 열 단위 사각형 라벨링, 열 단위 내용 전사"},{"title":"정확도","desc":"정확도","content":"사각형 박스 꼭짓점의 오차가 10픽셀 이하일 경우 정확한 검출로 간주, 검출 박스 정확도는 97% 이상; 텍스트 전사 정확도는 97% 이상"}],"datatag":"Hindi OCR,Multiple scenes,Multiple angles,Different light conditions","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00004.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00004.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1RHyBQ877xadK9qW66Lj6Ivikq0%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00006.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00006.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ZYCVjKlMLMjdYWQ17c9BpniCAa0%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00027.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00027.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=p8LQVuz%2BoHuw%2BP8mwBwq45M3q9Q%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"3,506장의 힌디어 OCR 라벨링 및 전사 데이터는 자연 장면 이미지 2,056장, 인터넷 이미지 1,103장, 텍스트 이미지 347장을 포함합니다. 라벨링 측면에서는 행 단위 내용에 대해 행 단위 사각형 박스 라벨링과 행 단위 내용 전사가 이루어지며, 세로열 내용에 대해서는 세로열 사각형 박스 라벨링과 세로열 내용 전사가 포함됩니다. 본 힌디어 OCR 라벨링 및 전사 데이터는 다양한 장면에서의 힌디어 인식 및 힌디어 촬영 번역 등 작업에 활용될 수 있습니다.","dataexampl":null,"datakeyword":["힌디어"," OCR"," 문서 이미지"," 인터넷 이미지"," 자연 장면"," 다양한 각도"," 다른 조도 조건"," 사각형 바운딩 박스 주석"," 텍스트 라인 수준 전사"," 컬럼 수준 전사"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"3,506 Hindi OCR Images Data - Images with Annotation and Transcription","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00001.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00001.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VNNczsPK38IDN%2F2BxuBFYMdpzBc%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
3,506장의 힌디어 OCR 라벨링 및 전사 데이터는 자연 장면 이미지 2,056장, 인터넷 이미지 1,103장, 텍스트 이미지 347장을 포함합니다. 라벨링 측면에서는 행 단위 내용에 대해 행 단위 사각형 박스 라벨링과 행 단위 내용 전사가 이루어지며, 세로열 내용에 대해서는 세로열 사각형 박스 라벨링과 세로열 내용 전사가 포함됩니다. 본 힌디어 OCR 라벨링 및 전사 데이터는 다양한 장면에서의 힌디어 인식 및 힌디어 촬영 번역 등 작업에 활용될 수 있습니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
사양
데이터 규모
3,506장, 자연 장면 이미지 2,056장; 인터넷 이미지 텍스트 1,103장; 텍스트 이미지 347장 포함
수집 환경
자연 장면(간판, 포장 설명, 전단지, 메뉴판, 포스터 등), 인터넷 이미지(잡지 표지, 만화 표지 등), 텍스트 이미지(문서 등)
수집 다양성
다양한 장면, 다양한 각도, 다양한 조명 조건 포함
수집 장비
모바일
수집 각도
앙각,수평
데이터 형식
이미지 포맷은 .jpg, 라벨링 문서 포맷은 .json
라벨링 내용
행 단위 사각형 라벨링, 행 단위 내용 전사; 열 단위 사각형 라벨링, 열 단위 내용 전사
정확도
사각형 박스 꼭짓점의 오차가 10픽셀 이하일 경우 정확한 검출로 간주, 검출 박스 정확도는 97% 이상; 텍스트 전사 정확도는 97% 이상