[{"@type":"PropertyValue","name":"데이터 규모","value":"50만 장, 각 언어별로 자연 환경과 문서 각각 12,500장 포함"},{"@type":"PropertyValue","name":"언어 종류 분포","value":"번체 중국어, 일본어, 한국어, 인도네시아어, 말레이시아어, 태국어, 베트남어, 프랑스어, 독일어, 이탈리아어, 포르투갈어, 러시아어, 스페인어, 아랍어, 터키어, 폴란드어, 네덜란드어, 그리스어, 체코어, 필리핀어(따갈로그어)"},{"@type":"PropertyValue","name":"수집 환경","value":"자연 환경: 슬로건, 영수증, 포스터, 경고문, 도로 표지판, 식품 포장, 광고판, 정류장 표지판 및 간판 등, 문서: 전자 문서, 회의 기록, 보고서, 설명서, 사용자 매뉴얼, 서적 및 신문, 교재 등"},{"@type":"PropertyValue","name":"수집 다양성","value":"다양한 자연 환경 및 촬영 각도"},{"@type":"PropertyValue","name":"수집 장비","value":"스마트폰, 스캐너 사용"},{"@type":"PropertyValue","name":"촬영 각도","value":"앙각, 부감, 평시"},{"@type":"PropertyValue","name":"데이터 형식","value":"이미지 형식은 .jpg 등 일반 이미지 포맷"},{"@type":"PropertyValue","name":"정확도","value":"수집 요구 사항에 따라 수집 정확도는 97% 이상"}]
{"id":1759,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"50만 장 다국가 자연 환경 및 문서 OCR 데이터","datazy":[{"title":"데이터 규모","desc":"데이터 규모","content":"50만 장, 각 언어별로 자연 환경과 문서 각각 12,500장 포함"},{"title":"언어 종류 분포","desc":"언어 종류 분포","content":"번체 중국어, 일본어, 한국어, 인도네시아어, 말레이시아어, 태국어, 베트남어, 프랑스어, 독일어, 이탈리아어, 포르투갈어, 러시아어, 스페인어, 아랍어, 터키어, 폴란드어, 네덜란드어, 그리스어, 체코어, 필리핀어(따갈로그어)"},{"title":"수집 환경","desc":"수집 환경","content":"자연 환경: 슬로건, 영수증, 포스터, 경고문, 도로 표지판, 식품 포장, 광고판, 정류장 표지판 및 간판 등, 문서: 전자 문서, 회의 기록, 보고서, 설명서, 사용자 매뉴얼, 서적 및 신문, 교재 등"},{"title":"수집 다양성","desc":"수집 다양성","content":"다양한 자연 환경 및 촬영 각도"},{"title":"수집 장비","desc":"수집 장비","content":"스마트폰, 스캐너 사용"},{"title":"촬영 각도","desc":"촬영 각도","content":"앙각, 부감, 평시"},{"title":"데이터 형식","desc":"데이터 형식","content":"이미지 형식은 .jpg 등 일반 이미지 포맷"},{"title":"정확도","desc":"정확도","content":"수집 요구 사항에 따라 수집 정확도는 97% 이상"}],"datatag":"Natural scenes, Documents, OCR","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"Italian.jpg","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250408181303/Italian.jpg?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=4PPPhAekKh9bLbFrSmO6wAeEHmw%3D","intro":"","size":1809941,"progress":100,"type":"jpg"},{"name":"German.JPG","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250408181303/German.JPG?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=jtiszx3%2FxhwmY8Lf11kG1CS7kYA%3D","intro":"","size":4991935,"progress":100,"type":"jpg"},{"name":"German-1.jpg","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250408181303/German-1.jpg?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=bAy%2FbH26hDUdacLQwMwnMTvj390%3D","intro":"","size":963208,"progress":100,"type":"jpg"}],"officialSummary":"500,000장의 다국적 자연 장면 및 문서 OCR 데이터는 번체 중국어, 일본어, 한국어, 인도네시아어, 말레이어, 태국어, 베트남어, 폴란드어 등 총 20개 언어를 포함합니다. 다양한 자연 장면과 촬영 각도를 반영한 수집 방식으로, 다국어 OCR 과제에 활용될 수 있는 데이터입니다.","dataexampl":null,"datakeyword":["자연 환경"," 문서"," OCR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"500,000 Images - Natural Scenes and Documents OCR Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"Korean.jpg","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250408181303/Korean.jpg?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=rMkhxOhurCs7nUTnO5puCPLBo6s%3D","intro":"","size":1218381,"progress":100,"type":"jpg"}]}
500,000장의 다국적 자연 장면 및 문서 OCR 데이터는 번체 중국어, 일본어, 한국어, 인도네시아어, 말레이어, 태국어, 베트남어, 폴란드어 등 총 20개 언어를 포함합니다. 다양한 자연 장면과 촬영 각도를 반영한 수집 방식으로, 다국어 OCR 과제에 활용될 수 있는 데이터입니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.