[{"@type":"PropertyValue","name":"데이터 규모","value":"20,011장의 이미지, 20,011개의 설명"},{"@type":"PropertyValue","name":"언어 종류 분포","value":"아시아 언어계: 한국어, 인도네시아어, 말레이어, 베트남어, 태국어, 중국어, 일본어, 유럽 언어계: 프랑스어, 독일어, 이탈리아어, 포르투갈어, 러시아어, 스페인어, 영어"},{"@type":"PropertyValue","name":"수집 환경","value":"가게 간판, 정류장 표지판, 포스터, 도로 표지판, 안내문 등 다양한 장면 포함"},{"@type":"PropertyValue","name":"수집 다양성","value":"14개 언어, 다양한 자연 장면, 촬영 각도를 포함"},{"@type":"PropertyValue","name":"데이터 형식","value":"이미지 형식 .jpg, 텍스트 형식 .txt"},{"@type":"PropertyValue","name":"수집 장비","value":"스마트폰, 카메라"},{"@type":"PropertyValue","name":"설명 언어","value":"영어"},{"@type":"PropertyValue","name":"텍스트 길이","value":"원칙적으로 30~60개 단어, 일반적으로 3~5개 문장 포함"},{"@type":"PropertyValue","name":"주요 기술 내용","value":"문자 배열 방식, 문자 내용, 색상, 장면"},{"@type":"PropertyValue","name":"정확도","value":"정확하게 라벨링된 이미지 비율 97% 이상"}]
{"id":1288,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"226","type1str":null,"type2":"254","type2str":null,"dataname":"20,011장의 자연 환경 OCR 설명 데이터","datazy":[{"title":"데이터 규모","desc":"데이터 규모","content":"20,011장의 이미지, 20,011개의 설명"},{"title":"언어 종류 분포","desc":"언어 종류 분포","content":"아시아 언어계: 한국어, 인도네시아어, 말레이어, 베트남어, 태국어, 중국어, 일본어, 유럽 언어계: 프랑스어, 독일어, 이탈리아어, 포르투갈어, 러시아어, 스페인어, 영어"},{"title":"수집 환경","desc":"수집 환경","content":"가게 간판, 정류장 표지판, 포스터, 도로 표지판, 안내문 등 다양한 장면 포함"},{"title":"수집 다양성","desc":"수집 다양성","content":"14개 언어, 다양한 자연 장면, 촬영 각도를 포함"},{"title":"데이터 형식","desc":"데이터 형식","content":"이미지 형식 .jpg, 텍스트 형식 .txt"},{"title":"수집 장비","desc":"수집 장비","content":"스마트폰, 카메라"},{"title":"설명 언어","desc":"설명 언어","content":"영어"},{"title":"텍스트 길이","desc":"텍스트 길이","content":"원칙적으로 30~60개 단어, 일반적으로 3~5개 문장 포함"},{"title":"주요 기술 내용","desc":"주요 기술 내용","content":"문자 배열 방식, 문자 내용, 색상, 장면"},{"title":"정확도","desc":"정확도","content":"정확하게 라벨링된 이미지 비율 97% 이상"}],"datatag":"AIGC,English caption,OCR caption,Multiple shooting angles,Multinational scenes","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/??10.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F10.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=MCVrBqb27YBjyCDI0Jnyl3bJBGA%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/??6.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F6.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=YloKf4W4lvZRZqUksIOndlMhK5E%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/??7.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F7.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=MaMzeRl2B1sFE7KT28iUKO33omo%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"20,011장의 자연 환경 OCR 설명 데이터는 아시아 언어계와 유럽 언어계를 포함하여 총 14개 언어로 구성되었습니다. 가게 간판, 정류장 표지판, 포스터, 도로 표지판 등 다양한 환경에서 수집되었으며, 다양한 촬영 각도를 포함합니다. 기술 언어는 영어로, 주로 문자 배열 방식, 문자 내용, 색상 등의 정보를 기술합니다.","dataexampl":null,"datakeyword":["AIGC"," 영어 자막"," OCR 자막"," 다국어 OCR 데이터"," OCR 데이터"," OCR 데이터셋"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"llm","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"20,011 Image Caption Data of OCR in Natural Scenes","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/??9.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F9.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VEHblArfRzk5e3PLr2jzicBVmRY%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
20,011장의 자연 환경 OCR 설명 데이터는 아시아 언어계와 유럽 언어계를 포함하여 총 14개 언어로 구성되었습니다. 가게 간판, 정류장 표지판, 포스터, 도로 표지판 등 다양한 환경에서 수집되었으며, 다양한 촬영 각도를 포함합니다. 기술 언어는 영어로, 주로 문자 배열 방식, 문자 내용, 색상 등의 정보를 기술합니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
사양
데이터 규모
20,011장의 이미지, 20,011개의 설명
언어 종류 분포
아시아 언어계: 한국어, 인도네시아어, 말레이어, 베트남어, 태국어, 중국어, 일본어, 유럽 언어계: 프랑스어, 독일어, 이탈리아어, 포르투갈어, 러시아어, 스페인어, 영어