[{"@type":"PropertyValue","name":"데이터 규모","value":"9,574장, 243,240개 박스"},{"@type":"PropertyValue","name":"언어 종류 분포","value":"영어, 스페인어, 포르투갈어, 프랑스어, 독일어, 일본어, 이탈리아어, 네덜란드어"},{"@type":"PropertyValue","name":"수집 환경","value":"칠판, 화이트보드, 그린보드"},{"@type":"PropertyValue","name":"수집 장비","value":"스마트폰"},{"@type":"PropertyValue","name":"촬영 각도","value":"평시, 부감, 앙각"},{"@type":"PropertyValue","name":"데이터 형식","value":"이미지 데이터 형식은 .jpg 등 일반 이미지 형식, 라벨 파일 형식은 .json"},{"@type":"PropertyValue","name":"라벨링 내용","value":"행 단위 4각형(다각형) 라벨링, 내용 전사"},{"@type":"PropertyValue","name":"정확도","value":"사각형 박스 꼭짓점 편차가 5픽셀 이하일 경우 올바른 검출로 인정, 검출 박스 정확도 95% 이상, 텍스트 전사 정확도 95% 이상"}]
{"id":1522,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"9,574장 8개국 게시판 손글씨 OCR 데이터","datazy":[{"title":"데이터 규모","desc":"데이터 규모","content":"9,574장, 243,240개 박스"},{"title":"언어 종류 분포","desc":"언어 종류 분포","content":"영어, 스페인어, 포르투갈어, 프랑스어, 독일어, 일본어, 이탈리아어, 네덜란드어"},{"title":"수집 환경","desc":"수집 환경","content":"칠판, 화이트보드, 그린보드"},{"title":"수집 장비","desc":"수집 장비","content":"스마트폰"},{"title":"촬영 각도","desc":"촬영 각도","content":"평시, 부감, 앙각"},{"title":"데이터 형식","desc":"데이터 형식","content":"이미지 데이터 형식은 .jpg 등 일반 이미지 형식, 라벨 파일 형식은 .json"},{"title":"라벨링 내용","desc":"라벨링 내용","content":"행 단위 4각형(다각형) 라벨링, 내용 전사"},{"title":"정확도","desc":"정확도","content":"사각형 박스 꼭짓점 편차가 5픽셀 이하일 경우 올바른 검출로 인정, 검출 박스 정확도 95% 이상, 텍스트 전사 정확도 95% 이상"}],"datatag":"Handwriting,OCR,Black board,White board,Green board","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"English.jpg","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250520181645/English.jpg?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=iXnFSR4p1zCPdImOWx4vrYdgpTk%3D","intro":"","size":3706616,"progress":100,"type":"jpg"},{"name":"English-1.jpg","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250520181645/English-1.jpg?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=avTJb3O47GRlf350BDF64u7Pg1I%3D","intro":"","size":1563589,"progress":100,"type":"jpg"},{"name":"French.jpg","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250520181645/French.jpg?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=I94DzxisImSVjIMOdYAr2oC5tqM%3D","intro":"","size":1028972,"progress":100,"type":"jpg"}],"officialSummary":"9,574장의 8개 외국어 게시판 손글씨 OCR 데이터입니다. 언어는 영어, 스페인어, 포르투갈어 등을 포함하며, 다양한 수집 환경, 여러 종류의 문자 매체, 다국어 및 다양한 수집 각도(평시, 올려다봄, 내려다봄)를 포함합니다. 라벨링은 텍스트를 행 단위 사각형(다각형)으로 표시하고 내용 전사를 수행하였습니다. 본 데이터는 손글씨 OCR 작업에 활용될 수 있습니다.","dataexampl":null,"datakeyword":["손글씨"," OCR"," 칠판"," 화이트보드"," 그린보드"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"9,574 Images – Handwriting OCR Data On Board of 8 Languages","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"German.jpg","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250520181645/German.jpg?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=vMIP6sYPAFSoLdpyUqVyw%2BQoUNA%3D","intro":"","size":3863985,"progress":100,"type":"jpg"}]}
9,574장의 8개 외국어 게시판 손글씨 OCR 데이터입니다. 언어는 영어, 스페인어, 포르투갈어 등을 포함하며, 다양한 수집 환경, 여러 종류의 문자 매체, 다국어 및 다양한 수집 각도(평시, 올려다봄, 내려다봄)를 포함합니다. 라벨링은 텍스트를 행 단위 사각형(다각형)으로 표시하고 내용 전사를 수행하였습니다. 본 데이터는 손글씨 OCR 작업에 활용될 수 있습니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
사양
데이터 규모
9,574장, 243,240개 박스
언어 종류 분포
영어, 스페인어, 포르투갈어, 프랑스어, 독일어, 일본어, 이탈리아어, 네덜란드어
수집 환경
칠판, 화이트보드, 그린보드
수집 장비
스마트폰
촬영 각도
평시, 부감, 앙각
데이터 형식
이미지 데이터 형식은 .jpg 등 일반 이미지 형식, 라벨 파일 형식은 .json
라벨링 내용
행 단위 4각형(다각형) 라벨링, 내용 전사
정확도
사각형 박스 꼭짓점 편차가 5픽셀 이하일 경우 올바른 검출로 인정, 검출 박스 정확도 95% 이상, 텍스트 전사 정확도 95% 이상