[{"@type":"PropertyValue","name":"데이터 규모","value":"5,000장 이미지, 40,793개의 박스"},{"@type":"PropertyValue","name":"수집 환경","value":"슬로건, 영수증, 포스터, 경고문, 도로 표지판, 서적, 표지, 정류장 표지판 및 간판 포함"},{"@type":"PropertyValue","name":"수집 다양성","value":"다양한 자연 환경 및 촬영 각도"},{"@type":"PropertyValue","name":"수집 장비","value":"스마트폰"},{"@type":"PropertyValue","name":"촬영 각도","value":"앙각, 부감, 평시"},{"@type":"PropertyValue","name":"데이터 형식","value":"이미지 형식은 .jpg 등 일반 형식, 라벨링 문서 형식은 .json"},{"@type":"PropertyValue","name":"라벨링 내용","value":"행 단위 사각형 박스 라벨링, 행 단위 텍스트 전사, 다각형 박스 라벨링 및 텍스트 전사"},{"@type":"PropertyValue","name":"정확도","value":"사각형 또는 다각형 박스의 꼭짓점 오차가 5픽셀 이내일 경우 정확한 검출로 간주하며, 검출 박스 정밀도는 95% 이상, 텍스트 전사 정확도는 95% 이상"}]
{"id":1697,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"5,000장 터키어 자연 환경 OCR 데이터","datazy":[{"title":"데이터 규모","desc":"데이터 규모","content":"5,000장 이미지, 40,793개의 박스"},{"title":"수집 환경","desc":"수집 환경","content":"슬로건, 영수증, 포스터, 경고문, 도로 표지판, 서적, 표지, 정류장 표지판 및 간판 포함"},{"title":"수집 다양성","desc":"수집 다양성","content":"다양한 자연 환경 및 촬영 각도"},{"title":"수집 장비","desc":"수집 장비","content":"스마트폰"},{"title":"촬영 각도","desc":"촬영 각도","content":"앙각, 부감, 평시"},{"title":"데이터 형식","desc":"데이터 형식","content":"이미지 형식은 .jpg 등 일반 형식, 라벨링 문서 형식은 .json"},{"title":"라벨링 내용","desc":"라벨링 내용","content":"행 단위 사각형 박스 라벨링, 행 단위 텍스트 전사, 다각형 박스 라벨링 및 텍스트 전사"},{"title":"정확도","desc":"정확도","content":"사각형 또는 다각형 박스의 꼭짓점 오차가 5픽셀 이내일 경우 정확한 검출로 간주하며, 검출 박스 정밀도는 95% 이상, 텍스트 전사 정확도는 95% 이상"}],"datatag":"OCR,Turkish,Natural scenes","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"1.blend.jpg","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250218135414/1.blend.jpg?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=%2BC7jduYpt8DmDke%2BVXsgRn9qwwo%3D","intro":"","size":7561940,"progress":100,"type":"jpg"},{"name":"2.blend.jpg","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250218135414/2.blend.jpg?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=9vW9I24uS%2B8XnHbtkWnTvpbj5so%3D","intro":"","size":492148,"progress":100,"type":"jpg"},{"name":"5.blend.jpg","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250218135414/5.blend.jpg?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=aOn7eSs%2FLztr97RKqf9lY3mIvno%3D","intro":"","size":3601387,"progress":100,"type":"jpg"}],"officialSummary":"5,000장의 터키어 자연 장면 OCR 데이터는 다양한 자연 장면과 다양한 촬영 각도를 포함하고 있습니다. 라벨링 측면에서는 행 단위 텍스트에 대해 사각형 박스 및 다각형 박스를 사용하여 라벨링하고, 해당 텍스트를 전사하였습니다. 본 데이터는 터키어 OCR 과제에 활용될 수 있습니다.","dataexampl":null,"datakeyword":["OCR"," 터키어"," 자연 환경"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"5,000 Images of Turkish Natural Scene OCR Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"7.blend.jpg","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250218135414/7.blend.jpg?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=k%2Bo0KcjMojZfvfGN98ADDvkoJo4%3D","intro":"","size":1048881,"progress":100,"type":"jpg"}]}
5,000장의 터키어 자연 장면 OCR 데이터는 다양한 자연 장면과 다양한 촬영 각도를 포함하고 있습니다. 라벨링 측면에서는 행 단위 텍스트에 대해 사각형 박스 및 다각형 박스를 사용하여 라벨링하고, 해당 텍스트를 전사하였습니다. 본 데이터는 터키어 OCR 과제에 활용될 수 있습니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
사양
데이터 규모
5,000장 이미지, 40,793개의 박스
수집 환경
슬로건, 영수증, 포스터, 경고문, 도로 표지판, 서적, 표지, 정류장 표지판 및 간판 포함
수집 다양성
다양한 자연 환경 및 촬영 각도
수집 장비
스마트폰
촬영 각도
앙각, 부감, 평시
데이터 형식
이미지 형식은 .jpg 등 일반 형식, 라벨링 문서 형식은 .json
라벨링 내용
행 단위 사각형 박스 라벨링, 행 단위 텍스트 전사, 다각형 박스 라벨링 및 텍스트 전사
정확도
사각형 또는 다각형 박스의 꼭짓점 오차가 5픽셀 이내일 경우 정확한 검출로 간주하며, 검출 박스 정밀도는 95% 이상, 텍스트 전사 정확도는 95% 이상