[{"@type":"PropertyValue","name":"데이터 규모","value":"14,980장, 8개 언어"},{"@type":"PropertyValue","name":"수집 환경","value":"회의실(회장), 회의장 포함"},{"@type":"PropertyValue","name":"언어 분류","value":"프랑스어, 한국어, 일본어, 스페인어, 독일어, 이탈리아어, 포르투갈어, 러시아어"},{"@type":"PropertyValue","name":"수집 다양성","value":"다양한 장면, 다양한 언어, 다양한 촬영 각도, 다양한 촬영 거리, 다양한 조명 조건 포함"},{"@type":"PropertyValue","name":"수집 장비","value":"모바일"},{"@type":"PropertyValue","name":"수집 각도","value":"정면, 측면(좌, 우), 앙각"},{"@type":"PropertyValue","name":"데이터 형식","value":"이미지 포맷 .jpg, 라벨 문서 포맷 .json"},{"@type":"PropertyValue","name":"라벨링 내용","value":"행 단위 사각형 라벨링, 행 단위 사각형 전사"},{"@type":"PropertyValue","name":"정확도","value":"사각형 프레임 꼭짓점 편차 5픽셀 이내가 올바른 검출, 검출 정확도 95% 이상; 텍스트 전사 정확도 95% 이상"}]
{"id":979,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"14,980장 8개 언어 PPT OCR 데이터","datazy":[{"title":"데이터 규모","desc":"데이터 규모","content":"14,980장, 8개 언어"},{"title":"수집 환경","desc":"수집 환경","content":"회의실(회장), 회의장 포함"},{"title":"언어 분류","desc":"언어 분류","content":"프랑스어, 한국어, 일본어, 스페인어, 독일어, 이탈리아어, 포르투갈어, 러시아어"},{"title":"수집 다양성","desc":"수집 다양성","content":"다양한 장면, 다양한 언어, 다양한 촬영 각도, 다양한 촬영 거리, 다양한 조명 조건 포함"},{"title":"수집 장비","desc":"수집 장비","content":"모바일"},{"title":"수집 각도","desc":"수집 각도","content":"정면, 측면(좌, 우), 앙각"},{"title":"데이터 형식","desc":"데이터 형식","content":"이미지 포맷 .jpg, 라벨 문서 포맷 .json"},{"title":"라벨링 내용","desc":"라벨링 내용","content":"행 단위 사각형 라벨링, 행 단위 사각형 전사"},{"title":"정확도","desc":"정확도","content":"사각형 프레임 꼭짓점 편차 5픽셀 이내가 올바른 검출, 검출 정확도 95% 이상; 텍스트 전사 정확도 95% 이상"}],"datatag":"Multiple scenes,Multiple languages,Different photographic angles,Different photographic distances,Different light conditions","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/2.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/2.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=sqPdc1rGwcLu%2BK2TLOwTHcVrLQs%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/3.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/3.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=uOxRQ0dl8DcDwkjpEaXwlvSDyPg%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/1.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/1.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1jE3Q1rsa7koY0u0viSa%2FobOefo%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"14,980장 8개 언어 PPT OCR 데이터는 8개 언어, 다양한 장면, 여러 촬영 각도, 다양한 촬영 거리, 다양한 조명 조건을 포함합니다. 라벨링 측면에서는 행 단위 텍스트의 사각형(4각형) 박스와 행 단위 텍스트 전사를 포함합니다. 본 다국어 PPT OCR 데이터는 다국어 OCR 작업에 활용할 수 있습니다.","dataexampl":null,"datakeyword":["PPT"," OCR"," 회의실"," 컨퍼런스 룸"," 다양한 촬영 각도"," 다른 촬영 거리"," 다양한 조도 조건"," 텍스트에 대한 라인 수준 사각형 바운딩 박스 주석 및 전사"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"14,980 Images PPT OCR Data of 8 Languages","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/5.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/5.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=kydEh0XnVloXhfsJGmIByO3Vi6U%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
14,980장 8개 언어 PPT OCR 데이터는 8개 언어, 다양한 장면, 여러 촬영 각도, 다양한 촬영 거리, 다양한 조명 조건을 포함합니다. 라벨링 측면에서는 행 단위 텍스트의 사각형(4각형) 박스와 행 단위 텍스트 전사를 포함합니다. 본 다국어 PPT OCR 데이터는 다국어 OCR 작업에 활용할 수 있습니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
사양
데이터 규모
14,980장, 8개 언어
수집 환경
회의실(회장), 회의장 포함
언어 분류
프랑스어, 한국어, 일본어, 스페인어, 독일어, 이탈리아어, 포르투갈어, 러시아어
수집 다양성
다양한 장면, 다양한 언어, 다양한 촬영 각도, 다양한 촬영 거리, 다양한 조명 조건 포함
수집 장비
모바일
수집 각도
정면, 측면(좌, 우), 앙각
데이터 형식
이미지 포맷 .jpg, 라벨 문서 포맷 .json
라벨링 내용
행 단위 사각형 라벨링, 행 단위 사각형 전사
정확도
사각형 프레임 꼭짓점 편차 5픽셀 이내가 올바른 검출, 검출 정확도 95% 이상; 텍스트 전사 정확도 95% 이상