[{"@type":"PropertyValue","name":"형식","value":"영상 mp4 포맷, 1,280*720; 음성 wav 포맷, 16kHz 16bit 모노"},{"@type":"PropertyValue","name":"녹화 환경","value":"창문 있는 밝은 안실 내 모의 주간 운전 장면; 신호대 잡음비 1520dB"},{"@type":"PropertyValue","name":"녹화 장면","value":"조명 강도에 따른 대/소 장면 분류"},{"@type":"PropertyValue","name":"녹화 내용","value":"짧은 명령어, 구어 문장"},{"@type":"PropertyValue","name":"화자 정보","value":"249명 중국인, 남성 125명, 여성 124명"},{"@type":"PropertyValue","name":"녹음 장비","value":"카메라, 고음질 마이크, 사운드 카드"},{"@type":"PropertyValue","name":"촬영 각도","value":"정면, 단일 측면 얼굴, 부감, 앙각, 측면 조감, 측면 앙시점 6개 각도 영상(음성 포함), 근거리 및 원거리 2개 거리 음성(영상 제외) 동시 녹음"},{"@type":"PropertyValue","name":"언어","value":"표준어"},{"@type":"PropertyValue","name":"적용 장면","value":"립싱크 인식"},{"@type":"PropertyValue","name":"정확도","value":"문장 정확도 95%"}]
{"id":996,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"168","type2str":null,"dataname":"155시간 립싱크 영상 데이터_멀티모달","datazy":[{"title":"형식","desc":"형식","content":"영상 mp4 포맷, 1,280*720; 음성 wav 포맷, 16kHz 16bit 모노"},{"title":"녹화 환경","desc":"녹화 환경","content":"창문 있는 밝은 안실 내 모의 주간 운전 장면; 신호대 잡음비 1520dB"},{"title":"녹화 장면","desc":"녹화 장면","content":"조명 강도에 따른 대/소 장면 분류"},{"title":"녹화 내용","desc":"녹화 내용","content":"짧은 명령어, 구어 문장"},{"title":"화자 정보","desc":"화자 정보","content":"249명 중국인, 남성 125명, 여성 124명"},{"title":"녹음 장비","desc":"녹음 장비","content":"카메라, 고음질 마이크, 사운드 카드"},{"title":"촬영 각도","desc":"촬영 각도","content":"정면, 단일 측면 얼굴, 부감, 앙각, 측면 조감, 측면 앙시점 6개 각도 영상(음성 포함), 근거리 및 원거리 2개 거리 음성(영상 제외) 동시 녹음"},{"title":"언어","desc":"언어","content":"표준어"},{"title":"적용 장면","desc":"적용 장면","content":"립싱크 인식"},{"title":"정확도","desc":"정확도","content":"문장 정확도 95%"}],"datatag":"Lip Language,Multimodal,Mandarin,Reading,Mobile Phone,Video camera","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY190322001_demo1715767200180/APY190322001/39-1_7.mp4","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190322001_demo1715767200180/APY190322001/39-1_7.mp4?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=CXlfsrjdCwQkhc3n1EVtI%2Fpm8fE%3D","intro":"","size":0,"progress":100,"type":"mp4"},{"name":"/data/apps/damp/temp/ziptemp/APY190322001_demo1715767200180/APY190322001/18-1_6.mp4","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190322001_demo1715767200180/APY190322001/18-1_6.mp4?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=Q6wG5SACXEx%2FwO8OAJz9mcmQ%2BEI%3D","intro":"","size":0,"progress":100,"type":"mp4"},{"name":"/data/apps/damp/temp/ziptemp/APY190322001_demo1715767200180/APY190322001/31-1_2.mp4","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190322001_demo1715767200180/APY190322001/31-1_2.mp4?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VLqukWwvgzvK1TYD8TaPyAvkwyo%3D","intro":"","size":0,"progress":100,"type":"mp4"}],"officialSummary":"249명이 참여하여 음성 및 이에 상응하는 입모양 비디오를 다중 장비 동기화 방식으로 녹음하였으며, 펄스 신호를 통해 정밀하게 정렬하였습니다. 정확도가 높아 음성 및 영상 분야의 멀티모달 학습 알고리즘 연구에 활용할 수 있습니다. 다수 AI 기업 검증 결과, 본 데이터는 모델이 실제 세계의 다양성에 대응하는 성능 향상에 도움을 줍니다. 저희는 데이터 수집, 저장 및 사용 과정에서 사용자 개인정보와 법적 권리를 엄격히 보호하며, 모든 데이터는 GDPR, CCPA, PIPL을 준수합니다.","dataexampl":null,"datakeyword":["입술 언어"," 멀티모달"," 보통화"," 낭독"," 모바일 폰"," 비디오 카메라"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"155 Hours – Lip Sync Multimodal Video Data","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY190322001_demo1715767200180/APY190322001/5-1_4.mp4","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190322001_demo1715767200180/APY190322001/5-1_4.mp4?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2kWsbA%2FAu1%2Bb7WGo37pQLws%2F0tk%3D","intro":"","size":0,"progress":100,"type":"mp4"}]}
https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"VideoObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190322001_demo1715767200180/APY190322001/39-1_7.mp4?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=CXlfsrjdCwQkhc3n1EVtI%2Fpm8fE%3D"},{"@type":"VideoObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190322001_demo1715767200180/APY190322001/18-1_6.mp4?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=Q6wG5SACXEx%2FwO8OAJz9mcmQ%2BEI%3D"},{"@type":"VideoObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190322001_demo1715767200180/APY190322001/31-1_2.mp4?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VLqukWwvgzvK1TYD8TaPyAvkwyo%3D"},{"@type":"VideoObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190322001_demo1715767200180/APY190322001/5-1_4.mp4?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2kWsbA%2FAu1%2Bb7WGo37pQLws%2F0tk%3D"}]
155시간 립싱크 영상 데이터_멀티모달
입술 언어
멀티모달
보통화
낭독
모바일 폰
비디오 카메라
249명이 참여하여 음성 및 이에 상응하는 입모양 비디오를 다중 장비 동기화 방식으로 녹음하였으며, 펄스 신호를 통해 정밀하게 정렬하였습니다. 정확도가 높아 음성 및 영상 분야의 멀티모달 학습 알고리즘 연구에 활용할 수 있습니다. 다수 AI 기업 검증 결과, 본 데이터는 모델이 실제 세계의 다양성에 대응하는 성능 향상에 도움을 줍니다. 저희는 데이터 수집, 저장 및 사용 과정에서 사용자 개인정보와 법적 권리를 엄격히 보호하며, 모든 데이터는 GDPR, CCPA, PIPL을 준수합니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
![사양]()
사양
형식
영상 mp4 포맷, 1,280*720; 음성 wav 포맷, 16kHz 16bit 모노
녹화 환경
창문 있는 밝은 안실 내 모의 주간 운전 장면; 신호대 잡음비 1520dB
화자 정보
249명 중국인, 남성 125명, 여성 124명
녹음 장비
카메라, 고음질 마이크, 사운드 카드
촬영 각도
정면, 단일 측면 얼굴, 부감, 앙각, 측면 조감, 측면 앙시점 6개 각도 영상(음성 포함), 근거리 및 원거리 2개 거리 음성(영상 제외) 동시 녹음
![샘플]()
샘플
![추천 데이터셋]()
추천 데이터셋
91d0ad96-dd1d-4ff5-917e-1e7cc3b20f3b