[{"@type":"PropertyValue","name":"저장 형식","value":"TXT"},{"@type":"PropertyValue","name":"데이터 내용","value":"한위 병렬 말뭉치"},{"@type":"PropertyValue","name":"데이터 규모","value":"10만 쌍 한위 병렬 말뭉치"},{"@type":"PropertyValue","name":"언어","value":"중국어, 위구르어"},{"@type":"PropertyValue","name":"적용 장면","value":"기계 번역"}]
{"id":149,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp","type1":"183","type1str":null,"type2":"185","type2str":null,"dataname":"10만 쌍 한-위구르 평행 코퍼스 데이터","datazy":[{"title":"저장 형식","desc":"저장 형식","content":"TXT"},{"title":"데이터 내용","desc":"데이터 내용","content":"한위 병렬 말뭉치"},{"title":"데이터 규모","desc":"데이터 규모","content":"10만 쌍 한위 병렬 말뭉치"},{"title":"언어","desc":"언어","content":"중국어, 위구르어"},{"title":"적용 장면","desc":"적용 장면","content":"기계 번역"}],"datatag":"Chinese-Uighur,Parallel Corpus","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY170101225_demo1711015202833/HW01509034_demo/HW01509034_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY170101225_demo1711015202833/HW01509034_demo/HW01509034_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=x%2FUBRlWPRlYDQsi2b%2BrA9Go9QWQ%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"한-위구르 평행 말뭉치 데이터는 10만 쌍의 한어와 위구르어 평행 번역 문장을 포함하며, 데이터는 txt 포맷으로 저장되어 있습니다. 데이터의 유창성과 충실도는 80% 이상입니다. 이미 데이터 정제, 익명 처리, 품질 검수를 완료했으며, 텍스트 분석 기본 말뭉치로 활용 가능하고 기계 번역 등 분야에 적합합니다.","dataexampl":null,"datakeyword":["중국어-위구르어 병렬 코퍼스 데이터"," 정렬 코퍼스"," 병렬 코퍼스 데이터"," 정렬 코퍼스 데이터"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"nlu","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"100,000 Groups - Chinese-Uighur Parallel Corpus Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://ko.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY170101225_demo1711015202833/HW01509034_demo/HW01509034_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=x%2FUBRlWPRlYDQsi2b%2BrA9Go9QWQ%3D"}]
10만 쌍 한-위구르 평행 코퍼스 데이터
중국어-위구르어 병렬 코퍼스 데이터
정렬 코퍼스
병렬 코퍼스 데이터
정렬 코퍼스 데이터
한-위구르 평행 말뭉치 데이터는 10만 쌍의 한어와 위구르어 평행 번역 문장을 포함하며, 데이터는 txt 포맷으로 저장되어 있습니다. 데이터의 유창성과 충실도는 80% 이상입니다. 이미 데이터 정제, 익명 처리, 품질 검수를 완료했으며, 텍스트 분석 기본 말뭉치로 활용 가능하고 기계 번역 등 분야에 적합합니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
![사양]()
사양
![샘플]()
샘플
![추천 데이터셋]()
추천 데이터셋
5f928c81-f48a-4679-93c5-d2f4d5ff5fa6