[{"@type":"PropertyValue","name":"저장 형식","value":"TXT"},{"@type":"PropertyValue","name":"데이터 내용","value":"중러 병렬 말뭉치"},{"@type":"PropertyValue","name":"데이터 규모","value":"100만 쌍의 중러 병렬 데이터, 중국어 평균 문장 길이 14.6자"},{"@type":"PropertyValue","name":"언어","value":"중국어, 러시아어"},{"@type":"PropertyValue","name":"적용 장면","value":"기계 번역"}]
{"id":1071,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp","type1":"183","type1str":null,"type2":"185","type2str":null,"dataname":"100만개 중-러 병렬 텍스트","datazy":[{"title":"저장 형식","desc":"저장 형식","content":"TXT"},{"title":"데이터 내용","desc":"데이터 내용","content":"중러 병렬 말뭉치"},{"title":"데이터 규모","desc":"데이터 규모","content":"100만 쌍의 중러 병렬 데이터, 중국어 평균 문장 길이 14.6자"},{"title":"언어","desc":"언어","content":"중국어, 러시아어"},{"title":"적용 장면","desc":"적용 장면","content":"기계 번역"}],"datatag":"Chinese,Russian,Chinese-Russian,Parallel corpus","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY200214003_demo1711015207620/APY200214003_demo/APY200214003.jpeg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200214003_demo1711015207620/APY200214003_demo/APY200214003.jpeg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=aHqzFroaIoDYyUGvhr4Wr0IdTlk%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"100만쌍의 중러 병렬 번역 코퍼스이며, 데이터 저장 포맷은 txt 문서입니다. 데이터는 여행, 의약, 일상, 드라마 등 다양한 분야를 포함하고 있습니다. 데이터 정제, 비식별화, 품질 검사를 완료하였으며, 텍스트 데이터 분석의 기본 코퍼스로서 기계 번역 등 분야에 활용할 수 있습니다.","dataexampl":null,"datakeyword":["중국어-러시아어 병렬 코퍼스 데이터"," 중국어-러시아어 정렬"," 병렬 코퍼스 데이터"," 정렬 코퍼스 데이터"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"nlu","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"1,000,000 Groups - Chinese-Russian Parallel Corpus Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://ko.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200214003_demo1711015207620/APY200214003_demo/APY200214003.jpeg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=aHqzFroaIoDYyUGvhr4Wr0IdTlk%3D"}]
100만개 중-러 병렬 텍스트
중국어-러시아어 병렬 코퍼스 데이터
중국어-러시아어 정렬
병렬 코퍼스 데이터
정렬 코퍼스 데이터
100만쌍의 중러 병렬 번역 코퍼스이며, 데이터 저장 포맷은 txt 문서입니다. 데이터는 여행, 의약, 일상, 드라마 등 다양한 분야를 포함하고 있습니다. 데이터 정제, 비식별화, 품질 검사를 완료하였으며, 텍스트 데이터 분석의 기본 코퍼스로서 기계 번역 등 분야에 활용할 수 있습니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
![사양]()
사양
데이터 규모
100만 쌍의 중러 병렬 데이터, 중국어 평균 문장 길이 14.6자
![샘플]()
샘플
![추천 데이터셋]()
추천 데이터셋
11af5166-2913-402a-b1e6-b909358f3dcb