[{"@type":"PropertyValue","name":"저장 형식","value":"TXT"},{"@type":"PropertyValue","name":"데이터 내용","value":"중일 병렬 말뭉치"},{"@type":"PropertyValue","name":"데이터 규모","value":"983만 쌍의 중일 병렬 데이터"},{"@type":"PropertyValue","name":"언어","value":"중국어, 일본어"},{"@type":"PropertyValue","name":"적용 장면","value":"기계 번역"},{"@type":"PropertyValue","name":"정확도","value":"0.9"}]
{"id":1069,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp","type1":"183","type1str":null,"type2":"185","type2str":null,"dataname":"983만개 중-일 평행 코퍼스 데이터","datazy":[{"title":"저장 형식","desc":"저장 형식","content":"TXT"},{"title":"데이터 내용","desc":"데이터 내용","content":"중일 병렬 말뭉치"},{"title":"데이터 규모","desc":"데이터 규모","content":"983만 쌍의 중일 병렬 데이터"},{"title":"언어","desc":"언어","content":"중국어, 일본어"},{"title":"적용 장면","desc":"적용 장면","content":"기계 번역"},{"title":"정확도","desc":"정확도","content":"0.9"}],"datatag":"Chinese,Japanese,Sino-Japan,Parallel corpus","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY200214001_demo1711015206921/APY200214001_demo/APY200214001.jpeg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200214001_demo1711015206921/APY200214001_demo/APY200214001.jpeg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=UWIrRqUw8h3Pnd7JBAu5O%2Bi2CRk%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"983만쌍의 중일 병렬 번역 코퍼스이며, 데이터 저장 포맷은 txt 문서입니다. 데이터는 일반, IT, 뉴스, 특허, 국제 공학의 다섯 분야를 포함하고 있습니다. 데이터 정제, 비식별화, 품질 검사를 완료하였으며, 텍스트 데이터 분석의 기본 코퍼스로서 기계 번역 등 분야에 활용할 수 있습니다.","dataexampl":null,"datakeyword":["중국어-일본어 병렬 코퍼스"," 중국어-일본어 정렬"," 병렬 코퍼스 데이터"," 정렬 코퍼스 데이터"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"nlu","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"9,830,000 Groups - Chinese-Japanese Parallel Corpus Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://ko.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200214001_demo1711015206921/APY200214001_demo/APY200214001.jpeg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=UWIrRqUw8h3Pnd7JBAu5O%2Bi2CRk%3D"}]
983만개 중-일 평행 코퍼스 데이터
중국어-일본어 병렬 코퍼스
중국어-일본어 정렬
병렬 코퍼스 데이터
정렬 코퍼스 데이터
983만쌍의 중일 병렬 번역 코퍼스이며, 데이터 저장 포맷은 txt 문서입니다. 데이터는 일반, IT, 뉴스, 특허, 국제 공학의 다섯 분야를 포함하고 있습니다. 데이터 정제, 비식별화, 품질 검사를 완료하였으며, 텍스트 데이터 분석의 기본 코퍼스로서 기계 번역 등 분야에 활용할 수 있습니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
![사양]()
사양
![샘플]()
샘플
![추천 데이터셋]()
추천 데이터셋
c69943f1-e68f-4055-afca-4dda397dc800