[{"@type":"PropertyValue","name":"데이터 내용","value":"200,475문장 텍스트에 대해 한자 표기로 전사"},{"@type":"PropertyValue","name":"데이터 규모","value":"200,475문장 원본 텍스트, 457,832개 라벨 포함"},{"@type":"PropertyValue","name":"데이터 출처","value":"다양한 소설, 기사, 뉴스에서 추출한 문장"},{"@type":"PropertyValue","name":"언어","value":"중국어"},{"@type":"PropertyValue","name":"라벨링 내용","value":"문장 내 특정 기호 및 아라비아 숫자를 한자 표기로 라벨링"},{"@type":"PropertyValue","name":"적용 장면","value":"TTS, 텍스트 정규화"}]
{"id":1102,"datatype":"1","titleimg":"https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"219","type2str":null,"dataname":"200,475문장 TN 데이터","datazy":[{"title":"데이터 내용","desc":"데이터 내용","content":"200,475문장 텍스트에 대해 한자 표기로 전사"},{"title":"데이터 규모","desc":"데이터 규모","content":"200,475문장 원본 텍스트, 457,832개 라벨 포함"},{"title":"데이터 출처","desc":"데이터 출처","content":"다양한 소설, 기사, 뉴스에서 추출한 문장"},{"title":"언어","desc":"언어","content":"중국어"},{"title":"라벨링 내용","desc":"라벨링 내용","content":"문장 내 특정 기호 및 아라비아 숫자를 한자 표기로 라벨링"},{"title":"적용 장면","desc":"적용 장면","content":"TTS, 텍스트 정규화"}],"datatag":"TN,TTS,Text Normalization","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY210430001_demo1711360879318/APY210430001_demo/20210927171813646_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY210430001_demo1711360879318/APY210430001_demo/20210927171813646_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=95%2FPPMl0M9RjZnQHrGFRikiiJ5k%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"해당 TN 데이터는 총 200,475개의 원문 문장을 포함하고 있으며, 각 문장에는 텍스트 내의 특수 기호 및 숫자에 대한 한자 발음 표기가 라벨링되어 있습니다.","dataexampl":null,"datakeyword":["TN 데이터"," 텍스트 정규화 데이터"," 음성 합성 데이터"," 음성 합성 데이터셋"," 음성 합성 데이터"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Voice Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechSyn","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"200,475 Sentences - Chinese Text Normalization Data","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://ko.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY210430001_demo1711360879318/APY210430001_demo/20210927171813646_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=95%2FPPMl0M9RjZnQHrGFRikiiJ5k%3D"}]
200,475문장 TN 데이터
TN 데이터
텍스트 정규화 데이터
음성 합성 데이터
음성 합성 데이터셋
음성 합성 데이터
해당 TN 데이터는 총 200,475개의 원문 문장을 포함하고 있으며, 각 문장에는 텍스트 내의 특수 기호 및 숫자에 대한 한자 발음 표기가 라벨링되어 있습니다.
이는 상업적 사용, 연구 목적 등을 위한 유료 데이터셋입니다.라이선스가 부여된 기성 데이터셋은 AI 프로젝트의 빠른 시작에 도움을 줍니다.
![사양]()
사양
데이터 내용
200,475문장 텍스트에 대해 한자 표기로 전사
데이터 규모
200,475문장 원본 텍스트, 457,832개 라벨 포함
데이터 출처
다양한 소설, 기사, 뉴스에서 추출한 문장
라벨링 내용
문장 내 특정 기호 및 아라비아 숫자를 한자 표기로 라벨링
![샘플]()
샘플
![추천 데이터셋]()
추천 데이터셋
061e33ba-3aa9-479d-9a71-fd696f82c833