100,000쌍의 중국어 범용 대형 언어 모델 복잡 지시문 SFT 텍스트 데이터셋
10만 쌍의 복잡한 중국어 프롬프트 명령으로, 글자 수는 50~400자이며, 각 프롬프트에는 최소 3개의 제약 조건이 포함됩니다. 대규모 모델의 명령 준수성을 훈련시키는 데 사용됩니다. 카테고리는 생성(보도자료 작성, 인터뷰 질의지 작성, 카피라이팅, 원고 교정, 영중 작문, 문법 학습, 리서치 보고서, 학습 계획서, 시 창작, 푸드 리뷰, 기사형 광고, 영업 설득 멘트, 공문서 작성 보조, 공문서 검토, 정책 문서 Q&A 등), 재작성(문장 재작성, 텍스트 오류 교정, 문장 통합, 카피 간소화), 요약(내용 요약), 추출(사건 요소 추출, 의견 추출, 키워드 추출, 입장 추출, 개체명 추출)을 포함합니다. 모든 프롬프트는 인력 기반 작성으로 다양성을 포함합니다.
대형 언어 모델 명령어 따르기 감독 미세 조정