发布时间:2024-12-06 22:27:38

#T5翻译模型 #机器翻译 #深度学习 #自然语言处理 #文本翻译 #中韩翻译 #神经机器翻译 #HuggingFace #Transformer模型 #NLP教程 #Python翻译代码 #T5应用 #多语言翻译 #神经网络 #文本生成 #翻译工具 #语言对齐模型 #数据科学 #人工智能翻译 #预训练模型 #韩文翻译 #中文翻译 #机器学习 #翻译案例 #代码复现 #深度学习教程 #Excel数据处理 #翻译算法 #T5教程 #文本处理 数据集:【中韩文本翻译数据集】经典小说中韩文句子翻译对齐数据集 235 25
本内容由, 集智官方收集发布,仅供参考学习,不代表集智官方赞同其观点或证实其内容的真实性准确性,请勿用于商业用途。
数据集介绍:

本数据集是一个中韩文章短句翻译数据集,专门用于中韩语言对的翻译研究与应用。数据集包含了多本经典书籍中的句子翻译,涵盖了丰富的历史与文学内容,包括:

  • 百家公案
  • 北齐书
  • 北史
  • 北极探险
  • 白居易诗全集

每条数据包含中文原句及其对应的韩文翻译,并附有相关的文本信息,如小说名称、作者、分词、章节id等,便于进行更深入的分析与处理。数据集的表格格式为xlsx,结构清晰,易于操作,具体字段包括:

  • id:唯一标识符
  • 韩文翻译:原句的韩文翻译
  • 中文原句:句子的中文内容
  • 小说名称:句子所在的小说或书籍名称
  • 小说作者:该小说或书籍的作者
  • 分词:中文原句的分词结果
  • 章节id:句子所在的章节编号
  • 预置状态:用于标记数据集是否已经处理完成

该数据集适用于中韩翻译研究、机器翻译、对齐模型训练、跨语言文本分析等领域,并且能够帮助提升中韩语言之间的自然语言处理技术。


| 友情链接: | 网站地图 | 更新日志 |


Copyright ©2024 集智软件工作室. 本站数据文章仅供研究、学习用途,禁止商用,使用时请注明数据集作者出处;本站数据均来自于互联网,如有侵权请联系本站删除。