集智数据集|输入关键词搜索

供您参考使用

搜索结果|共8条数据

耗时:66/毫秒

文本分类
英文垃圾邮件分类数据集 2024-09-14 09:36:44

899 106

       该数据集包含了一组电子邮件样本,每个样本都标记为两类之一:正常邮件(ham)或垃圾邮件(spam)。数据集以CSV表格格式存储,其中包含以下字段:

      • label: 分类标签,指示邮件是否为正常邮件(ham)或垃圾邮件(spam)。
      • text: 邮件正文文本。
      • label_num: 标签的数值编码,其中“ham”编码为0,“spam”编码为1。

       此数据集可用于训练和评估垃圾邮件检测模型,特别是对于那些希望使用传统机器学习方法(如朴素贝叶斯分类器)的研究人员和开发者来说非常有用。通过该数据集,用户可以开发出高效的垃圾邮件过滤系统,减少用户的邮件负担,并提高信息安全性。


# 垃圾邮件分类 # 朴素贝叶斯 # 机器学习 # Python # 数据预处理 # CSV数据集 # 文本分类 # 垃圾邮件检测 # 传统机器学习 # sklearn # 文本特征提取 # 信息安全性 # 电子邮件过滤 # 分类报告 # 准确率评估


文本分类
七言律诗数据集 2024-09-07 15:31:27

363 14

       该数据集收集了几万条七言律诗,每一首诗都遵循七言律诗的规范,即每句七个汉字,并且符合平仄对仗和押韵规则。数据集以纯文本(txt)格式存储,旨在为诗词爱好者、文学研究者以及自然语言处理领域的技术人员提供一个丰富且高质量的资源库。

       数据集特点:

      • 诗歌形式:七言律诗
      • 数据规模:几万条
      • 文本格式:纯文本(txt)
      • 内容涵盖:古代经典作品
      • 应用场景:诗词鉴赏、文学研究、自然语言处理、机器学习模型训练、自动诗词生成等

       通过本数据集,用户不仅可以深入了解七言律诗的艺术魅力,还可以利用这些数据进行各种技术研究,如自然语言处理、文本生成模型的训练等。无论是文学爱好者还是技术开发者,都可以从中获得灵感和支持。


# 七言律诗 # 深度学习 # BERT # PyTorch # 古典文学 # 自然语言处理 # 诗词数据集 # 文本分类 # 微调BERT # 诗歌分析 # 中文NLP # 诗词生成 # 机器学习在文学中的应用 # HuggingFaceTransformers # 文本预处理 # 诗词主题分类


| 友情链接: | 网站地图 | 更新日志 |


Copyright ©2024 集智软件工作室. 本站数据文章仅供研究、学习用途,禁止商用,使用时请注明数据集作者出处;本站数据均来自于互联网,如有侵权请联系本站删除。