数据集介绍本数据集包含约8000条新闻资讯,旨在为自然语言处理(NLP)和文本分析提供多维度的信息支持。每条记录包括标题中文分词拼音英文翻译与分词以及新闻的情感属性(积极消极或中性)。,字段包括,标题新闻的标题内容。类型新闻的分类类型(例如政治经济科技等)。中文分词标题中的中文词汇分词结果,便于文本处理。拼音标题中文字符的拼音表示。英文翻译标题的英文翻译,便于跨语言处理。英文分词英文翻译的分词结果。是否为热点标明新闻是否为当前热点事件(如是否)。属性情感属性标注(消极积极或中性),指示新闻的情感倾向。关联词汇与新闻标题相关的关键词汇,有助于识别新闻的主题或内容。此外,数据集还标注了新闻是否为热点事件,并提供了相关联的关键词汇,适用于情感分析热点新闻检测跨语言翻译等研究和应用。,数据集读取数据集为.xlsx格式,方便使用pandas等库进行调用读取,,