艾瑞网

搜索
登录登录用户注册

搜索历史

热搜词

互联网

百度联合发起千言计划实现情感分析2.0升级，推动中文情感分析技术进步

来源：互联网作者： 2021年10月21日 17:23

导语：

数据集是推动自然语言处理技术进步的基石。为应对自然语言处理技术应用中面临的多领域、多场景等诸多挑战，百度联合中国计算机学会、中国中文信息学会，于2020年8月共同发起中文自然语言处理数据共建计划——“千言”，推进中文信息处理技术的进步。

发布一年多以来，“千言”已针对开放域对话、阅读理解和情感分析等8个任务，汇集了来自11所高校和企业的28个开源数据集。其中，情感分析作为自然语言处理技术的基本任务之一，涵盖了句子级情感分类、评价对象级情感分类、观点抽取三个经典任务数据集，吸引了来自京东、网易、小米、平安、OPPO、新浪等多家知名企业的近300支团队参加打榜。

近日，为了更好地推动情感分析技术在大规模产业化的应用，百度联合中国中文信息学会情感计算专业委员会、美团共同发布千言-情感分析2.0，实现两方面的重大提升。首先，在继续关注模型准确率效果的同时，加强对模型是否“可信”的评估，发布业界首个中文情感可信数据集DuTrust；其次，针对产业化中面临的任务类型、数据模态多样化的难题，提供面向真实应用场景的大规模、高质量、多模态的情感分析数据，发布业界最大规模的中文评论分析数据集ASAP和面向推荐场景的多模态情感标签数据集DuVideoSenti。

发布业界首个中文情感可信数据集DuTrust

“可信AI”的概念在近几年提出，并且逐渐成为全球共识。可信AI，就是保证AI系统的公平性、可解释性、鲁棒性和透明性，确保算法可被人信任。在情感分析技术的科学研究和产业落地中，可信情感分析系统需要模型具备较强的鲁棒性，还需要模型具备可解释能力，也就是需要模型既能给出精准的预测结果，还能给出其判断依据，从而保证模型的预测结果更加置信。

作为业界首个中文情感可信数据集，DuTrust基于人工标注的扰动数据和情感证据，全部来源于真实用户评论数据，同时测试模型的鲁棒性和可解释性，全面评估模型的可信能力。

中文情感可信数据集DuTrust数据样例

以上述评论数据为例，DuTrust首先为每个样例对应标注一个扰动样本，并且标注原始样本和扰动样本的情感类别，通过计算模型在原始样例和扰动样例上预测的准确率（Accuracy）作为模型鲁棒性的评估指标。

此外，DuTrust还分别为原始样例以及扰动样例人工标注了情感的判断依据，在可解释性评估时，需要用户同时给出模型的情感判别依据，最终通过计算其与人工标注结果在字粒度上重合度F1值（F1-measure）作为模型可解释性的评估指标。

联合发布业界最大规模的中文评论分析数据集ASAP

在电商场景下，一般来说情感分析涉及评论得分预估和对象级情感分类两个最基础的任务。两个任务之间天然存在很强的关联性，且在商业应用中也通常一起使用。然而现有的中文公开数据集大都针对两个任务分别构建，未能将两类任务有效联系起来。

此次“千言”与美团联合发布的业界最大规模中文评论分析数据集ASAP，首次实现对评论得分预估和对象级情感分类两个任务的联合标注，数据全部源于真实的电商场景，从数据规模和标注质量上都远超其他数据集。

中文评论分析数据集ASAP数据样例

该数据集针对输入的评论文本，人工标注整体的评论得分（1-5分），以及对应不同评价对象的情感类别（积极、消极、中性三种），并且使用准确率（Accuracy）评估模型的预测效果。

发布面向推荐场景的多模态视频情感标签数据集DuVideoSenti

目前，个性化推荐技术迅猛发展，成为继搜索引擎之后的又一重要的信息获取途径。推荐系统的目的是为用户提供个性化的内容和服务，帮助用户快速高效的获取个性化信息。

在真实的应用场景中，往往存在大量内容题材、质量相同，但却能给用户带来不同视觉冲击和情感感受的资源。针对这类资源，需要构建能够刻画用户不同的视觉和情感感受的完备的标签体系，才能将其更好地应用于推荐系统，提升用户的体验。

千言面向推荐场景推出多模态情感标签数据集DuVideoSenti，引入视频情感泛标签预测任务，构建了视频情感泛标签体系。该体系由人工定义的“文艺清新”、“时尚炫酷”、“舒适温馨”等11个情感泛标签组成，用以刻画用户浏览视频后的视觉和情感方面的感受。数据集为每个小视频标注了情感泛标签，并且提供了视频的标题、帧图特征用于模型的训练和预测。在测试中使用准确率（Accuracy）用于评估模型的预测效果。本数据集聚焦情感分析技术在个性化推荐场景中的应用，同时有助于推动多模态学习技术的发展。