114 | 文本情感分析中如何做意见总结和搜索？

洪亮劼



该思维导图由 AI 生成，仅供参考

在文本“情感分析”（Sentiment Analysis）这个领域，我们首先介绍了最基础的文档情感分类这个问题。在绝大多数情况下，这是一个监督学习的问题。当然，我们也可以通过建立情感词库来进行简单的非监督学习的步骤。紧接着，我们讨论了文本情感分析中的另一个关键技术，即情感“实体”和“方面”的提取。这个任务可以说是很多情感分析的根基，我们需要从无结构的文本中提取实体和方面等结构信息，便于进一步的分析。我们讲了如何通过词频、挖掘配对信息以及利用监督学习来对实体和方面进行挖掘。
今天，我们来看文本情感分析的另外一个主题——意见总结（Opinion Summarization）和意见搜索（Opinion Search）。
意见总结为什么“意见总结”这个任务会很重要的呢？
假如你希望在电商网站上购买一款数码相机。这个时候，你可能需要打开好几款相机的页面进行比较。对于相机的硬件指标，能够从这些页面上相对容易地直接得到，除此以外，你可能还比较关心对这些相机的评价。
在这个场景下，“意见总结”的重要性就凸显出来了。因为优秀的相机款式往往有上百甚至上千的用户评价，这些评价包括了用户对产品很多方面的评价，有褒义和贬义的情绪。如果对这些评价逐一进行浏览，很明显是一种非常低效的做法。因此，从购物网站的角度来说，如果能够为用户把这些评论进行总结，从而让用户看到总体的有代表性的评论，无疑能够帮助用户节省不少时间和精力，让用户获得更好的体验。
简单来说，意见总结就是从无结构的文本中提取出来的各种情感信息的综合表达。我们这里聊的意见总结主要是指“基于方面的意见总结”（Aspect-based Opinion Summarization）。也就是说，意见的总结主要是围绕着产品的种种方面来产生的。
概括一下，基于方面的意见总结有两个特点。第一，这样的总结主要是针对物体的实体以及对应的方面来进行的。第二，意见总结需要提供数量化的总结。什么是数量化的总结？就是总结里需要指出，持有某种意见的用户占多少百分比，又有多少百分比的用户有其他意见。很明显，这里还牵涉到如何表达和显示这些意见总结的步骤。
可以说，基于方面的意见总结成为了意见总结的主要任务。另外，基于方面的意见总结还可以与其他文本技术相结合，从而能够延展这个技术的效果。比如，总结语句的生成可以分为“句子选择”和“人工句子生成”这两种方案。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

文本情感分析中的意见总结和搜索是一项高级技术，对于读者来说具有重要意义。在文本情感分析中，意见总结是从无结构的文本中提取各种情感信息的综合表达，主要围绕着产品的各种方面展开。这种总结需要提供数量化的结果，指出持有某种意见的用户占多少百分比，以及其他意见的比例。另外，意见搜索是建立在意见总结之上的任务，需要针对意见信息进行索引和检索，以返回和特定主体相关的意见信息。这一过程需要设计评分机制和模型，以返回最有说服力的文档，并进行意见总结。总的来说，意见搜索是对意见分析和总结的一个综合体现。通过本文，读者可以了解到意见总结和搜索在文本情感分析中的重要性、基本概念和技术，以及两者的关系和技术实现。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《AI 技术内参》，新⼈⾸单¥98

立即购买

登录后留言

全部留言(1)

最新
精选

Jtay-dlz
常用的观点如何包含售后，价格，服务等等的话，我觉得用户对产品的评价可能还包含品牌的评价，好友的评价，产品的知名度和流行程度，是否和自己风格相搭
2020-05-05



收起评论