113 | 如何来提取情感“实体”和“方面”呢？

洪亮劼



该思维导图由 AI 生成，仅供参考

从上一篇分享开始，我们转入文本分析的另外一个领域，文本“情感分析”（Sentiment Analysis），也就是指我们要针对一段文本来判断其文字“色彩”。文本情感分析是一个非常实用的工具。我们从最基础的文档情感分类这个问题说起，这个任务是把一个单独的文档给分类为某种情感。在绝大多数情况下，我们可以把这个任务看作监督学习的问题。另外，我们也聊了聊如何通过建立情感词来进行简单的非监督学习的步骤。
今天，我们来看文本情感分析中的另一个关键技术，情感“实体”和“方面”的提取。
“实体”和“方面”的提取对于文本情感分析而言，“实体”（Entity）和“方面”（Aspect）是两个非常重要的概念。很多情感分析的任务都是围绕着这两个概念而产生的。在谈论如何对这两个概念提取之前，我们先来看看这两个概念的意义。
“实体”其实就是文本中的某一个对象，比如产品的名字、公司的名字、服务的名字、个人、事件名字等。而“方面”则是实体的某种属性和组建。
比如这么一个句子：“我买了一部三星手机，它的通话质量很不错”。在这里，“三星手机”就是一个实体，而“通话质量”则是一个方面。更进一步，“很不错”则是一个情感表达，这里是针对“三星手机”这个实体的“通话质量”这个方面。很明显，如果我们想要精准地对文本的情感进行分析，就一定得能够对实体和方面进行有效提取。
从广义的范围来说，实体和方面的提取都属于“信息提取”（Information Extraction）的工作。这是一个非常大的任务类别，用于从大量的非结构化文本中提取出有价值的信息。实体和方面的提取可以利用一般性的信息提取技术，当然往往也可以利用句子中的一些特殊结构。
常用的提取技术接下来，我们来聊一聊有哪些最直观最简单的提取技术。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

情感分析是文本分析的一个重要领域，它旨在判断文本的情感色彩。本文介绍了情感分析中的关键技术——情感“实体”和“方面”的提取。实体是文本中的对象，如产品、公司、个人等，而方面则是实体的属性或组成部分。文章探讨了实体和方面的提取技术，包括基于频率的提取和利用句子结构的方法。此外，还介绍了监督学习任务中的结构化预测，以及CRF模型在实体和方面提取中的应用。总的来说，本文为读者提供了情感分析中实体和方面提取的基础知识，并鼓励读者思考其他可能的提取方法。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《AI 技术内参》，新⼈⾸单¥98

立即购买

登录后留言

全部留言(3)

最新
精选

Lewis
可基于句法依存关系，很多分词模块都有这样的功能，但准确度只是勉强够用
2020-04-15

2
夏天吃雪糕
有没有相关的文献或者更详细的介绍教程？想深入理解一下这方面算法实例
2019-05-19


散人
老师好，文章中提到的基于特定结构提取方法，有没有特定的算法，还是完全自定义的方式，如在特定词前后几个词作为候选实体，属性这样？谢谢老师。
2018-05-23



收起评论