113 | 如何来提取情感“实体”和“方面”呢?
洪亮劼
该思维导图由 AI 生成,仅供参考
从上一篇分享开始,我们转入文本分析的另外一个领域,文本“情感分析”(Sentiment Analysis),也就是指我们要针对一段文本来判断其文字“色彩”。文本情感分析是一个非常实用的工具。我们从最基础的文档情感分类这个问题说起,这个任务是把一个单独的文档给分类为某种情感。在绝大多数情况下,我们可以把这个任务看作监督学习的问题。另外,我们也聊了聊如何通过建立情感词来进行简单的非监督学习的步骤。
今天,我们来看文本情感分析中的另一个关键技术,情感“实体”和“方面”的提取。
“实体”和“方面”的提取
对于文本情感分析而言,“实体”(Entity)和“方面”(Aspect)是两个非常重要的概念。很多情感分析的任务都是围绕着这两个概念而产生的。在谈论如何对这两个概念提取之前,我们先来看看这两个概念的意义。
“实体”其实就是文本中的某一个对象,比如产品的名字、公司的名字、服务的名字、个人、事件名字等。而“方面”则是实体的某种属性和组建。
比如这么一个句子:“我买了一部三星手机,它的通话质量很不错”。在这里,“三星手机”就是一个实体,而“通话质量”则是一个方面。更进一步,“很不错”则是一个情感表达,这里是针对“三星手机”这个实体的“通话质量”这个方面。很明显,如果我们想要精准地对文本的情感进行分析,就一定得能够对实体和方面进行有效提取。
从广义的范围来说,实体和方面的提取都属于“信息提取”(Information Extraction)的工作。这是一个非常大的任务类别,用于从大量的非结构化文本中提取出有价值的信息。实体和方面的提取可以利用一般性的信息提取技术,当然往往也可以利用句子中的一些特殊结构。
常用的提取技术
接下来,我们来聊一聊有哪些最直观最简单的提取技术。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
情感分析是文本分析的一个重要领域,它旨在判断文本的情感色彩。本文介绍了情感分析中的关键技术——情感“实体”和“方面”的提取。实体是文本中的对象,如产品、公司、个人等,而方面则是实体的属性或组成部分。文章探讨了实体和方面的提取技术,包括基于频率的提取和利用句子结构的方法。此外,还介绍了监督学习任务中的结构化预测,以及CRF模型在实体和方面提取中的应用。总的来说,本文为读者提供了情感分析中实体和方面提取的基础知识,并鼓励读者思考其他可能的提取方法。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》,新⼈⾸单¥98
《AI 技术内参》,新⼈⾸单¥98
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(3)
- 最新
- 精选
- Lewis可基于句法依存关系,很多分词模块都有这样的功能,但准确度只是勉强够用2020-04-152
- 夏天吃雪糕有没有相关的文献或者更详细的介绍教程?想深入理解一下这方面算法实例2019-05-19
- 散人老师好,文章中提到的基于特定结构提取方法,有没有特定的算法,还是完全自定义的方式,如在特定词前后几个词作为候选实体,属性这样?谢谢老师。2018-05-23
收起评论