作者回复: 统计词性的一般思路是: 获取数据、数据预处理(去掉各种符号、空格)、词性标注(包含了jieba分词)、词频统计、数据再次处理(合并,计数,对统计结果格式调整)、数据保存到文件(一般为Excel) 按照这一顺序来实现词性统计
作者回复: 你好, 方便描述一下具体统计的是哪种词性吗? 导致这种结果的可能有连个原因, 一个是自动分词分的不够准确,导致了识别出现误差,还有一种原因是统计词性的英文缩写指定的不正确,例如名词就包含了很多详细分类,比如 名词分为以下子类: n 名词 nr 人名 nr1 汉语姓氏 nr2 汉语名字 nrj 日语人名 可以搜索 jieba词性表 关键字对照分词的结果进行查看
作者回复: 是的,另外可以在读者群里和我交流,因为留言中有大量打卡信息,问题有可能被淹没在打卡信息里被我忽略,在翻看视频是才发现有这条问题