极客时间-轻松学习，高效学习-极客邦

陈东
2021-03-19
老师能分享你词性统计的思路吗？
作者回复: 统计词性的一般思路是：获取数据、数据预处理(去掉各种符号、空格)、词性标注(包含了jieba分词)、词频统计、数据再次处理(合并，计数，对统计结果格式调整)、数据保存到文件(一般为Excel) 按照这一顺序来实现词性统计
共 2 条评论
2
Soul of the Drago...
2021-02-24
有个问题请教一下老师，我在思考题中用代码统计各种词性的数量，但每次统计的结果都不对，和实际数量相去甚远，不知道是什么原因。
作者回复: 你好, 方便描述一下具体统计的是哪种词性吗? 导致这种结果的可能有连个原因, 一个是自动分词分的不够准确,导致了识别出现误差,还有一种原因是统计词性的英文缩写指定的不正确,例如名词就包含了很多详细分类,比如名词分为以下子类： n 名词 nr 人名 nr1 汉语姓氏 nr2 汉语名字 nrj 日语人名可以搜索 jieba词性表关键字对照分词的结果进行查看
1
笨笨
2023-06-27 来自北京
jieba.suggest_freq(("中", "将"), tune = True)老师这句代码应该放在哪里使用呢？是放在words2=jieba.cut(words1)后使用吗?
作者回复: 是的，另外可以在读者群里和我交流，因为留言中有大量打卡信息，问题有可能被淹没在打卡信息里被我忽略，在翻看视频是才发现有这条问题
ifelse
2023-07-05 来自浙江
学习打卡