• 陈东
    2021-03-19
    老师能分享你词性统计的思路吗?

    作者回复: 统计词性的一般思路是: 获取数据、数据预处理(去掉各种符号、空格)、词性标注(包含了jieba分词)、词频统计、数据再次处理(合并,计数,对统计结果格式调整)、数据保存到文件(一般为Excel) 按照这一顺序来实现词性统计

    共 2 条评论
    2
  • Soul of the Drago...
    2021-02-24
    有个问题请教一下老师,我在思考题中用代码统计各种词性的数量,但每次统计的结果都不对,和实际数量相去甚远,不知道是什么原因。

    作者回复: 你好, 方便描述一下具体统计的是哪种词性吗? 导致这种结果的可能有连个原因, 一个是自动分词分的不够准确,导致了识别出现误差,还有一种原因是统计词性的英文缩写指定的不正确,例如名词就包含了很多详细分类,比如 名词分为以下子类: n 名词 nr 人名 nr1 汉语姓氏 nr2 汉语名字 nrj 日语人名 可以搜索 jieba词性表 关键字对照分词的结果进行查看

    
    1
  • 笨笨
    2023-06-27 来自北京
    jieba.suggest_freq(("中", "将"), tune = True)老师这句代码应该放在哪里使用呢?是放在words2=jieba.cut(words1)后使用吗?

    作者回复: 是的,另外可以在读者群里和我交流,因为留言中有大量打卡信息,问题有可能被淹没在打卡信息里被我忽略,在翻看视频是才发现有这条问题

    
    
  • ifelse
    2023-07-05 来自浙江
    学习打卡
    
    