• 若水清菡
    2025-09-19 来自北京
    如果你要将过滤器部署到线上系统中,哪些模块最容易成为瓶颈?你会如何优化它们? 语义识别模块、上下文意图识别器容易成为瓶颈。语义识别模块用到了向量模型,这块需要考虑集群部署、高可用、响应时间等因素;上下文意图识别器敏感词组库需要考虑放到缓存系统比如redis集群,在常用的 UTF-8编码下,​一个中文字符通常占用3个字节,而一个英文字符(包括数字和常见符号)只占用1个字节,特别长的敏感词组会不会成为一个大key,中英文混合会不会导致识别度降低等。
    
    