极客时间-轻松学习，高效学习-极客邦

hello zero
2021-04-12
老师，分布式架构里的Poller和Agent，有没有现成的组件，还是需要定制开发？
作者回复: 日志采集的Poller/Agent有很多，如Elastic Filebeat，Fluentd等等，也可以按需自己定制开发。
那只羊
2020-08-09
老师可以分享一下，基于长连接（TCP或者UDP）场景下的应用，比如IM社交，客服系统，大规划消息推送服务；这些应用在进行分布式实践中的一些思路吗？我自己设计了一套基于UDP协议的推送服务（Netty），暂且叫push_server吧！通讯双方，push_server做了：登录（验证）、用户在线列表（查找用户是否在线）、消息透传（核心能力）；目前已经将服务优化到吞吐可每秒大约4万左右，但是还是处于单机模式，最多就是加了台热备机，因为将后来不可能一直使用这种模式，想现在着手改造成分布式服务的架构，但是在项目实践过程中，感觉没有web应用的好做，苦恼于此，希望老师能指点下，非常感谢！！
作者回复: 大规模通知系统可以考虑基于MQ + Workers模式搭建，MQ可以基于分布式的Kafka，Workers(相当于消费者)可以按需扩容。另外参考（可能需要翻墙） https://blog.gojekengineering.com/how-we-manage-a-million-push-notifications-an-hour-549a1e3ca2c2 https://speakerdeck.com/cubicdaiya/building-high-performance-push-notification-server-in-go
满心
2022-08-21 来自湖南
老师，有个疑问，爬虫计算任务在归并计算的时候，怎么保证所有聚合服务已经提交结果到DB当中？如果某一个聚合服务由于网络等原因，没有及时将聚合结果更新到db，那最后归并计算出来的结果就会不准确
战国
2021-10-09
这里面有一个疑问，就是日志的消费者只看到一个。如果是扩展到多个，那就需要用分布式的堆了吧？还是各自找，最后再聚合？不过这里就有准确性的问题；这里特别提到了分区，也就是可能根据ip进行一定程度消息分区，好像也能解决，最后将ip的访问量聚合的时候再对比一下，找出最高的；
共 1 条评论