作者回复: 赞,看来是有经验的。
作者回复: 这个是这样的,由于tcp的高效,所以大规模下一般会用tcp,当然初期也可以用http,最后一般会转成 tcp的。当然本课也不讲app爬虫所以就带一下,说明下tcp也是有用的。 Q2,http是基于tcp的,所以写http就是写tcp,只是库帮你做掉了。想自己撸tcp,理论上也是没问题的。 Q3,实时抓取指的是,用户在你站点点击了某商品,触发一个爬虫,去竞对看下对应商品。因为是用户触发的,这样,他就知道你这面用户在点哪些商品。这个信息是非常有用的。
作者回复: 基本差不多,补充一下,不止可以用公开的版本数据,也可以用自己网站的统计数据,更准确。
作者回复: 没做过抓取的人是没法做好反爬的,一般做反爬的人至少会去爬虫组做几个月😂😂😂