极客时间-轻松学习，高效学习-极客邦

HxScript

2019-01-18

这个答疑课是真的良心了。。。。。。

作者回复: 哈哈哈谢谢HxScript 你这么说我也很开心努力就会有收获



 41
許敲敲

2019-01-18

np.sort(a,axis=0)
第二题就会最简单的request 加beautifulsoup.
加re表达式，爬过地铁网站机械专业论坛

作者回复: 地铁网站机械专业论坛说明亲是机械专业毕业的？

 1

 3
🦍小梓桐🌙

2019-07-05

关于numpy中的axis，可以理解成旋转轴或者映射，尤其是高维数组，不应该死记硬背。0是第一维度，也就是行，在行上的映射也就是每一列。以此类推。

作者回复: 对的总结的不错



 2
几何

2019-03-24

pyquery解析网页挺好用的

作者回复: 这个不错



 2
一语中的

2019-02-25

import numpy as np
a = np.array([[4,3,2],[2,4,1]])
print (np.sort(a, axis=0) )

关于爬虫：
1.selenium+chrome/chromeless/phatomJS，可以处理页面加载后，需要运行javaScript，元素才会显示的情况；
2.Scrapy 爬虫框架，针对数据量大，层级嵌套较多的网页，框架中用到yield生成器，是关键
3.解析，lxml,bs4包，正则表达式等

展开

作者回复: 加油！不错



 2
任欣

2019-01-19

使用过Python中的beautiful soup挖掘招聘网站中的人员信息。解析网页比较快，但是遇到验证码的问题比较难搞，如果遇见比较难搞的验证码，比如火车票的验证码，怎么办



 2
Mingjie

2019-01-19

我简单学过scrapy，很容易上手的爬虫框架，用cookie解决登录问题，



 1
Grandia_Z

2019-01-18

报个到，已经上了18讲了，打算利用周末的时间回顾下做个期中复习(^_^)a

作者回复: 不错啊！有期中复习，相信你收获会更多的



 1
鱼非子

2020-02-08

import numpy as np

a = np.array([[4,3,2],[2,4,1]])
b = np.sort(a,axis= 0)
print(b)

爬虫还是新手一枚，目前只会一点request和八爪鱼爬虫

展开




xqs42b

2019-07-08

import numpy as np
a = np.array([[4, 3, 2], [2, 4, 1]])
for i range(len(a)):
sorted(list(a[i], reverse=False))

老师我想做一个编程的数据分析师，可以往那个方向走！

展开

作者回复: 加油你没问题的




薛定谔的猫

2019-07-01

无界面浏览器最厉害，fiddler三方工具配合手机模拟器适合抓难抓的数据，比如说淘宝，re的正则是最万能的

作者回复: 很好的分享~




Shawn

2019-06-19

import numpy as np
a = np.array([[4,3,2],[2,4,1]])
print(a)
a.sort(axis=0,kind='quicksort',order = None)
print(a)




泄矢的呼啦圈

2019-04-17

# 评论没啥有用内容，纯夸，加热度
虽然看到这里的时候前面遇到的疑惑已经自行搜索解决了，还是要为老师的处理方式点赞啊（之前看老师回复相对较少，还以为已经不对评论区内容跟进了）

作者回复: 加油~ 跟进的呼啦圈




随便讲两句

2019-04-03

ChromeDriver要留意版本问题，老师上面留的地址是对应Chrome 72的。
应该到 https://npm.taobao.org/mirrors/chromedriver/ 下载对应版本（暂时最新是74）。

作者回复: 对的需要找到对应的版本，感谢分享




几何

2019-03-24

chromedriver那个需要下载和自己电脑chrome版本相对应的chromedriver

作者回复: 对的需要的




尚科

2019-03-20

在一些教材中，数据预处理环节，有一致性检验，具体含义、作用是什么？有没有什么场景举例




周飞

2019-02-28

按列排序：
import numpy as np
a = np.array([[4,3,2],[2,4,1]])
print (np.sort(a,axis=0))




Chen

2019-02-18

需要和陈老师讨论一个问题，在网上看到有前辈讲关于“逻辑回归是否需要进行标准化？”，答案是取决于逻辑回归是不是用正则。讲的原因是不用正则时，仅仅是度量预测与真实值的差距，加上正则后，损失函数除了要度量差距外还要度量参数值是否足够小。。而参数值的大小程度或者说大小的级别是与特征的数值范围相关的。您是否同意呢？您讲是当用到梯度下降作为优化器，提高寻找最优解的效率而做标准化。这个前辈讲的是否有道理呢？我比较迷糊了。




路过蜻蜓

2019-02-16

第一题：
import numpy as np
a = np.array([[4,3,2],[2,4,1]])
print (np.sort(a, axis=0) )
第二题
爬虫用的是requests，分析用的比较多的是xpath，有时会用re，re有些优势是xpath不能替代的。beautiful soup 会用，但不用，因为抓取速度是比xpath和re慢。用过senlenium 和headless chromedriver 抓取过一些只用javascript生成数据的网页，xhr都抓不出什么数据的，加密的太严格了。senlenium的确可以无脑抓取网页，但很容易崩溃，不稳定，Puppeteer没有用过，之后会尝试去替代senlenium来抓取。

展开

作者回复: Good Job




王彬成

2019-02-16

第一道题：假设矩阵 a = np.array([[4,3,2],[2,4,1]])，请你编写代码将矩阵中的每一列按照从小到大的方式进行排序。
import numpy as np
a = np.array([[4,3,2],[2,4,1]])
print (np.sort(a, axis=0) )
第二道题：你都用过哪些 Python 爬虫工具，抓取过哪些数据，觉得哪个工具好用？
1、爬虫工具用过八爪鱼采集器，原因是简单可视化操作。
2、也是用过python的requests库，另外加beautiful解析

展开

作者回复: Good Sharing



