• HxScript
    2019-01-18
    这个答疑课是真的良心了。。。。。。

    作者回复: 哈哈哈 谢谢HxScript 你这么说我也很开心 努力就会有收获

    
     41
  • 許敲敲
    2019-01-18
    np.sort(a,axis=0)
    第二题 就会最简单的request 加beautifulsoup.
    加re表达式,爬过 地铁网站 机械专业论坛

    作者回复: 地铁网站 机械专业论坛 说明亲是机械专业毕业的?

     1
     3
  • 🦍小梓桐🌙
    2019-07-05
    关于numpy中的axis,可以理解成旋转轴或者映射,尤其是高维数组,不应该死记硬背。0是第一维度,也就是行,在行上的映射也就是每一列。以此类推。

    作者回复: 对的 总结的不错

    
     2
  • 几何
    2019-03-24
    pyquery解析网页挺好用的

    作者回复: 这个不错

    
     2
  • 一语中的
    2019-02-25
    import numpy as np
    a = np.array([[4,3,2],[2,4,1]])
    print (np.sort(a, axis=0) )

    关于爬虫:
    1.selenium+chrome/chromeless/phatomJS, 可以处理页面加载后,需要运行javaScript,元素才会显示的情况;
    2.Scrapy 爬虫框架,针对数据量大,层级嵌套较多的网页,框架中用到yield生成器,是关键
    3.解析,lxml,bs4包,正则表达式等
    展开

    作者回复: 加油! 不错

    
     2
  • 任欣
    2019-01-19
    使用过Python中的beautiful soup挖掘招聘网站中的人员信息。解析网页比较快,但是遇到验证码的问题比较难搞,如果遇见比较难搞的验证码,比如火车票的验证码,怎么办
    
     2
  • Mingjie
    2019-01-19
    我简单学过scrapy,很容易上手的爬虫框架,用cookie解决登录问题,
    
     1
  • Grandia_Z
    2019-01-18
    报个到,已经上了18讲了,打算利用周末的时间回顾下做个期中复习(^_^)a

    作者回复: 不错啊! 有期中复习,相信你收获会更多的

    
     1
  • 鱼非子
    2020-02-08
    import numpy as np

    a = np.array([[4,3,2],[2,4,1]])
    b = np.sort(a,axis= 0)
    print(b)

    爬虫还是新手一枚,目前只会一点request和八爪鱼爬虫
    展开
    
    
  • xqs42b
    2019-07-08
    import numpy as np
    a = np.array([[4, 3, 2], [2, 4, 1]])
    for i range(len(a)):
       sorted(list(a[i], reverse=False))

    老师我想做一个编程的数据分析师,可以往那个方向走!
    展开

    作者回复: 加油 你没问题的

    
    
  • 薛定谔的猫
    2019-07-01
    无界面浏览器最厉害,fiddler三方工具配合手机模拟器适合抓难抓的数据,比如说淘宝,re的正则是最万能的

    作者回复: 很好的分享~

    
    
  • Shawn
    2019-06-19
    import numpy as np
    a = np.array([[4,3,2],[2,4,1]])
    print(a)
    a.sort(axis=0,kind='quicksort',order = None)
    print(a)
    
    
  • 泄矢的呼啦圈
    2019-04-17
    # 评论没啥有用内容,纯夸,加热度
    虽然看到这里的时候前面遇到的疑惑已经自行搜索解决了,还是要为老师的处理方式点赞啊(之前看老师回复相对较少,还以为已经不对评论区内容跟进了)

    作者回复: 加油~ 跟进的 呼啦圈

    
    
  • 随便讲两句
    2019-04-03
    ChromeDriver要留意版本问题,老师上面留的地址是对应Chrome 72的。
    应该到 https://npm.taobao.org/mirrors/chromedriver/ 下载对应版本(暂时最新是74)。

    作者回复: 对的 需要找到对应的版本,感谢分享

    
    
  • 几何
    2019-03-24
    chromedriver那个需要下载和自己电脑chrome版本相对应的chromedriver

    作者回复: 对的 需要的

    
    
  • 尚科
    2019-03-20
    在一些教材中,数据预处理环节,有一致性检验,具体含义、作用是什么?有没有什么场景举例
    
    
  • 周飞
    2019-02-28
    按列排序:
    import numpy as np
    a = np.array([[4,3,2],[2,4,1]])
    print (np.sort(a,axis=0))
    
    
  • Chen
    2019-02-18
    需要和陈老师讨论一个问题,在网上看到有前辈讲关于“逻辑回归是否需要进行标准化?”,答案是取决于逻辑回归是不是用正则。讲的原因是不用正则时,仅仅是度量预测与真实值的差距,加上正则后,损失函数除了要度量差距外还要度量参数值是否足够小。。而参数值的大小程度或者说大小的级别是与特征的数值范围相关的。您是否同意呢?您讲是当用到梯度下降作为优化器,提高寻找最优解的效率而做标准化。这个前辈讲的是否有道理呢?我比较迷糊了。
    
    
  • 路过蜻蜓
    2019-02-16
    第一题:
    import numpy as np
    a = np.array([[4,3,2],[2,4,1]])
    print (np.sort(a, axis=0) )
    第二题
    爬虫用的是requests,分析用的比较多的是xpath,有时会用re,re有些优势是xpath不能替代的。beautiful soup 会用,但不用,因为抓取速度是比xpath和re慢。用过senlenium 和headless chromedriver 抓取过一些只用javascript生成数据的网页,xhr都抓不出什么数据的,加密的太严格了。senlenium的确可以无脑抓取网页,但很容易崩溃,不稳定,Puppeteer没有用过,之后会尝试去替代senlenium来抓取。
    展开

    作者回复: Good Job

    
    
  • 王彬成
    2019-02-16
    第一道题:假设矩阵 a = np.array([[4,3,2],[2,4,1]]),请你编写代码将矩阵中的每一列按照从小到大的方式进行排序。
    import numpy as np
    a = np.array([[4,3,2],[2,4,1]])
    print (np.sort(a, axis=0) )
    第二道题:你都用过哪些 Python 爬虫工具,抓取过哪些数据,觉得哪个工具好用?
    1、爬虫工具用过八爪鱼采集器,原因是简单可视化操作。
    2、也是用过python的requests库,另外加beautiful解析
    展开

    作者回复: Good Sharing

    
    
我们在线,来聊聊吧