• Jingxiao 置顶
    2019-05-20
    关于思考题,如果字符串拼接的次数较少,比如range(100),那么方法一更优,因为时间复杂度精确的来说第一种是O(n),第二种是O(2n),如果拼接的次数较多,比如range(1000000),方法二稍快一些,虽然方法二会遍历两次,但是join的速度其实很快,列表append和join的开销要比字符串+=小一些。
     2
     50
  • 不瘦到140不改名
    2019-05-20
    思考题:个人提一个更加pythonic,更加高效的办法
    s = " ".join(map(str, range(0, 10000)))

    作者回复: 👍

    
     135
  • 刘朋
    2019-05-20
    # 测试 1000 条数据,方式一
    import time
    start_time = time.perf_counter()
    s = ''
    for n in range(0, 1000):
        s += str(n)
    end_time = time.perf_counter()
    print('Time elapse: {}'.format(end_time - start_time))
    返回结果: Time elapse: 0.0004374515265226364

    # 测试 1000 条数据,方式二
    import time
    start_time = time.perf_counter()
    s = []
    for n in range(0, 1000):
        s.append(str(n))
    ''.join(s)
    end_time = time.perf_counter()
    print('Time elapse: {}'.format(end_time - start_time))
    返回结果: Time elapse: 0.0004917513579130173

    # 测试 1000 条数据,方式三
    import time
    start_time = time.perf_counter()
    s = ''.join(map(str, range(0, 1000)))
    end_time = time.perf_counter()
    print('Time elapse: {}'.format(end_time - start_time))
    返回结果:Time elapse: 0.00021015387028455734

    分别测试一百万和一千万条数据,结果如下:
    100万:
    方式一:Time elapse: 0.3384760869666934
    方式二:Time elapse: 0.34538754168897867
    方式三:Time elapse: 0.2445415174588561

    1000万:
    方式一:Time elapse: 4.24716751743108
    方式二:Time elapse: 3.1754934675991535
    方式三:Time elapse: 2.2939002392813563

    综上,方式三性能最优,其次是在超过1000万条数据以上时,方式二优于方式一,相反,方式一优于方式二。
    展开
    
     120
  • 大牛凯
    2019-05-20
    最新的f""用法了解一下?
     3
     28
  • Python高效编程
    2019-05-20
    新版本的 f-string性能更好,但容易把环境变量写进字符串。
    
     15
  • Geek_morty137
    2019-05-20
    %format形式在东西多了以后比较费事,结构冗长,会导致错误,比如不能正确显示元组或字典。幸运的是,未来有更光明的日子。
    str.format格式相对好一些,但参数多了或者处理更长字符串时还是冗长。
    f-string这种方式可以更加简化表达过程。还支持大小写(f.或者F.)

    作者回复: 👍

    
     14
  • ssikiki
    2019-05-21
    使用加法操作符'+='的字符串拼接方法。因为它是一个例外 ... 可是
    x = 'a'
    id(x) # 4345659208
    x += 'b'
    id(x) # 4376614424
    做完+=操作后, x的内存地址变了, 说明新生成了字符串,请问老师这为什么说是例外?
    展开
     2
     13
  • 夜路破晓
    2019-05-21
    想问下目前有没有建群,因为想通过多了解些,比如读完这篇关于字符串的介绍,我想跟小伙伴们讨论下关于新版本f-string。
    作为一个刚入门半年的新手来说,其实采用格式化方式其实区别不大,但就我个人而言,在学习理解的过程中,新版本更加高效易懂。
    
     8
  • 路伴友行
    2019-05-20
    哦,+= 每次都会扩容,而 [] 不会每次扩容
    
     7
  • 铁皮
    2019-05-20
    import time


    start_time = time.perf_counter()
    s = ''
    for n in range(0, 100000):
        s += str(n)
    end_time = time.perf_counter()

    print('time elapse: {}'.format(end_time - start_time))

    start_time = time.perf_counter()
    l = []
    for n in range(0, 100000):
        l.append(str(n))

    l = ' '.join(l)
    end_time = time.perf_counter()
    print('join time elapse: {}'.format(end_time - start_time))


    start_time = time.perf_counter()
    s = " ".join(map(str, range(0, 100000)))
    end_time = time.perf_counter()
    print('map time elapse: {}'.format(end_time - start_time))

    结果:
    time elapse: 0.12365277000000008
    join time elapse: 0.10721922699999997
    map time elapse: 0.053512809999999966

    看有人留言说s = " ".join(map(str, range(0, 100000))) 更高效。确实是
    展开
    
     7
  • Wing·三金
    2019-05-20
    直观上看似乎第二种方法的复杂度高一倍,但实际运行了下,第二种方法效率略高,当调高到50万的时候第二种的效率比第一种高出两倍以上。

    作者回复: 哈哈,对的。
    如果字符串拼接的次数较少时,用+=更快,但是如果次数很大时,join稍快一些

    
     7
  • farFlight
    2019-05-20
    这两个操作实际上时间相差无几,我把循环次数提高到一百万次还是伯仲之间。
    另外请问老师python中对字符串采用 is 对比的问题。
    比如代码:
    a = 'string'
    b = 'string'
    a is b
    将返回True
    而
    a = 'string'
    a += '1'
    b = 'string1'
    a is b
    则返回False
    这个怎么解释比较好呢?为何第一个例子中a,b会指向同一个object呢?
    展开

    作者回复: 第一个例子中,'string'这个字符串对象只创建了一次,并同时被变量a和b指向,因此a is b返回True。

    第二个例子中刚开始初始化的时候a和b的id就是不一样的,a is b就是False啊

    
     5
  • 黑铁打野王
    2019-05-20
    既然是提升,能不能讲一下Python解释器对于String类型内存分配的知识?

    作者回复: 你好!这方面的内容你有兴趣可以自己去了解一下(google或者源码)。我的想法是专栏的内容还是实用为主,这种知识属于比较偏的了,工程当中用的很少,所以这里可能会省略

     1
     4
  • Destroy、
    2019-05-20
    第一个更优。另外python3.6以后还有一个新的字符串格式化用法更高效。。print('no data available for person with id: {id}, name: {name}')
     1
     4
  • charily
    2019-05-20
    代码1复杂度:O(1)×n,即O(n);代码2复杂度:O(1)×n+ O(1)×n=o(2n),因此代码1效率更高?

    作者回复: 试试同时比较range(1000)和range(10000000)两种情况的结果

    
     3
  • Geek_1ea0d3
    2019-05-26
    .split()方法的例子那里,如果splitor是'//',不应该是按照单斜线/来分割嘛?
    
     2
  • hysyeah
    2019-05-25
    老师好,我对于下面这段话有些疑问。
    自从 Python2.5 开始,每次处理字符串的拼接操作时(str1 += str2),Python 首先会检测 str1 还有没有其他的引用。如果没有的话,就会尝试原地扩充字符串 buffer 的大小,而不是重新分配一块内存来创建新的字符串并拷贝。


    我看python的源码对ci此并没有原地扩充的操作,而是每次都会新建一个string 对象。能详细解释下吗?谢谢。
    展开
     1
     2
  • carpe_diem
    2019-05-20
    第一种更优,虽然在时间复杂度上,两种方式都是O(n),但是第一种方法的空间复杂度优于第二种方式,第一种方法的空间复杂度为O(1),第二种方法的空间复杂度为O(n)。另外,第一种写法显然也更简洁一些

    作者回复: 你同时测试一下
    range(0, 100)
    和
    range(0, 1000000)的情况比较一下,看看两者的结果有什么不同?

    
     2
  • Paul Shan
    2019-11-12
    感觉字符串拼接,f'Hello, {name}!' 这样最直观。
    
     1
  • Ryan
    2019-11-08
    实际测试:
    import time

    time1 = time.perf_counter()
    s = ''
    for n in range(0, 100000):
        s += str(n)
    print(time.perf_counter()-time1)
        
    time2 = time.perf_counter()
    l = []
    for n in range(0, 100000):
        l.append(str(n))
    s = ' '.join(l)
    print(time.perf_counter()-time2)

    time3 = time.perf_counter()
    s = " ".join(map(str, range(0, 10000)))
    print(time.perf_counter()-time3)

    =>
    0.055303414000036355
    0.033053977999998096
    0.0020310749998770916

    Why? 想看看老师解析下
    展开
    
     1
我们在线,来聊聊吧