极客时间-轻松学习，高效学习-极客邦

Jingxiao 置顶

2019-05-20

关于思考题，如果字符串拼接的次数较少，比如range(100)，那么方法一更优，因为时间复杂度精确的来说第一种是O(n)，第二种是O(2n)，如果拼接的次数较多，比如range(1000000)，方法二稍快一些，虽然方法二会遍历两次，但是join的速度其实很快，列表append和join的开销要比字符串+=小一些。

 2

 50
不瘦到140不改名

2019-05-20

思考题：个人提一个更加pythonic，更加高效的办法
s = " ".join(map(str, range(0, 10000)))

作者回复: 👍



 135
刘朋

2019-05-20

# 测试 1000 条数据，方式一
import time
start_time = time.perf_counter()
s = ''
for n in range(0, 1000):
s += str(n)
end_time = time.perf_counter()
print('Time elapse: {}'.format(end_time - start_time))
返回结果: Time elapse: 0.0004374515265226364

# 测试 1000 条数据，方式二
import time
start_time = time.perf_counter()
s = []
for n in range(0, 1000):
s.append(str(n))
''.join(s)
end_time = time.perf_counter()
print('Time elapse: {}'.format(end_time - start_time))
返回结果: Time elapse: 0.0004917513579130173

# 测试 1000 条数据，方式三
import time
start_time = time.perf_counter()
s = ''.join(map(str, range(0, 1000)))
end_time = time.perf_counter()
print('Time elapse: {}'.format(end_time - start_time))
返回结果：Time elapse: 0.00021015387028455734

分别测试一百万和一千万条数据，结果如下：
100万:
方式一：Time elapse: 0.3384760869666934
方式二：Time elapse: 0.34538754168897867
方式三：Time elapse: 0.2445415174588561

1000万：
方式一：Time elapse: 4.24716751743108
方式二：Time elapse: 3.1754934675991535
方式三：Time elapse: 2.2939002392813563

综上，方式三性能最优，其次是在超过1000万条数据以上时，方式二优于方式一，相反，方式一优于方式二。

展开



 120
大牛凯

2019-05-20

最新的f""用法了解一下？

 3

 28
Python高效编程

2019-05-20

新版本的 f-string性能更好，但容易把环境变量写进字符串。



 15
Geek_morty137

2019-05-20

%format形式在东西多了以后比较费事，结构冗长，会导致错误，比如不能正确显示元组或字典。幸运的是，未来有更光明的日子。
str.format格式相对好一些，但参数多了或者处理更长字符串时还是冗长。
f-string这种方式可以更加简化表达过程。还支持大小写（f.或者F.）

作者回复: 👍



 14
ssikiki

2019-05-21

使用加法操作符'+='的字符串拼接方法。因为它是一个例外 ... 可是
x = 'a'
id(x) # 4345659208
x += 'b'
id(x) # 4376614424
做完+=操作后， x的内存地址变了，说明新生成了字符串，请问老师这为什么说是例外？

展开

 2

 13
夜路破晓

2019-05-21

想问下目前有没有建群，因为想通过多了解些，比如读完这篇关于字符串的介绍，我想跟小伙伴们讨论下关于新版本f-string。
作为一个刚入门半年的新手来说，其实采用格式化方式其实区别不大，但就我个人而言，在学习理解的过程中，新版本更加高效易懂。



 8
路伴友行

2019-05-20

哦，+= 每次都会扩容，而 [] 不会每次扩容



 7
铁皮

2019-05-20

import time

start_time = time.perf_counter()
s = ''
for n in range(0, 100000):
s += str(n)
end_time = time.perf_counter()

print('time elapse: {}'.format(end_time - start_time))

start_time = time.perf_counter()
l = []
for n in range(0, 100000):
l.append(str(n))

l = ' '.join(l)
end_time = time.perf_counter()
print('join time elapse: {}'.format(end_time - start_time))

start_time = time.perf_counter()
s = " ".join(map(str, range(0, 100000)))
end_time = time.perf_counter()
print('map time elapse: {}'.format(end_time - start_time))

结果：
time elapse: 0.12365277000000008
join time elapse: 0.10721922699999997
map time elapse: 0.053512809999999966

看有人留言说s = " ".join(map(str, range(0, 100000))) 更高效。确实是

展开



 7
Wing·三金

2019-05-20

直观上看似乎第二种方法的复杂度高一倍，但实际运行了下，第二种方法效率略高，当调高到50万的时候第二种的效率比第一种高出两倍以上。

作者回复: 哈哈，对的。
如果字符串拼接的次数较少时，用+=更快，但是如果次数很大时，join稍快一些



 7
farFlight

2019-05-20

这两个操作实际上时间相差无几，我把循环次数提高到一百万次还是伯仲之间。
另外请问老师python中对字符串采用 is 对比的问题。
比如代码：
a = 'string'
b = 'string'
a is b
将返回True
而
a = 'string'
a += '1'
b = 'string1'
a is b
则返回False
这个怎么解释比较好呢？为何第一个例子中a,b会指向同一个object呢？

展开

作者回复: 第一个例子中，'string'这个字符串对象只创建了一次，并同时被变量a和b指向，因此a is b返回True。

第二个例子中刚开始初始化的时候a和b的id就是不一样的，a is b就是False啊



 5
黑铁打野王

2019-05-20

既然是提升，能不能讲一下Python解释器对于String类型内存分配的知识？

作者回复: 你好！这方面的内容你有兴趣可以自己去了解一下（google或者源码）。我的想法是专栏的内容还是实用为主，这种知识属于比较偏的了，工程当中用的很少，所以这里可能会省略

 1

 4
Destroy、

2019-05-20

第一个更优。另外python3.6以后还有一个新的字符串格式化用法更高效。。print('no data available for person with id: {id}, name: {name}')

 1

 4
charily

2019-05-20

代码1复杂度：O（1）×n，即O（n）；代码2复杂度：O（1）×n+ O（1）×n=o（2n）,因此代码1效率更高？

作者回复: 试试同时比较range(1000)和range(10000000)两种情况的结果



 3
Geek_1ea0d3

2019-05-26

.split()方法的例子那里，如果splitor是'//'，不应该是按照单斜线/来分割嘛？



 2
hysyeah

2019-05-25

老师好，我对于下面这段话有些疑问。
自从 Python2.5 开始，每次处理字符串的拼接操作时（str1 += str2），Python 首先会检测 str1 还有没有其他的引用。如果没有的话，就会尝试原地扩充字符串 buffer 的大小，而不是重新分配一块内存来创建新的字符串并拷贝。

我看python的源码对ci此并没有原地扩充的操作，而是每次都会新建一个string 对象。能详细解释下吗？谢谢。

展开

 1

 2
carpe_diem

2019-05-20

第一种更优，虽然在时间复杂度上，两种方式都是O(n)，但是第一种方法的空间复杂度优于第二种方式，第一种方法的空间复杂度为O(1)，第二种方法的空间复杂度为O(n)。另外，第一种写法显然也更简洁一些

作者回复: 你同时测试一下
range(0, 100)
和
range(0, 1000000)的情况比较一下，看看两者的结果有什么不同？



 2
Paul Shan

2019-11-12

感觉字符串拼接，f'Hello, {name}!' 这样最直观。



 1
Ryan

2019-11-08

实际测试：
import time

time1 = time.perf_counter()
s = ''
for n in range(0, 100000):
    s += str(n)
print(time.perf_counter()-time1)

time2 = time.perf_counter()
l = []
for n in range(0, 100000):
    l.append(str(n))
s = ' '.join(l)
print(time.perf_counter()-time2)

time3 = time.perf_counter()
s = " ".join(map(str, range(0, 10000)))
print(time.perf_counter()-time3)

=>
0.055303414000036355
0.033053977999998096
0.0020310749998770916

Why? 想看看老师解析下

展开



 1