前言
在python中, 切片是一个经常会使用到的语法, 不管是元组, 列表还是字符串, 一般语法就是:
sequence[ilow:ihigh:step] # ihigh
,step 可为空; 为了简短易懂, 暂时排除step的用法考虑
先来简单示范下用法
sequence = [1,2,3,4,5]sequence [ilow:ihigh] # 从ilow开始到ihigh-1结束sequence [ilow:] # 从ilow开始直到末尾sequence [:ihigh] # 从头部开始直到ihigh结束sequence [:] # 复制整个列表
语法很简洁, 也很容易理解, 这种语法在我们日常使用中 是简单又好用, 但我相信在我们使用这种切片语法时, 都会习惯性谨遵一些规则:
ilow, ihigh均小于 sequece的长度 ilow < ihigh因为在大部分情况下, 只有遵循上面的规则, 才能得到我们预期的结果! 可是如果我不遵循呢? 切片会怎样?
不管我们在使用元组, 列表还是字符串, 当我们想取中一个元素时, 我们会用到如下语法:
sequence = [1,2,3,4,5]print sequence[1] # 输出2print sequence[2] # 输出3
上面出现的 1,2 我们姑且称之为下标, 不管是元组, 列表还是字符串, 我们都能通过下标来取出对应的值, 但是如果下标超过对象的长度, 那么将触发索引异常(IndexError)
sequence = [1,2,3,4,5]print sequence[15] ### 输出 ###Traceback (most recent call last): File "test.py", line 2, in <module> print a[20]IndexError: list index out of range
那么对于切片呢? 两种语法很相似, 假设我 ilow 和 ihigh分别是10和20, 那么结果是怎样呢
情景重现
# version: python2.7a = [1, 2, 3, 5]print a[10:20] # 结果会报异常吗?
看到10和20, 完全超出了序列a的长度, 由于前面的代码, 或者以前的经验, 我们总会觉得这样肯定也会导致一个IndexError,那我们开终端来试验下:
>>> a = [1, 2, 3, 5]>>> print a[10:20][]
结果居然是: [], 这感觉有点意思.是只有列表才会这么, 字符串呢, 元组呢?
>>> s = '23123123123'>>> print s[400:2000]''>>> t = (1, 2, 3,4)>>> print t[200: 1000]()
结果都和列表的类似, 返回属于各自的空结果.
看到结果的我们眼泪掉下来, 不是返回一个IndexError, 而是直接返回空, 这让我们不禁想到, 其实语法相似, 背后的东西肯定还是不同的, 那我们下面一起来尝试去解释下这结果吧
原理分析
在揭开之前, 咱们要先搞清楚, python是怎样处理这个切片的, 可以通过dis模块来协助:
############# 切片 ################[root@iZ23pynfq19Z ~]# cat test.pya = [11,2,3,4]print a[20:30]#结果:[root@iZ23pynfq19Z ~]# python -m dis test.py 1 0 LOAD_CONST 0 (11) 3 LOAD_CONST 1 (2) 6 LOAD_CONST 2 (3) 9 LOAD_CONST 3 (4) 12 BUILD_LIST 4 15 STORE_NAME 0 (a) 2 18 LOAD_NAME 0 (a) 21 LOAD_CONST 4 (20) 24 LOAD_CONST 5 (30) 27 SLICE+3 28 PRINT_ITEM 29 PRINT_NEWLINE 30 LOAD_CONST 6 (None) 33 RETURN_VALUE ############# 单下标取值 ################[root@gitlab ~]# cat test2.pya = [11,2,3,4]print a[20]#结果:[root@gitlab ~]# python -m dis test2.py 1 0 LOAD_CONST 0 (11) 3 LOAD_CONST 1 (2) 6 LOAD_CONST 2 (3) 9 LOAD_CONST 3 (4) 12 BUILD_LIST 4 15 STORE_NAME 0 (a) 2 18 LOAD_NAME 0 (a) 21 LOAD_CONST 4 (20) 24 BINARY_SUBSCR 25 PRINT_ITEM 26 PRINT_NEWLINE 27 LOAD_CONST 5 (None) 30 RETURN_VALUE
新闻热点
疑难解答