I am not a creator. I am just a porter.
简介:对一些python的小知识进行总结
lambda函数也叫匿名函数,也就是函数没有名称。先看一个简单的例子:
def add(x, y): return x + y
对应的lambda函数则如下:
add = lambda x, y: x + y
我们在很多情况下都可以看到lambda表达式,它并不是python特有的,而且大多数情况下我们并不会使用它。那么,在什么情况下使用lambda函数呢?由于lambda没有函数名这样不会产生很多函数的引用,这样对代码的清晰是有好处的,个人认为,当一个功能简单的函数,只在某个局部使用而且使用的次数不多,我们可以使用lambda函数,当然,不用lambda是完全可以的。
什么是生成器?在谈这个问题之前我们来看看python的迭代器。当我们可以逐项去读取的对象的属性时,我们就说这个对象是可迭代的:
>>> clist = [1, 2, 3, 4]>>> for item in clist:... PRint item... 1234>>> for item in clist:... print item... 1234>>>
clist是一个可迭代的对象,可以使用for-in语法来访问每个item。我们常见的迭代器:list,tuple,dict,file... for语句在容器对象中调用iter(),该函数调用对象的__iter__()函数返回一个定义了next()方法的迭代器对象:
class Array(object): def __init__(self): self._list = [i for i in range(10)] self.ops = -1 def __iter__(self): self.ops = -1 return self def next(self): self.ops += 1 if self.ops == len(self._list): raise StopIteration() return self._list[self.ops]
__iter__()和next()不必要在同一个类,我们只要明白,__iter__()是返回一个可迭代的对象,而可迭代的对象包含next(),记住越界raise StopIteration:
class Array(object): def __init__(self): self._list = [i for i in range(10)] def __iter__(self): return ArrayIterator(self)class ArrayIterator(object): def __init__(self, array): self._array = array self._ops = -1 def next(self): self._ops += 1 if self._ops == len(self._array._list): raise StopIteration() return self._array._list[self._ops]
说完迭代器,我们来看看生成器,首先生成器是可以迭代的,但是只可以读取一次,因为它并不把所有的值放在内存中,而是实时生成数据:
>>> gen = (i for i in range(10))>>> for ite in gen:... print ite... 0123456789>>> for ite in gen:... print ite... >>>
比较code-2.1和code-2.4,发现当我们把[]换成()后,for...in...只能使用一次,这就是因为生成器只能被迭代一次。
如何构造一个生成器?我们使用yield关键字。yield是一个类似return的关键字,只是这个函数返回的是一个生成器:
def generator(init_list):for i in init_list: yield igen = generator([i for i in range(3)])for i in gen: print i # out 0 1 2print gen.next() # raise StopIteration
首先当我们调用generator这个函数的时候,它并不是立马就执行,这个函数返回一个生成器对象(包含next()方法)。函数内的代码则是当我们使用for循环的时候执行。如果生成器内部没有定义yield,那么这个生成器被认为成空,不满足循环条件。
装饰器,用于装饰一个函数,所谓的装饰就是在原有的基础上增加功能(参数检查,编码解码,添加日志...)
def help(): """ 一个请求帮助的函数 """ print("Can you help me?")def decorator(func): """ 在请求帮助前,打招呼 """ print("Hi, Mike!") return func #这里要返回原函数对象,否则外面无法调用def decorator_with_funcparams(args): """ 装饰器和被装饰的函数都是带参数的,args是装饰器的参数,func_param是被装饰的函数的参数 """ def _deco(func): def func_deco(func_param): print("Hi, " + func_param) return func() return func_deco return _deco
装饰器测试:
hp = decorator(help)hp()hp()output:----------------Hi, Mike!Can you help me?Can you help me?
装饰器只装饰一次,所以Hi,Mike!输出一次,
@decoratordef hp(): help()hp()hp()output:----------------Hi, Mike!Can you help me?Can you help me?
为了使得每次调用的时候,都能被装饰,我们需要在装饰器使用内嵌函数:
def decorator_with_inner(func): def _deco(): print("Hi, Mike!") return func() #这里调用函数,而不是返回原函数的对象 return _deco@decorator_with_innerdef hp(): help()hp() #实际上调用的是_deco()hp()output:----------------Hi, Mike!Can you help me?Hi, Mike!Can you help me?
有时候装饰器是根据上下文来确定装饰动作,这个是就需要带参数了:
def decorator_with_params(args): """ 带有参数的装饰器,由于有参数,所以在函数调用时只会使用应用时的参数 而不是接收被装饰的函数作为参数,所以必须在其内部再创建一个函数 """ print(args) def _deco(func): print("Hi, Mike") return func #这里不能使用func() return _deco@decorator_with_params(args = 'Please!')def hp(): help()hp() #调用的是func(),不是_deco()hp()output:----------------Please!Hi, Mike!Can you help me?Can you help me?
这里可以看出装饰器(传入被装饰函数对象的函数以及外层的函数)只会执行一遍,对于这个例子来说,print(args)和_deco函数都只是执行了一遍。当我们调用hp()的时候实际上调用的是我们传入func时的函数的返回值,所以在那一层不要调用函数,而是返回函数对象。所以为了保证每次都执行装饰动作我们需要在传入func的函数中内嵌一个函数:
def decorator_with_params2(args): """ 带有参数的装饰器,由于有参数,所以在函数调用时只会使用应用时的参数 而不是接收被装饰的函数作为参数,所以必须在其内部再创建一个函数 """ print(args) def _deco(func): def f_deco(): print("Hi, Mike") return func() #注意这里是调用函数,而不是返回原函数对象 return f_deco return _deco@decorator_with_params(args = 'Please!')def hp(): help()hp() #调用的是f_deco(),不是_deco()hp()output:----------------Please!Hi, MikeCan you help me?Hi, MikeCan you help me?
当被装饰的函数需要传入参数,在内嵌函数中带上参数就可以了:
def decorator_with_funcparams(args):""" 装饰器和被装饰的函数都是带参数的,args是装饰器的参数,func_param是被装饰的函数的参数"""def _deco(func): def func_deco(func_param): print("Hi, " + func_param) return func(func_param) return func_decoreturn _deco@decorator_with_funcparams(args = 'Please!')def hp(func_param): print("Can you help me, " + func_param + "?")hp("Mike1") hp("Mike2")output:-----------------------Hi, Mike1Can you help me, Mike1?Hi, Mike2Can you help me, Mike2?
调用hp("Mike1")实际上就是调用func_deco("Mike1"),所以在func_deco()函数体中是调用func(),而不是返回函数对象。如果我们返回的是函数对象会怎么样:
def decorator_with_funcparams(args): """ 装饰器和被装饰的函数都是带参数的,args是装饰器的参数,func_param是被装饰的函数的参数 """ def _deco(func): def func_deco(func_param): print("Hi, " + func_param) return func return func_deco return _deco@decorator_with_funcparams(args = 'Please!')def hp(func_param): print("Can you help me, " + func_param + "?")hp("Mike1")("test1")hp("Mike2")("test2") output:----------------------- Hi, Mike1Can you help me, test1?Hi, Mike2Can you help me, test2?
我们调用hp()也就是调用的func_deco(),所以返回的是真正的hp对象,hp()()这个时候就是对真正的hp进行调用。但是这样就改变了hp的行为了,所以除了特殊情况下,一般不这么做!
Python装饰器(decorator)在实现的时候,有一些细节需要被注意。例如,被装饰后的函数其实已经是另外一个函数了(函数名等函数属性会发生改变)。这样有时候会对程序造成一些不便,例如笔者想对unittest框架中的一些函数添加自定义的decorator,添加后由于函数名和函数的doc发生了改变,对测试结果有一些影响。所以,Python的functools包中提供了一个叫wraps的decorator来消除这样的副作用。写一个decorator的时候,最好在实现之前加上functools的wrap,它能保留原有函数的名称和docstring。
def authenticated(method): @functools.wraps(method) def wrapper(self, *args, **kwargs): if not self.current_user: if self.request.method in ("GET", "HEAD"): url = self.get_login_url() if "?" not in url: if urlparse.urlsplit(url).scheme: # if login url is absolute, make next absolute too next_url = self.request.full_url() else: next_url = self.request.uri url += "?" + urlencode(dict(next=next_url)) self.redirect(url) return raise HTTPError(403) return method(self, *args, **kwargs) return wrapper
在python的使用过程中,我们经常需要构造一个列表。列表推导为我们提供了一个简单的方法:
clist = [x for x in range(100) if x % 2 == 0]
使用一句话轻松生成一个100以内的偶数列表。
在python 3.1(反向移植到python 2.7)之后,集合(不是元组)和字典也支持推导式:
>>> { x for x in range(10) if x % 2 == 0}set([0, 8, 2, 4, 6])>>> { x: x * 2 for x in range(10) if x % 2 == 0}{0: 0, 8: 16, 2: 4, 4: 8, 6: 12}
注意:(x for x in range(10) if x % 2 == 0) 得到的是一个生成器
判断键的存在性
丑陋的:
dic.has_key(key)
python的做法:
key in dic
丑陋的:
not key in dic
难道这样不是更好:
key not in dic
字典取值
丑陋的:
if key not in dic: dic[key] = 0dic[key] = dic[key] + 1
这样更简洁:
dic[key] = dic.get(key, 0) + 1
统计计数
统计字典重复的次数:
>>> from collections import Counter>>> Counter([1,1,1,1,2,1,2,3,2,3])Counter({1: 5, 2: 3, 3: 2})
字典的初始化
有时你的字典里都是经常修改的对象,你需要初始化一些数据到这个字典,也需要修改其中的一些值。比如说,你在维护一个这样的dict:它的值都是链表。
常见的:
dct = {}for (key, value) in data: if key in dct: dct[key].append(value) else: dct[key] = [value]
好一点:
dct = {}for (key, value) in data: group = dct.setdefault(key, []) # key might exist already group.append(value)
setdefault,如果存在,返回dct[key],不存在就设为default,并返回。
使用defaultdict:
dct = defaultdict(list)for (key, value) in data: dct[key].append(value) # all keys have a default already
defaultdict,对于每生成一对新的key-value,就会给value一个默认值,这个默认值就是defaultdict的参数。
以下介绍来自PyZh
函数参数unpack
def foo(x, y): print x, yalist = [1, 2]adict = {'x': 1, 'y': 2}foo(*alist) # 1, 2foo(**adict) # 1, 2
链式比较操作符
>>> x = 3>>> 1 < x < 5True>>> 4 > x >=3True
注意函数的默认参数
>>> def foo(x=[]):... x.append(1)... print x...>>> foo()[1]>>> foo()[1, 1]
更安全的做法:
>>> def foo(x=None):... if x is None:... x = []... x.append(1)... print x...>>> foo()[1]>>> foo()[1]>>>
字典有个get()方法
dct.get(key[, default_value]) , 当字典 dct 中找不到 key 时, get 就会返回 default_valuesum[value] = sum.get(value, 0) + 1
带关键字的格式化
>>> print "Hello %(name)s !" % {'name': 'James'}Hello James !>>> print "I am years %(age)i years old" % {'age': 18}I am years 18 years old
更新些的格式化:
>>> print "Hello {name} !".format(name="James")Hello James !
快有些模板引擎的味道了:)
for...else 语法
>>> for i in (1, 3, 5):... if i % 2 == 0:... break... else:... print "var i is always an odd"...var i is always an odd>>>
else 语句块会在循环结束后执行,除非在循环块中执行 break
**dict 的特殊方法__missing__**
Python 2.5之后引入的。当查找不到 key 的时候,会执行这个方法。
>>> class Dict(dict):... def __missing__(self, key):... self[key] = []... return self[key]...>>> dct = Dict()>>> dct["foo"].append(1)>>> dct["foo"].append(2)>>> dct["foo"][1, 2]
这很像 collections.defaultdict 不是吗?
>>> from collections import defaultdict>>> dct = defaultdict(list)>>> dct["foo"][]>>> dct["bar"].append("Hello")>>> dctdefaultdict(<type 'list'>, {'foo': [], 'bar': ['Hello']})
切片操作的步长参数
还能用步长 -1 来反转链表:
>>> a = [1, 2, 3, 4, 5]>>> a[::2][1, 3, 5]>>> a[::-1][5, 4, 3, 2, 1]>>>9.9. 另一种字符串连接>>> Name = "Wang" "Hong">>> Name'WangHong'
连接多行:
>>> Name = "Wang" /... "Hong">>> Name'WangHong'
**Python解释器中的”_”**
>>> range(4)[0, 1, 2, 3]>>> _[0, 1, 2, 3]
_ 即Python解释器上一次返回的值
嵌套列表推导式
>>> [(i, j) for i in range(3) for j in range(i)][(1, 0), (2, 0), (2, 1)]
try/except/else
try: put_4000000000_volts_through_it(parrot)except Voom: print "'E's pining!"else: print "This parrot is no more!"finally: end_sketch()
print 重定向输出到文件
>>> print >> open("somefile", "w+"), "Hello World"
注意打开的模式: "w+" 而不能 "w" , 当然 "a" 是可以的
省略号
在 Python 3 中你可以直接使用省略号这个文法:
Python 3.2 (r32:88445, Oct 20 2012, 14:09:50)[GCC 4.5.2] on linux2Type "help", "copyright", "credits" or "license" for more information.>>> ...EllipsisPython2 中呢?>>> class C(object):... def __getitem__(self, item):... return item...>>> C()[1:2, ..., 3](slice(1, 2, None), Ellipsis, 3)>>>
Python3中的元组unpack
>>> a, b, *rest = range(10)>>> a0>>> b1>>> rest[2, 3, 4, 5, 6, 7, 8, 9]>>>
当然也可以取出最后一个:
>>> first, second, *rest, last = range(10)>>> first0>>> second1>>> last9>>> rest[2, 3, 4, 5, 6, 7, 8]
pow()还有第三个参数
我们都知道内置函数 pow, pow(x, y) 即 x ** y
但是它还可以有第三个参数:
>>> pow(4, 2, 2)0>>> pow(4, 2, 3)1
其实第三个参数是来求模的: pow(x, y, z) == (x ** y) % z
注意,内置的 pow 和 math.pow 并不是一个函数,后者只接受2个参数
enumerate还有第二个参数
enumerate 很赞,可以给我们索引和序列值的对, 但是它还有第二个参数:
>>> lst = ["a", "b", "c"]>>> list(enumerate(lst, 1))[(1, 'a'), (2, 'b'), (3, 'c')]
这个参数用来: 指明索引的起始值
显式的声明一个集合
新建一个集合,我们会:
>>> set([1,2,3])
在Python 2.7 之后可以这么写了:
>>> {1,2,3}set([1, 2, 3])
用切片来删除序列的某一段
>>> a = [1, 2, 3, 4, 5, 6, 7]>>> a[1:4] = []>>> a[1, 5, 6, 7]
当然用 del a[1:4] 也是可以的
去除偶数项(偶数索引的):
>>> a = [0, 1, 2, 3, 4, 5, 6, 7]>>> del a[::2]>>> a[1, 3, 5, 7]
isinstance可以接收一个元组
这个真的鲜为人知, 我们可以用 isinstance(x, (float, int)) 来判断 x 是不是数:
>>> isinstance(1, (float, int))True>>> isinstance(1.3, (float, int))True>>> isinstance("1.3", (float, int))False
那么对于第三个测试,你把 str 加入元组就可以看到这是怎么回事了:
>>> isinstance("1.3", (float, int, str))True
也就是那个元组里面是 或 的关系,只要是其中一个的实例就返回 True
字典里的无限递归
>>> a, b = {}, {}>>> a['b'] = b>>> b['a'] = a>>> a{'b': {'a': {...}}}
当然你可以制作一个链表中的无限循环:
>>> a, b = [], []>>> a.append(b)>>> b.append(a)>>> a[[[...]]]
真心不知道有什么用,不过蛮好玩的不是吗
Python可以认识Unicode中的数字
所以说,Python很赞:
>>> int(u'1234')1234
不只是ASCII字符串的可以认出来,连Unicode的也可以。
不能访问到的属性
>>> class O(object):pass...>>> o = O()>>> setattr(o, "can't touch this", 123)>>> o.can't touch this File "<stdin>", line 1 o.can't touch this ^SyntaxError: EOL while scanning string literal>>>
不过,能用 setattr 设置属性,就可以用 getattr 取出
新闻热点
疑难解答