Pythontips

2019-11-14 17:31:22

字体：大中小

来源：转载

供稿：网友

I am not a creator. I am just a porter.

简介：对一些python的小知识进行总结

#### lambda匿名函数 #### {#lambda}

lambda函数也叫匿名函数，也就是函数没有名称。先看一个简单的例子：

def add(x, y):    return x + y

对应的lambda函数则如下：

add = lambda x, y: x + y

我们在很多情况下都可以看到lambda表达式，它并不是python特有的，而且大多数情况下我们并不会使用它。那么，在什么情况下使用lambda函数呢？由于lambda没有函数名这样不会产生很多函数的引用，这样对代码的清晰是有好处的，个人认为，当一个功能简单的函数，只在某个局部使用而且使用的次数不多，我们可以使用lambda函数，当然，不用lambda是完全可以的。

#### python生成器 #### {#generator}

什么是生成器？在谈这个问题之前我们来看看python的迭代器。当我们可以逐项去读取的对象的属性时，我们就说这个对象是可迭代的：

>>> clist = [1, 2, 3, 4]>>> for item in clist:...     PRint item...     1234>>> for item in clist:...     print item...     1234>>>

clist是一个可迭代的对象，可以使用for-in语法来访问每个item。我们常见的迭代器：list，tuple，dict，file... for语句在容器对象中调用iter()，该函数调用对象的__iter__()函数返回一个定义了next()方法的迭代器对象：

class Array(object):    def __init__(self):        self._list = [i for i in range(10)]        self.ops = -1    def __iter__(self):        self.ops = -1        return self    def next(self):        self.ops += 1        if self.ops == len(self._list):            raise StopIteration()        return self._list[self.ops]

__iter__()和next()不必要在同一个类，我们只要明白，__iter__()是返回一个可迭代的对象，而可迭代的对象包含next()，记住越界raise StopIteration：

class Array(object):    def __init__(self):        self._list = [i for i in range(10)]    def __iter__(self):        return ArrayIterator(self)class ArrayIterator(object):    def __init__(self, array):        self._array = array        self._ops = -1    def next(self):        self._ops += 1        if self._ops == len(self._array._list):            raise StopIteration()        return self._array._list[self._ops]

说完迭代器，我们来看看生成器，首先生成器是可以迭代的，但是只可以读取一次，因为它并不把所有的值放在内存中，而是实时生成数据：

>>> gen = (i for i in range(10))>>> for ite in gen:...     print ite...       0123456789>>> for ite in gen:...     print ite... >>>

比较code-2.1和code-2.4，发现当我们把[]换成()后，for...in...只能使用一次，这就是因为生成器只能被迭代一次。

如何构造一个生成器？我们使用yield关键字。yield是一个类似return的关键字，只是这个函数返回的是一个生成器：

def generator(init_list):for i in init_list:    yield igen = generator([i for i in range(3)])for i in gen:    print i # out 0 1 2print gen.next() # raise StopIteration

首先当我们调用generator这个函数的时候，它并不是立马就执行，这个函数返回一个生成器对象(包含next()方法）。函数内的代码则是当我们使用for循环的时候执行。如果生成器内部没有定义yield，那么这个生成器被认为成空，不满足循环条件。

#### python装饰器 #### {#decorator}

装饰器，用于装饰一个函数，所谓的装饰就是在原有的基础上增加功能(参数检查，编码解码，添加日志...)

def help():    """        一个请求帮助的函数    """    print("Can you help me?")def decorator(func):    """        在请求帮助前，打招呼    """    print("Hi, Mike!")    return func #这里要返回原函数对象，否则外面无法调用def decorator_with_funcparams(args):    """        装饰器和被装饰的函数都是带参数的，args是装饰器的参数，func_param是被装饰的函数的参数    """    def _deco(func):        def func_deco(func_param):            print("Hi, " + func_param)            return func()        return func_deco    return _deco

装饰器测试：

hp = decorator(help)hp()hp()output:----------------Hi, Mike!Can you help me?Can you help me?

装饰器只装饰一次，所以Hi，Mike！输出一次，

@decoratordef hp():    help()hp()hp()output:----------------Hi, Mike!Can you help me?Can you help me?

为了使得每次调用的时候，都能被装饰，我们需要在装饰器使用内嵌函数：

def decorator_with_inner(func):    def _deco():        print("Hi, Mike!")        return func() #这里调用函数，而不是返回原函数的对象    return _deco@decorator_with_innerdef hp():    help()hp() #实际上调用的是_deco()hp()output:----------------Hi, Mike!Can you help me?Hi, Mike!Can you help me?

有时候装饰器是根据上下文来确定装饰动作，这个是就需要带参数了：

def decorator_with_params(args):    """        带有参数的装饰器，由于有参数，所以在函数调用时只会使用应用时的参数        而不是接收被装饰的函数作为参数，所以必须在其内部再创建一个函数    """    print(args)    def _deco(func):        print("Hi, Mike")        return func #这里不能使用func()    return _deco@decorator_with_params(args = 'Please!')def hp():    help()hp() #调用的是func()，不是_deco()hp()output:----------------Please!Hi, Mike!Can you help me?Can you help me?

这里可以看出装饰器(传入被装饰函数对象的函数以及外层的函数)只会执行一遍，对于这个例子来说，print(args)和_deco函数都只是执行了一遍。当我们调用hp()的时候实际上调用的是我们传入func时的函数的返回值，所以在那一层不要调用函数，而是返回函数对象。所以为了保证每次都执行装饰动作我们需要在传入func的函数中内嵌一个函数：

def decorator_with_params2(args):    """        带有参数的装饰器，由于有参数，所以在函数调用时只会使用应用时的参数        而不是接收被装饰的函数作为参数，所以必须在其内部再创建一个函数    """    print(args)    def _deco(func):        def f_deco():            print("Hi, Mike")            return func() #注意这里是调用函数，而不是返回原函数对象        return f_deco    return _deco@decorator_with_params(args = 'Please!')def hp():    help()hp() #调用的是f_deco()，不是_deco()hp()output:----------------Please!Hi, MikeCan you help me?Hi, MikeCan you help me?

当被装饰的函数需要传入参数，在内嵌函数中带上参数就可以了：

def decorator_with_funcparams(args):"""    装饰器和被装饰的函数都是带参数的，args是装饰器的参数，func_param是被装饰的函数的参数"""def _deco(func):    def func_deco(func_param):        print("Hi, " + func_param)        return func(func_param)    return func_decoreturn _deco@decorator_with_funcparams(args = 'Please!')def hp(func_param):    print("Can you help me, " + func_param + "?")hp("Mike1") hp("Mike2")output:-----------------------Hi, Mike1Can you help me, Mike1?Hi, Mike2Can you help me, Mike2?

调用hp("Mike1")实际上就是调用func_deco("Mike1")，所以在func_deco()函数体中是调用func()，而不是返回函数对象。如果我们返回的是函数对象会怎么样：

def decorator_with_funcparams(args):    """        装饰器和被装饰的函数都是带参数的，args是装饰器的参数，func_param是被装饰的函数的参数    """    def _deco(func):        def func_deco(func_param):            print("Hi, " + func_param)            return func        return func_deco    return _deco@decorator_with_funcparams(args = 'Please!')def hp(func_param):    print("Can you help me, " + func_param + "?")hp("Mike1")("test1")hp("Mike2")("test2") output:----------------------- Hi, Mike1Can you help me, test1?Hi, Mike2Can you help me, test2?

我们调用hp()也就是调用的func_deco()，所以返回的是真正的hp对象，hp()()这个时候就是对真正的hp进行调用。但是这样就改变了hp的行为了，所以除了特殊情况下，一般不这么做！

Python装饰器（decorator）在实现的时候，有一些细节需要被注意。例如，被装饰后的函数其实已经是另外一个函数了（函数名等函数属性会发生改变）。这样有时候会对程序造成一些不便，例如笔者想对unittest框架中的一些函数添加自定义的decorator，添加后由于函数名和函数的doc发生了改变，对测试结果有一些影响。所以，Python的functools包中提供了一个叫wraps的decorator来消除这样的副作用。写一个decorator的时候，最好在实现之前加上functools的wrap，它能保留原有函数的名称和docstring。

def authenticated(method):       @functools.wraps(method)    def wrapper(self, *args, **kwargs):        if not self.current_user:            if self.request.method in ("GET", "HEAD"):                url = self.get_login_url()                if "?" not in url:                    if urlparse.urlsplit(url).scheme:                        # if login url is absolute, make next absolute too                        next_url = self.request.full_url()                    else:                        next_url = self.request.uri                    url += "?" + urlencode(dict(next=next_url))                self.redirect(url)                return            raise HTTPError(403)        return method(self, *args, **kwargs)    return wrapper

#### python列表，字典，集合推导 #### {#derive}

在python的使用过程中，我们经常需要构造一个列表。列表推导为我们提供了一个简单的方法：

clist = [x for x in range(100) if x % 2 == 0]

使用一句话轻松生成一个100以内的偶数列表。

在python 3.1(反向移植到python 2.7)之后，集合(不是元组)和字典也支持推导式：

>>> { x for x in range(10) if x % 2 == 0}set([0, 8, 2, 4, 6])>>> { x: x * 2 for x in range(10) if x % 2 == 0}{0: 0, 8: 16, 2: 4, 4: 8, 6: 12}

注意：(x for x in range(10) if x % 2 == 0) 得到的是一个生成器

#### python字典的使用 #### {#dictionary}

判断键的存在性

丑陋的：

dic.has_key(key)

python的做法：

key in dic

丑陋的：

not key in dic

难道这样不是更好：

key not in dic

字典取值

丑陋的：

if key not in dic:    dic[key] = 0dic[key] = dic[key] + 1

这样更简洁：

dic[key] = dic.get(key, 0) + 1

统计计数

统计字典重复的次数：

>>> from collections import Counter>>> Counter([1,1,1,1,2,1,2,3,2,3])Counter({1: 5, 2: 3, 3: 2})

字典的初始化

有时你的字典里都是经常修改的对象，你需要初始化一些数据到这个字典，也需要修改其中的一些值。比如说，你在维护一个这样的dict:它的值都是链表。

常见的：

dct = {}for (key, value) in data:    if key in dct:        dct[key].append(value)    else:        dct[key] = [value]

好一点：

dct = {}for (key, value) in data:    group = dct.setdefault(key, []) # key might exist already    group.append(value)

setdefault，如果存在，返回dct[key]，不存在就设为default，并返回。

使用defaultdict：

dct = defaultdict(list)for (key, value) in data:    dct[key].append(value) # all keys have a default already

defaultdict，对于每生成一对新的key-value，就会给value一个默认值，这个默认值就是defaultdict的参数。

#### Python的隐藏特性 ####

以下介绍来自PyZh

函数参数unpack

def foo(x, y):    print x, yalist = [1, 2]adict = {'x': 1, 'y': 2}foo(*alist)  # 1, 2foo(**adict)  # 1, 2

链式比较操作符

>>> x = 3>>> 1 < x < 5True>>> 4 > x >=3True

注意函数的默认参数

>>> def foo(x=[]):...     x.append(1)...     print x...>>> foo()[1]>>> foo()[1, 1]

更安全的做法:

>>> def foo(x=None):...     if x is None:...         x = []...     x.append(1)...     print x...>>> foo()[1]>>> foo()[1]>>>

字典有个get()方法

dct.get(key[, default_value]) , 当字典 dct 中找不到 key 时， get 就会返回 default_valuesum[value] = sum.get(value, 0) + 1

带关键字的格式化

>>> print "Hello %(name)s !" % {'name': 'James'}Hello James !>>> print "I am years %(age)i years old" % {'age': 18}I am years 18 years old

更新些的格式化:

>>> print "Hello {name} !".format(name="James")Hello James !

快有些模板引擎的味道了:)

for...else 语法

>>> for i in (1, 3, 5):...     if i % 2 == 0:...         break... else:...     print "var i is always an odd"...var i is always an odd>>>

else 语句块会在循环结束后执行，除非在循环块中执行 break

**dict 的特殊方法__missing__**

Python 2.5之后引入的。当查找不到 key 的时候，会执行这个方法。

>>> class Dict(dict):...   def __missing__(self, key):...     self[key] = []...     return self[key]...>>> dct = Dict()>>> dct["foo"].append(1)>>> dct["foo"].append(2)>>> dct["foo"][1, 2]

这很像 collections.defaultdict 不是吗?

>>> from collections import defaultdict>>> dct = defaultdict(list)>>> dct["foo"][]>>> dct["bar"].append("Hello")>>> dctdefaultdict(<type 'list'>, {'foo': [], 'bar': ['Hello']})

切片操作的步长参数

还能用步长 -1 来反转链表:

>>> a = [1, 2, 3, 4, 5]>>> a[::2][1, 3, 5]>>> a[::-1][5, 4, 3, 2, 1]>>>9.9. 另一种字符串连接>>> Name = "Wang" "Hong">>> Name'WangHong'

连接多行:

>>> Name = "Wang" /...  "Hong">>> Name'WangHong'

**Python解释器中的”_”**

>>> range(4)[0, 1, 2, 3]>>> _[0, 1, 2, 3]

_ 即Python解释器上一次返回的值

嵌套列表推导式

>>> [(i, j) for i in range(3) for j in range(i)][(1, 0), (2, 0), (2, 1)]

try/except/else

try:  put_4000000000_volts_through_it(parrot)except Voom:  print "'E's pining!"else:  print "This parrot is no more!"finally:  end_sketch()

print 重定向输出到文件

>>> print >> open("somefile", "w+"), "Hello World"

注意打开的模式: "w+" 而不能 "w" , 当然 "a" 是可以的

省略号

在 Python 3 中你可以直接使用省略号这个文法:

Python 3.2 (r32:88445, Oct 20 2012, 14:09:50)[GCC 4.5.2] on linux2Type "help", "copyright", "credits" or "license" for more information.>>> ...EllipsisPython2 中呢?>>> class C(object):...  def __getitem__(self, item):...   return item...>>> C()[1:2, ..., 3](slice(1, 2, None), Ellipsis, 3)>>>

Python3中的元组unpack

>>> a, b, *rest = range(10)>>> a0>>> b1>>> rest[2, 3, 4, 5, 6, 7, 8, 9]>>>

当然也可以取出最后一个:

>>> first, second, *rest, last = range(10)>>> first0>>> second1>>> last9>>> rest[2, 3, 4, 5, 6, 7, 8]

pow()还有第三个参数

我们都知道内置函数 pow, pow(x, y) 即 x ** y

但是它还可以有第三个参数:

>>> pow(4, 2, 2)0>>> pow(4, 2, 3)1

其实第三个参数是来求模的: pow(x, y, z) == (x ** y) % z

注意，内置的 pow 和 math.pow 并不是一个函数，后者只接受2个参数

enumerate还有第二个参数

enumerate 很赞，可以给我们索引和序列值的对, 但是它还有第二个参数:

>>> lst = ["a", "b", "c"]>>> list(enumerate(lst, 1))[(1, 'a'), (2, 'b'), (3, 'c')]

这个参数用来: 指明索引的起始值

显式的声明一个集合

新建一个集合，我们会:

>>> set([1,2,3])

在Python 2.7 之后可以这么写了:

>>> {1,2,3}set([1, 2, 3])

用切片来删除序列的某一段

>>> a = [1, 2, 3, 4, 5, 6, 7]>>> a[1:4] = []>>> a[1, 5, 6, 7]

当然用 del a[1:4] 也是可以的

去除偶数项(偶数索引的):

>>> a = [0, 1, 2, 3, 4, 5, 6, 7]>>> del a[::2]>>> a[1, 3, 5, 7]

isinstance可以接收一个元组

这个真的鲜为人知, 我们可以用 isinstance(x, (float, int)) 来判断 x 是不是数:

>>> isinstance(1, (float, int))True>>> isinstance(1.3, (float, int))True>>> isinstance("1.3", (float, int))False

那么对于第三个测试，你把 str 加入元组就可以看到这是怎么回事了:

>>> isinstance("1.3", (float, int, str))True

也就是那个元组里面是或的关系，只要是其中一个的实例就返回 True

字典里的无限递归

>>> a, b = {}, {}>>> a['b'] = b>>> b['a'] = a>>> a{'b': {'a': {...}}}

当然你可以制作一个链表中的无限循环:

>>> a, b =  [], []>>> a.append(b)>>> b.append(a)>>> a[[[...]]]

真心不知道有什么用，不过蛮好玩的不是吗

Python可以认识Unicode中的数字

所以说，Python很赞:

>>> int(u'1234')1234

不只是ASCII字符串的可以认出来，连Unicode的也可以。

不能访问到的属性

>>> class O(object):pass...>>> o = O()>>> setattr(o, "can't touch this", 123)>>> o.can't touch this  File "<stdin>", line 1    o.can't touch this                     ^SyntaxError: EOL while scanning string literal>>>

不过，能用 setattr 设置属性，就可以用 getattr 取出

上一篇：pymmseg安装方法以及乱码解决

下一篇：Djangoadmin的一些有用定制