首页 > 编程 > Python > 正文

python根据unicode判断语言类型实例代码

2019-11-25 15:20:56
字体:
来源:转载
供稿:网友

本文实例主要实现的是python根据unicode判断语言类型,具体如下。

实例代码:

def is_chinese(uchar): """判断一个unicode是否是汉字"""   if uchar >= u'/u4e00' and uchar<=u'/u9fa5':     return True   else:     return False  def is_number(uchar): """判断一个unicode是否是数字"""   if uchar >= u'/u0030' and uchar<=u'/u0039':     return True   else:     return False  def is_alphabet(uchar): """判断一个unicode是否是英文字母"""   if (uchar >= u'/u0041' and uchar<=u'/u005a') or (uchar >= u'/u0061' and uchar<=u'/u007a'):     return True   else:     return False  def is_other(uchar): """判断是否非汉字,数字和英文字符"""   if not (is_chinese(uchar) or is_number(uchar) or is_alphabet(uchar)):     return True   else:     return False  def B2Q(uchar): """半角转全角"""   inside_code=ord(uchar)   if inside_code<0x0020 or inside_code>0x7e: #不是半角字符就返回原来的字符     return uchar   if inside_code==0x0020: #除了空格其他的全角半角的公式为:半角=全角-0xfee0     inside_code=0x3000   else:     inside_code+=0xfee0   return unichr(inside_code)  def Q2B(uchar): """全角转半角"""   inside_code=ord(uchar)   if inside_code==0x3000:     inside_code=0x0020   else:     inside_code-=0xfee0   if inside_code<0x0020 or inside_code>0x7e: #转完之后不是半角字符返回原来的字符     return uchar   return unichr(inside_code)  def stringQ2B(ustring): """把字符串全角转半角"""   return "".join([Q2B(uchar) for uchar in ustring])  def uniform(ustring): """格式化字符串,完成全角转半角,大写转小写的工作"""   return stringQ2B(ustring).lower()  def string2List(ustring): """将ustring按照中文,字母,数字分开""" retList=[] utmp=[] for uchar in ustring: if is_other(uchar): if len(utmp)==0: continue else: retList.append("".join(utmp)) utmp=[] else: utmp.append(uchar) if len(utmp)!=0: retList.append("".join(utmp)) return retList 

总结

以上就是本文关于python根据unicode判断语言类型实例代码的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表