首页 > 编程 > Python > 正文

使用python将excel数据导入数据库过程详解

2019-11-25 11:51:13
字体:
来源:转载
供稿:网友

因为需要对数据处理,将excel数据导入到数据库,记录一下过程。

使用到的库:xlrd 和 pymysql (如果需要写到excel可以使用xlwt)

直接丢代码,使用python3,注释比较清楚。

import xlrdimport pymysql# import importlib# importlib.reload(sys) #出现呢reload错误使用def open_excel():  try:    book = xlrd.open_workbook("XX.xlsx") #文件名,把文件与py文件放在同一目录下  except:    print("open excel file failed!")  try:    sheet = book.sheet_by_name("sheet名称")  #execl里面的worksheet1    return sheet  except:    print("locate worksheet in excel failed!")  #连接数据库try:  db = pymysql.connect(host="127.0.0.1",user="root",    passwd="XXX",    db="XXX",    charset='utf8')except:  print("could not connect to mysql server") def search_count():  cursor = db.cursor()  select = "select count(id) from XXXX" #获取表中xxxxx记录数  cursor.execute(select) #执行sql语句  line_count = cursor.fetchone()  print(line_count[0])  def insert_deta():  sheet = open_excel()  cursor = db.cursor()  for i in range(1, sheet.nrows): #第一行是标题名,对应表中的字段名所以应该从第二行开始,计算机以0开始计数,所以值是1     name = sheet.cell(i,0).value #取第i行第0列    data = sheet.cell(i,1).value#取第i行第1列,下面依次类推    print(name)    print(data)    value = (name,data)    print(value)    sql = "INSERT INTO XXX(name,data)VALUES(%s,%s)"    cursor.execute(sql,value) #执行sql语句    db.commit()  cursor.close() #关闭连接insert_deta()db.close()#关闭数据print ("ok ")

XXX里自行修改自己的名称。

说明:对于不规则的单元格,例如合并过的单元格会取到空值。

优化了一下这个程序

import pymysqlimport xlrd # 连接数据库try:  db = pymysql.connect(host="127.0.0.1", user="root",             passwd="XXX",             db="XXX",             charset='utf8')except:  print("could not connect to mysql server") def open_excel():  try:    book = xlrd.open_workbook("XXX.xlsx") #文件名,把文件与py文件放在同一目录下  except:    print("open excel file failed!")  try:    sheet = book.sheet_by_name("XXX")  #execl里面的worksheet1    return sheet  except:    print("locate worksheet in excel failed!") def insert_deta():  sheet = open_excel()  cursor = db.cursor()  row_num = sheet.nrows  for i in range(1, row_num): # 第一行是标题名,对应表中的字段名所以应该从第二行开始,计算机以0开始计数,所以值是1    row_data = sheet.row_values(i)    value = (row_data[0],row_data[1],row_data[2],row_data[3])    print(i)    sql = "INSERT INTO demo_yangben(xxx,xxxx,xxxx,xxxx)VALUES(%s,%s,%s,%s)"    cursor.execute(sql, value) # 执行sql语句    db.commit()  cursor.close() # 关闭连接open_excel()insert_deta()

再改一下,每一万条数据写入到数据库一次

import pymysqlimport xlrdimport sys '''  连接数据库  args:db_name(数据库名称)  returns:db ''' def mysql_link(de_name):  try:    db = pymysql.connect(host="127.0.0.1", user="xxx",               passwd="xxx",               db=xxx,               charset='utf8')    return db  except:    print("could not connect to mysql server") '''  读取excel函数  args:excel_file(excel文件,目录在py文件同目录)  returns:book'''  def open_excel(excel_file):  try:    book = xlrd.open_workbook(excel_file) # 文件名,把文件与py文件放在同一目录下    print(sys.getsizeof(book))    return book  except:    print("open excel file failed!")  '''  执行插入操作  args:db_name(数据库名称)     table_name(表名称)     excel_file(excel文件名,把文件与py文件放在同一目录下) '''  def store_to(db_name, table_name, excel_file):  db = mysql_link(db_name) # 打开数据库连接  cursor = db.cursor() # 使用 cursor() 方法创建一个游标对象 cursor   book = open_excel(excel_file) # 打开excel文件  sheets = book.sheet_names() # 获取所有sheet表名  for sheet in sheets:    sh = book.sheet_by_name(sheet) # 打开每一张表    row_num = sh.nrows    print(row_num)    list = [] # 定义列表用来存放数据    num = 0 # 用来控制每次插入的数量    for i in range(1, row_num): # 第一行是标题名,对应表中的字段名所以应该从第二行开始,计算机以0开始计数,所以值是1      row_data = sh.row_values(i) # 按行获取excel的值      value = (row_data[0], row_data[1], row_data[2], row_data[3], row_data[4], row_data[5], /           row_data[6], row_data[7], row_data[8], row_data[9], row_data[10], row_data[11], row_data[12],           row_data[13], row_data[14])      list.append(value) # 将数据暂存在列表      num += 1      if( num>= 10000 ): # 每一万条数据执行一次插入        print(sys.getsizeof(list))        sql = "INSERT INTO " + table_name + " (time, xingbie, afdd, xzb, yzb, cfbj, jjlbmc, /        bjlbmc, bjlxmc, bjlxxlmc, gxqymc,gxdwmc, afql, afxqxx, cjdwmc)/        VALUES(%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)"        cursor.executemany(sql, list) # 执行sql语句         num = 0 # 计数归零        list.clear() # 清空list        print("worksheets: " + sheet + " has been inserted 10000 datas!")   print("worksheets: " + sheet + " has been inserted " + str(row_num) + " datas!")  db.commit() # 提交  cursor.close() # 关闭连接  db.close()  if __name__ == '__main__':  store_to('demo', 'demo_yangben', 'xxx.xlsx')

思考,如果数据插入有错误,怎么解决,

其实有很多数据库工具可以直接来解决这个问题,注意字符转换的格式就好。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持武林网。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表