python ——讀寫Excel文件
本節介紹xlrd和xlwt庫讀寫excel文件,使用這些庫的好處在于它不需要使用COM接口驅動Microsoft excel,因此不需要安裝office套件就可以操作excel文件。
1. 讀Excel文件
在xlwt中,用xlwt.Workbook對象表示Excel文件,通過操作此對象可修改Excel文檔內容,最后調用其save()方法將文檔保存成文件。通過操作Workbook對象可創建如下對象:
?
Worksheet | 表示Excel文檔中的一個工作表。可通過Workbook.add_sheet()創建WorkSheet對象,通過get_sheet()獲取已經存在的WorkSheet對象。 |
---|---|
Row | 表示工作表中的一行,用Worksheet.row()創建或獲取。 |
Column | 表示工作表中的一列,用Worksheet.col()創建或獲取。 |
Cell | 通過worksheet.write()或row.write()直接寫指定單元格。 |
下面是一個簡單例子:
#演示讀寫excel文件
import numpy as np
from xlwt import *
#write excel
book = Workbook()
sheet1 = book.add_sheet(u'隨機數')
head = ['normal','power','gamma','SUM']
N = 100
data = np.vstack([
np.random.normal(size=N),
np.random.power(a=1.0,size=N),
np.random.gamma(0.9,size=N)
])
#創建對其配置
al = Alignment()
al.horz = Alignment.HORZ_CENTER
al.vert = Alignment.VERT_CENTER
#創建邊框配置
borders = Borders()
borders.bottom = Borders.THICK
#創建樣式
style = XFStyle() #引用各種配置
style.alignment = al
style.borders = borders
#獲得第0行
row0 = sheet1.row(0)
#將標題寫入第0行,使用所創建的樣式
for i , text in enumerate(head):
#write()中的style參數指定單元格樣式。
row0.write(i, text, style=style)
#寫入隨機數
for i, line in enumerate(data):
for j, value in enumerate(line):
sheet1.write(j+1,i,value)
#寫入求和公式,注意公式中的單元格下表從1開始計數
for i in range(N):
sheet1.row(i+1).set_cell_formula(3,Formula("sum(A%s:C%s)" %(i+2,i+2)),calc_flags=1)
#設置4個列的寬度
for i in range(4):
sheet1.col(i).width = 4000
#設置第0行高度
sheet1.row(0).height_mismatch = 1
sheet1.row(0).height = 1000
book.save("temp_write.xls")
程序如圖所示,除了將數組寫入excel文件外,還演示了各種屬性的配置。
xlwt的Utils模塊中有如下經常用到的輔助函數:
?
Cell_to_rowcol() | 單元格字符串表達式變換為行列編號。返回一個包含4個元素的元組(行編號,列編號,行是否為絕對坐標,列是否為絕對坐標)。 |
---|---|
Col_by_name() | 將列名轉換為列的編號,例如將“C”轉換為2。 |
Cell_to_rowcol2() | 和Cell_to_rowcol()類似,但只返回編號信息。 |
Rowcol_to_cell() | 和cell_to_rowcol()相反,將編號變換為字符串表達式。 |
Cellrange_to_rowcol_pair() | 將字符串表示的范圍變換為一個包含4個元素的元組(起始行號,起始列號,結束行號,結束列號) |
Rowcol_pair_to_cellrange() | 和cellrange_to_rowcol_pair()相反。 |
下面舉例說明:
>>> from xlwt import Utils
>>> Utils.cell_to_rowcol("C4")
(3, 2, False, False)
>>> Utils.cell_to_rowcol("C8")
(7, 2, False, False)
>>> Utils.cell_to_rowcol2("C8")
(7, 2)
>>> Utils.cell_to_rowcol("$C$8")
(7, 2, True, True)
>>> Utils.rowcol_to_cell(200,100)
'CW201'
>>> Utils.rowcol_to_cell(200,100,row_abs=True,col_abs=True)
'$CW$201'
2.寫Excel文件
讀excel文件需要使用xlrd庫,xlrd無法直接讀取xlwd輸出的公式單元格,需要先用excel打開文檔并保存之后擦能用xlrd計算公式單元格。
首先從xlrd庫導入打開Workbook的函數open_workbook(),并用來打開上面程序保存的文件:
from xlrd import open_workbook
book = open_workbook("temp_write.xls")
print(book.nsheets) #工作表數目
print(book.sheet_names()[0]) #第一個公組表名字
sheet = book.sheets()[0] #第一個工作表
調用對象cell()、row()、col(),可讀取其中制定的單元格、行以及列中元素,這些方法返回的是cell對象,如果希望直接獲得它們的值,可調用cell_value()、row_values()、col_values():
>>> sheet.cell(0,0) #讀取A1內容
text:'normal'
>>> sheet.row(0) #讀取第1行內容
[text:'normal', text:'power', text:'gamma', text:'SUM']
>>> sheet.row(1) #讀取第2行內容
[number:-1.5989086951984588, number:0.41888917782871615, number:1.4995766476459662, number:0.31955713027622346]
>>> sum(x.value for x in sheet.col(1,start_rowx=1))
54.921543333699844 #讀取第2列內容,從第2行開始求和
>>> sum(sheet.col_values(1,start_rowx=1)) #同上
54.921543333699844
>>> sheet.cell(1,3) #讀取單元格的值
number:0.31955713027622346
如果我們需要讀取某個excel文件,修改其中的某些內容,然后再寫回excel文件中,那么可使用xlutils庫的copy()來快速完成從xlrd.book到xlwt.workbook的轉換復制工作。
from xlutils.copy import copy
rb = open_workbook("temp_write.xls",formatting_info=True)
wb = copy(rb)
ws = wb.get_sheet(0)
ws.write(0,4,u"添加的內容")
wb.save("temp_write.xls")
注意:xlrd 庫無法獲取公式本身的字符串,因此公式單元格無法在復制過程中保留下來。
智能推薦
14-用Python 讀寫 Excel 文件
在以前,商業分析對應的英文單詞是Business Analysis,大家用的分析工具是Excel,后來數據量大了,Excel應付不過來了(Excel最大支持行數為1048576行),人們開始轉向python和R這樣的分析工具了 XlsxWriter xlrd&xlwt[2] OpenPyXL[3] Microsoft Excel API[4] 介紹 可以創建 Excel 2007 或更高版...
python讀寫excel文件簡單應用
本文主要技術要點: 使用xlrd讀取excel文件 使用xlwd寫入excel文件 excel文件中時間元素的簡單計算 1.題目要求 根據如下名為時刻表.xlsx的文件計算每種路線需要的時間,并將結果寫入新文件: 2.環境配置 安裝需要用到的xlrd和xlwd庫: 3.讀取excel文件 讀取文件首先需要打開文件對象,使用xlrd.open_workbook()函數打開文件,該函數返回獲取的文件對...
如何用Python讀寫Excel文件
目錄 前言 從文件讀數據 讀取xls文件 打開工作簿 獲取工作表 讀取行 讀取列 讀取單元格 讀取xlsx文件 打開工作簿 獲取工作表 讀取行數據 讀取列數據 讀取單元格 寫數據到文件 新建工作簿 新建工作表 將數據寫入對應單元格 保存文件 打開文件并看效果 其他方法 總結 前言 做數據分析的小伙伴分析的數據經常來自于Excel,想實現自動化辦公的小伙伴除了學習VBA編程,python更容易上手,...
freemarker + ItextRender 根據模板生成PDF文件
1. 制作模板 2. 獲取模板,并將所獲取的數據加載生成html文件 2. 生成PDF文件 其中由兩個地方需要注意,都是關于獲取文件路徑的問題,由于項目部署的時候是打包成jar包形式,所以在開發過程中時直接安照傳統的獲取方法沒有一點文件,但是當打包后部署,總是出錯。于是參考網上文章,先將文件讀出來到項目的臨時目錄下,然后再按正常方式加載該臨時文件; 還有一個問題至今沒有解決,就是關于生成PDF文件...
猜你喜歡
電腦空間不夠了?教你一個小秒招快速清理 Docker 占用的磁盤空間!
Docker 很占用空間,每當我們運行容器、拉取鏡像、部署應用、構建自己的鏡像時,我們的磁盤空間會被大量占用。 如果你也被這個問題所困擾,咱們就一起看一下 Docker 是如何使用磁盤空間的,以及如何回收。 docker 占用的空間可以通過下面的命令查看: TYPE 列出了docker 使用磁盤的 4 種類型: Images:所有鏡像占用的空間,包括拉取下來的鏡像,和本地構建的。 Con...
requests實現全自動PPT模板
http://www.1ppt.com/moban/ 可以免費的下載PPT模板,當然如果要人工一個個下,還是挺麻煩的,我們可以利用requests輕松下載 訪問這個主頁,我們可以看到下面的樣式 點每一個PPT模板的圖片,我們可以進入到詳細的信息頁面,翻到下面,我們可以看到對應的下載地址 點擊這個下載的按鈕,我們便可以下載對應的PPT壓縮包 那我們就開始做吧 首先,查看網頁的源代碼,我們可以看到每一...
Linux C系統編程-線程互斥鎖(四)
互斥鎖 互斥鎖也是屬于線程之間處理同步互斥方式,有上鎖/解鎖兩種狀態。 互斥鎖函數接口 1)初始化互斥鎖 pthread_mutex_init() man 3 pthread_mutex_init (找不到的情況下首先 sudo apt-get install glibc-doc sudo apt-get install manpages-posix-dev) 動態初始化 int pthread_...
統計學習方法 - 樸素貝葉斯
引入問題:一機器在良好狀態生產合格產品幾率是 90%,在故障狀態生產合格產品幾率是 30%,機器良好的概率是 75%。若一日第一件產品是合格品,那么此日機器良好的概率是多少。 貝葉斯模型 生成模型與判別模型 判別模型,即要判斷這個東西到底是哪一類,也就是要求y,那就用給定的x去預測。 生成模型,是要生成一個模型,那就是誰根據什么生成了模型,誰就是類別y,根據的內容就是x 以上述例子,判斷一個生產出...