Pandas 讀寫excel
標簽: Pandas 讀寫excel Pandas
Pandas 讀寫excel,除了CSV文件,使用Excel工作表存放列表形式的數據也很常見,Pandas定義了兩個API函數來專門處理Excel文件:read_excel()
和to_excel()
。read_excel()
函數能夠讀取Excel 2003(.xls)和Excel 2007(.xlsx)兩個類型的文件,該函數之所以能夠讀取Excel,是因為它整合了xlrd模塊。
首先打開一個Excel文件,在sheet1和sheet2中輸入數據,然后將文件保存為data.xlsx
。
讀取Excel文件
要讀取excel文件中的數據,并將其轉換為DataFrame對象,只需要使用read_excel()
函數即可,如下所示:
import pandas as pd
frame = pd.read_excel("data.xlsx")
print(frame)
輸出結果如下:
white red green black
a 12 23 17 18
b 22 16 19 18
c 14 23 22 21
如上所見,讀取excel時,默認返回的DataFrame對象包含第一個工作表中的數據。若要讀取第二個工作表中的數據,需要用第二個參數指定工作表的名稱或工作表的序號或索引,如下所示:
import pandas as pd
frame = pd.read_excel("data.xlsx",'Sheet2')
print(frame)
輸出結果如下:
yellow purple blue orange
A 11 16 44 22
B 20 22 23 44
C 30 31 37 32
也可以如下方式讀取數據:
import pandas as pd
frame = pd.read_excel("data.xlsx",1)
print(frame)
輸出結果如下:
yellow purple blue orange
A 11 16 44 22
B 20 22 23 44
C 30 31 37 32
寫入Excel文件
上述操作也適用于Excel寫操作,將DataFrame對象轉換為Excel,如下所示:
import pandas as pd
import numpy as np
frame = pd.DataFrame(np.random.random((4,4)),
index=['exp1','exp2','exp3','exp4'],
columns=['jan2015','Fab2015','Mar2015','Apr2005'])
print(frame)
frame.to_excel("data2.xlsx")
輸出結果如下:
jan2015 Fab2015 Mar2015 Apr2005
exp1 0.985263 0.963805 0.502845 0.035461
exp2 0.685198 0.362865 0.737473 0.277377
exp3 0.496066 0.367708 0.828998 0.833133
exp4 0.337033 0.391268 0.421885 0.202747
工作目錄中會生成一個包含數據的新Excel文件,存放數據如下所示:
操作Excel行列
- 讀取指定的單行,數據會存在列表里面
import pandas as pd
df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
data=df.ix[0].values #0表示第一行 這里讀取數據并不包含表頭,要注意哦!
print(data)
輸出結果如下所示:
[12 23 17 18]
- 讀取指定的多行,數據會存在嵌套的列表里面
import pandas as pd
df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
data=df.ix[[1,2]].values #讀取指定多行的話,就要在ix[]里面嵌套列表指定行數
print(data)
輸出結果如下所示:
[[22 16 19 18]
[14 23 22 21]]
- 讀取指定的行列
import pandas as pd
df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
data=df.ix[1,2] #讀取第一行第二列的值,這里不需要嵌套列表
print(data)
輸出結果如下所示:
19
- 讀取指定的多行多列值
import pandas as pd
df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
data=df.ix[[1,2],['red','green']].values#讀取第一行第二行的title以及data列的值,這里需要嵌套列表
print(data)
輸出結果如下所示:
[[16 19]
[23 22]]
- 獲取所有行的指定列
import pandas as pd
df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
data=df.ix[:,['red','green']].values#讀取第一行第二行的title以及data列的值,這里需要嵌套列表
print(data)
輸出結果如下所示:
[[23 17]
[16 19]
[23 22]]
- 獲取行號并打印輸出
import pandas as pd
df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
print(df.index.values)
輸出結果如下所示:
['a' 'b' 'c']
- 獲取列名并打印輸出
import pandas as pd
df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
print(df.columns.values)
輸出結果如下所示:
['white' 'red' 'green' 'black']
- 獲取指定行數的值
import pandas as pd
df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
print(df.sample(3).values)#這個方法類似于head()方法以及df.values方法
輸出結果如下所示:
[[12 23 17 18]
[22 16 19 18]
[14 23 22 21]]
- 獲取指定列的值
import pandas as pd
df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
print(df['white'].values)
輸出結果如下所示:
[12 22 14]
極客教程相關文章推薦,歡迎閱讀!
Pandas 讀取txt
Pandas 讀寫sqlite數據庫
Pandas 讀寫csv
智能推薦
Python文件讀寫 、 csv模塊、pandas操作文件、json模塊、xlrd模塊--操作Excel
python文件讀寫: 讀文件: 文件內容如右圖: file.read()方法返回的是整個文件的內容,type是str類型 file.readline()方法返回的是文件一行的內容(首行),type也是str類型 file.readlines()返回的是list類型, 并且文件的每一行是list中元素,每行最后都有一個'\n'換行符。list類型可遍歷(Iterator) 逐行讀取 ...
Python3,Pandas 5行代碼實現對excel 讀寫操作
Pandas 讀寫excel pandas 寫入excel數據 pandas 讀取excel數據 pandas 寫入excel數據 在使用pandas之前,需要安裝pandas模塊, 老方法: 安裝完成后,就可以直接使用了, 上代碼 最后執行完成, 使用id做索引,結果長這樣: 使用pandas默認索引,結果是醬樣子的: 所以,要使用pandas默認索引還是 自己創建索引,看各個的喜歡~~ pan...
pandas處理Excel數據
我們在日常工作中,經常會碰到處理Excel表中數據的情況,例如學校的教師需要統計學生的成績或者學生信息的管理。如果使用人工的方式進行修改,數據量很大的時候處理起來速度會很慢,還容易出現錯行等錯誤。此時,如果我們使用pandas進行數據的處理,速度會很快且不易出錯。 接下來就以一個簡單的例子來說明。 需求 學校教師手中有兩張學生表,但是只有一張表中有學生的電話信息(圖中手機號為隨機生成的) 需要將此...
freemarker + ItextRender 根據模板生成PDF文件
1. 制作模板 2. 獲取模板,并將所獲取的數據加載生成html文件 2. 生成PDF文件 其中由兩個地方需要注意,都是關于獲取文件路徑的問題,由于項目部署的時候是打包成jar包形式,所以在開發過程中時直接安照傳統的獲取方法沒有一點文件,但是當打包后部署,總是出錯。于是參考網上文章,先將文件讀出來到項目的臨時目錄下,然后再按正常方式加載該臨時文件; 還有一個問題至今沒有解決,就是關于生成PDF文件...
猜你喜歡
電腦空間不夠了?教你一個小秒招快速清理 Docker 占用的磁盤空間!
Docker 很占用空間,每當我們運行容器、拉取鏡像、部署應用、構建自己的鏡像時,我們的磁盤空間會被大量占用。 如果你也被這個問題所困擾,咱們就一起看一下 Docker 是如何使用磁盤空間的,以及如何回收。 docker 占用的空間可以通過下面的命令查看: TYPE 列出了docker 使用磁盤的 4 種類型: Images:所有鏡像占用的空間,包括拉取下來的鏡像,和本地構建的。 Con...
requests實現全自動PPT模板
http://www.1ppt.com/moban/ 可以免費的下載PPT模板,當然如果要人工一個個下,還是挺麻煩的,我們可以利用requests輕松下載 訪問這個主頁,我們可以看到下面的樣式 點每一個PPT模板的圖片,我們可以進入到詳細的信息頁面,翻到下面,我們可以看到對應的下載地址 點擊這個下載的按鈕,我們便可以下載對應的PPT壓縮包 那我們就開始做吧 首先,查看網頁的源代碼,我們可以看到每一...
Linux C系統編程-線程互斥鎖(四)
互斥鎖 互斥鎖也是屬于線程之間處理同步互斥方式,有上鎖/解鎖兩種狀態。 互斥鎖函數接口 1)初始化互斥鎖 pthread_mutex_init() man 3 pthread_mutex_init (找不到的情況下首先 sudo apt-get install glibc-doc sudo apt-get install manpages-posix-dev) 動態初始化 int pthread_...
統計學習方法 - 樸素貝葉斯
引入問題:一機器在良好狀態生產合格產品幾率是 90%,在故障狀態生產合格產品幾率是 30%,機器良好的概率是 75%。若一日第一件產品是合格品,那么此日機器良好的概率是多少。 貝葉斯模型 生成模型與判別模型 判別模型,即要判斷這個東西到底是哪一類,也就是要求y,那就用給定的x去預測。 生成模型,是要生成一個模型,那就是誰根據什么生成了模型,誰就是類別y,根據的內容就是x 以上述例子,判斷一個生產出...