• <noscript id="e0iig"><kbd id="e0iig"></kbd></noscript>
  • <td id="e0iig"></td>
  • <option id="e0iig"></option>
  • <noscript id="e0iig"><source id="e0iig"></source></noscript>
  • Pandas 讀寫excel

    標簽: Pandas 讀寫excel  Pandas

    Pandas 讀寫excel,除了CSV文件,使用Excel工作表存放列表形式的數據也很常見,Pandas定義了兩個API函數來專門處理Excel文件:read_excel()to_excel()read_excel()函數能夠讀取Excel 2003(.xls)和Excel 2007(.xlsx)兩個類型的文件,該函數之所以能夠讀取Excel,是因為它整合了xlrd模塊。

    首先打開一個Excel文件,在sheet1和sheet2中輸入數據,然后將文件保存為data.xlsx
    在這里插入圖片描述
    在這里插入圖片描述

    讀取Excel文件

    要讀取excel文件中的數據,并將其轉換為DataFrame對象,只需要使用read_excel()函數即可,如下所示:

    import pandas as pd
    
    frame = pd.read_excel("data.xlsx")
    print(frame)
    

    輸出結果如下:

       white  red  green  black
    a     12   23     17     18
    b     22   16     19     18
    c     14   23     22     21
    

    如上所見,讀取excel時,默認返回的DataFrame對象包含第一個工作表中的數據。若要讀取第二個工作表中的數據,需要用第二個參數指定工作表的名稱或工作表的序號或索引,如下所示:

    import pandas as pd
    
    frame = pd.read_excel("data.xlsx",'Sheet2')
    print(frame)
    
    

    輸出結果如下:

       yellow  purple  blue  orange
    A      11      16    44      22
    B      20      22    23      44
    C      30      31    37      32
    

    也可以如下方式讀取數據:

    import pandas as pd
    
    frame = pd.read_excel("data.xlsx",1)
    print(frame)
    

    輸出結果如下:

       yellow  purple  blue  orange
    A      11      16    44      22
    B      20      22    23      44
    C      30      31    37      32
    

    寫入Excel文件

    上述操作也適用于Excel寫操作,將DataFrame對象轉換為Excel,如下所示:

    import pandas as pd
    import numpy as np
    
    frame = pd.DataFrame(np.random.random((4,4)),
                         index=['exp1','exp2','exp3','exp4'],
                         columns=['jan2015','Fab2015','Mar2015','Apr2005'])
    print(frame)
    frame.to_excel("data2.xlsx")
    

    輸出結果如下:

           jan2015   Fab2015   Mar2015   Apr2005
    exp1  0.985263  0.963805  0.502845  0.035461
    exp2  0.685198  0.362865  0.737473  0.277377
    exp3  0.496066  0.367708  0.828998  0.833133
    exp4  0.337033  0.391268  0.421885  0.202747
    

    工作目錄中會生成一個包含數據的新Excel文件,存放數據如下所示:
    在這里插入圖片描述

    操作Excel行列

    1. 讀取指定的單行,數據會存在列表里面
    import pandas as pd
    
    df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
    data=df.ix[0].values #0表示第一行 這里讀取數據并不包含表頭,要注意哦!
    print(data)
    

    輸出結果如下所示:

    [12 23 17 18]
    
    1. 讀取指定的多行,數據會存在嵌套的列表里面
    import pandas as pd
    
    df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
    data=df.ix[[1,2]].values #讀取指定多行的話,就要在ix[]里面嵌套列表指定行數
    print(data)
    

    輸出結果如下所示:

    [[22 16 19 18]
     [14 23 22 21]]
    
    1. 讀取指定的行列
    import pandas as pd
    
    df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
    data=df.ix[1,2] #讀取第一行第二列的值,這里不需要嵌套列表
    print(data)
    

    輸出結果如下所示:

    19
    
    1. 讀取指定的多行多列值
    import pandas as pd
    
    df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
    data=df.ix[[1,2],['red','green']].values#讀取第一行第二行的title以及data列的值,這里需要嵌套列表
    print(data)
    

    輸出結果如下所示:

    [[16 19]
     [23 22]]
    
    1. 獲取所有行的指定列
    import pandas as pd
    
    df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
    data=df.ix[:,['red','green']].values#讀取第一行第二行的title以及data列的值,這里需要嵌套列表
    print(data)
    

    輸出結果如下所示:

    [[23 17]
     [16 19]
     [23 22]]
    
    1. 獲取行號并打印輸出
    import pandas as pd
    
    df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
    print(df.index.values)
    

    輸出結果如下所示:

    ['a' 'b' 'c']
    
    1. 獲取列名并打印輸出
    import pandas as pd
    
    df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
    print(df.columns.values)
    

    輸出結果如下所示:

    ['white' 'red' 'green' 'black']
    
    1. 獲取指定行數的值
    import pandas as pd
    
    df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
    print(df.sample(3).values)#這個方法類似于head()方法以及df.values方法
    

    輸出結果如下所示:

    [[12 23 17 18]
     [22 16 19 18]
     [14 23 22 21]]
    
    1. 獲取指定列的值
    import pandas as pd
    
    df=pd.read_excel('data.xlsx') #這個會直接默認讀取到這個Excel的第一個表單
    print(df['white'].values)
    

    輸出結果如下所示:

    [12 22 14]
    

    極客教程相關文章推薦,歡迎閱讀!
    Pandas 讀取txt
    Pandas 讀寫sqlite數據庫
    Pandas 讀寫csv

    版權聲明:本文為xia1984920原創文章,遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處鏈接和本聲明。
    本文鏈接:https://blog.csdn.net/xia1984920/article/details/103093425

    智能推薦

    Python文件讀寫 、 csv模塊、pandas操作文件、json模塊、xlrd模塊--操作Excel

      python文件讀寫: 讀文件: 文件內容如右圖: file.read()方法返回的是整個文件的內容,type是str類型 file.readline()方法返回的是文件一行的內容(首行),type也是str類型 file.readlines()返回的是list類型, 并且文件的每一行是list中元素,每行最后都有一個'\n'換行符。list類型可遍歷(Iterator) 逐行讀取 ...

    Python3,Pandas 5行代碼實現對excel 讀寫操作

    Pandas 讀寫excel pandas 寫入excel數據 pandas 讀取excel數據 pandas 寫入excel數據 在使用pandas之前,需要安裝pandas模塊, 老方法: 安裝完成后,就可以直接使用了, 上代碼 最后執行完成, 使用id做索引,結果長這樣: 使用pandas默認索引,結果是醬樣子的: 所以,要使用pandas默認索引還是 自己創建索引,看各個的喜歡~~ pan...

    pandas處理Excel數據

    我們在日常工作中,經常會碰到處理Excel表中數據的情況,例如學校的教師需要統計學生的成績或者學生信息的管理。如果使用人工的方式進行修改,數據量很大的時候處理起來速度會很慢,還容易出現錯行等錯誤。此時,如果我們使用pandas進行數據的處理,速度會很快且不易出錯。 接下來就以一個簡單的例子來說明。 需求 學校教師手中有兩張學生表,但是只有一張表中有學生的電話信息(圖中手機號為隨機生成的) 需要將此...

    HTML中常用操作關于:頁面跳轉,空格

    1.頁面跳轉 2.空格的代替符...

    freemarker + ItextRender 根據模板生成PDF文件

    1. 制作模板 2. 獲取模板,并將所獲取的數據加載生成html文件 2. 生成PDF文件 其中由兩個地方需要注意,都是關于獲取文件路徑的問題,由于項目部署的時候是打包成jar包形式,所以在開發過程中時直接安照傳統的獲取方法沒有一點文件,但是當打包后部署,總是出錯。于是參考網上文章,先將文件讀出來到項目的臨時目錄下,然后再按正常方式加載該臨時文件; 還有一個問題至今沒有解決,就是關于生成PDF文件...

    猜你喜歡

    電腦空間不夠了?教你一個小秒招快速清理 Docker 占用的磁盤空間!

    Docker 很占用空間,每當我們運行容器、拉取鏡像、部署應用、構建自己的鏡像時,我們的磁盤空間會被大量占用。 如果你也被這個問題所困擾,咱們就一起看一下 Docker 是如何使用磁盤空間的,以及如何回收。 docker 占用的空間可以通過下面的命令查看: TYPE 列出了docker 使用磁盤的 4 種類型: Images:所有鏡像占用的空間,包括拉取下來的鏡像,和本地構建的。 Con...

    requests實現全自動PPT模板

    http://www.1ppt.com/moban/ 可以免費的下載PPT模板,當然如果要人工一個個下,還是挺麻煩的,我們可以利用requests輕松下載 訪問這個主頁,我們可以看到下面的樣式 點每一個PPT模板的圖片,我們可以進入到詳細的信息頁面,翻到下面,我們可以看到對應的下載地址 點擊這個下載的按鈕,我們便可以下載對應的PPT壓縮包 那我們就開始做吧 首先,查看網頁的源代碼,我們可以看到每一...

    Linux C系統編程-線程互斥鎖(四)

    互斥鎖 互斥鎖也是屬于線程之間處理同步互斥方式,有上鎖/解鎖兩種狀態。 互斥鎖函數接口 1)初始化互斥鎖 pthread_mutex_init() man 3 pthread_mutex_init (找不到的情況下首先 sudo apt-get install glibc-doc sudo apt-get install manpages-posix-dev) 動態初始化 int pthread_...

    統計學習方法 - 樸素貝葉斯

    引入問題:一機器在良好狀態生產合格產品幾率是 90%,在故障狀態生產合格產品幾率是 30%,機器良好的概率是 75%。若一日第一件產品是合格品,那么此日機器良好的概率是多少。 貝葉斯模型 生成模型與判別模型 判別模型,即要判斷這個東西到底是哪一類,也就是要求y,那就用給定的x去預測。 生成模型,是要生成一個模型,那就是誰根據什么生成了模型,誰就是類別y,根據的內容就是x 以上述例子,判斷一個生產出...

    精品国产乱码久久久久久蜜桃不卡