Python基礎+數據科學入門(八)
標簽: python基礎(數據學科入門)
聲明:該博客參考深度之眼的視頻課程,如有侵權請聯系小編刪除博文,謝謝! 若總結有所失誤,還請見諒,并歡迎及時指出。
有益的探索
1.1 數據類型的底層實現
1.1.1 從奇怪的列表說起
- 錯綜復雜的復制
list_1 = [1, [22, 33, 44], (5, 6, 7), {"name": "Sarah"}] #數字類型 列表類型 元組 字典
淺拷貝
# list_3 = list_1 #錯誤
list_2 = list_1.copy() #或者list_1[:] \list(list_1) 均可實現淺拷貝
對拷貝前后的兩列表分別進行操作
list_2[1].append(55)
print("list_1:", list_1)
print("list_2:", list_2)
- 列表的底層實現
引用數組的概念
列表內的元素可以分散的存儲在內存中
列表存儲的,實際上是這些元素的地址!——地址的存儲在內存中是連續的
(1)新增元素
list_1.append(100)
list_2.append("n")
print("list_1:", list_1)
print("list_2:", list_2)
(2)修改元素
list_1[0] = 10
list_2[0] = 20
print("list_1:", list_1)
print("list_2:", list_2)
(3)對列表型元素進行操作
list_1[1].remove(44)
list_2[1] += [55, 66]
print("list_1:", list_1)
print("list_2:", list_2)
(4)對元組型元素進行操作
list_2[2] += (8, 9)
print("list_1:", list_1)
print("list_2:", list_2)
元組是不可變的!!
(5)對字典型元素進行操作
list_2[2] += (8, 9)
print("list_1:", list_1)
print("list_2:", list_2)
- 引入深拷貝
淺拷貝之后
針對不可變元素(數字、字符串、元組)的操作,都各自生效了
針對不可變元素(列表、集合)的操作,發生了一些混淆
深拷貝將所有層級的相關元素全部復制,完全分開,涇渭分明,避免上述問題
import copy
list_1 = [1, [22, 33, 44], (5, 6, 7), {"name": "Sarah"}] #數字類型 列表類型 元組 字典
list_2 = copy.deepcopy(list_1)
list_1[-1]["age"] = 18
list_2[1].append(55)
print("list_1:", list_1)
print("list_2:", list_2)
1.1.2 神秘的字典
- 快速的查找
列表
import time
ls_1 = list(range(1000000))
ls_2 = list(range(500))+[-10]*500
start = time.time()
count = 0
for n in ls_2:
if n in ls_1:
count += 1
end = time.time()
print("查找{}個元素,在ls_1列表中的有{}個,共{}秒".format(len(ls_2), count, round((end-start),2)))
字典
import time
d = {i:i for i in range(100000)}
ls_2 = list(range(500))+[-10]*500
start = time.time()
cunt = 0
for n in ls_2:
try:
d[n]
except:
pass
else:
count += 1
end = time.time()
print("查找{}個元素,在ls_1列表中的有{}個,共{}秒".format(len(ls_2), count, round((end-start),2)))
- 字典的底層實現
通過稀疏數組來實現值的存儲與訪問
字典的創建過程
第一步: 創建一個散列表(稀疏數組N>>n)
d = {}
通過hash()計算鍵的散列值
print(hash("python"))
print(hash(1024))
print(hash((1,2)))
d["age"] = 18
print(hash("age"))
第二步: 根據計算的散列值確定其在散列表中的位置
極個別時候,散列值會發生沖突,則內部有相應的解決沖突的辦法
第三步: 在該位置上存入值
鍵值對的訪問過程
d["age"]
- 1.計算要訪問的鍵的散列值
- 2.根據計算的散列值,通過一定的規則,確定其在散列表中的位置
- 3.讀取該位置上存儲的值:如果存在,則返回該值;如果不存在,則報錯KeyError
- 小結
(1)字典數據類型,通過空間換時間,實現了快速的數據查找
也就注定了字典的空間利用效率低下
(2)因為散列值對應位置的順序與鍵在字典中顯示的順序可能不同,因此表現出來字典是無序的
所以N>>n
1.1.3 緊湊的字符串
智能推薦
freemarker + ItextRender 根據模板生成PDF文件
1. 制作模板 2. 獲取模板,并將所獲取的數據加載生成html文件 2. 生成PDF文件 其中由兩個地方需要注意,都是關于獲取文件路徑的問題,由于項目部署的時候是打包成jar包形式,所以在開發過程中時直接安照傳統的獲取方法沒有一點文件,但是當打包后部署,總是出錯。于是參考網上文章,先將文件讀出來到項目的臨時目錄下,然后再按正常方式加載該臨時文件; 還有一個問題至今沒有解決,就是關于生成PDF文件...
電腦空間不夠了?教你一個小秒招快速清理 Docker 占用的磁盤空間!
Docker 很占用空間,每當我們運行容器、拉取鏡像、部署應用、構建自己的鏡像時,我們的磁盤空間會被大量占用。 如果你也被這個問題所困擾,咱們就一起看一下 Docker 是如何使用磁盤空間的,以及如何回收。 docker 占用的空間可以通過下面的命令查看: TYPE 列出了docker 使用磁盤的 4 種類型: Images:所有鏡像占用的空間,包括拉取下來的鏡像,和本地構建的。 Con...
requests實現全自動PPT模板
http://www.1ppt.com/moban/ 可以免費的下載PPT模板,當然如果要人工一個個下,還是挺麻煩的,我們可以利用requests輕松下載 訪問這個主頁,我們可以看到下面的樣式 點每一個PPT模板的圖片,我們可以進入到詳細的信息頁面,翻到下面,我們可以看到對應的下載地址 點擊這個下載的按鈕,我們便可以下載對應的PPT壓縮包 那我們就開始做吧 首先,查看網頁的源代碼,我們可以看到每一...
猜你喜歡
Linux C系統編程-線程互斥鎖(四)
互斥鎖 互斥鎖也是屬于線程之間處理同步互斥方式,有上鎖/解鎖兩種狀態。 互斥鎖函數接口 1)初始化互斥鎖 pthread_mutex_init() man 3 pthread_mutex_init (找不到的情況下首先 sudo apt-get install glibc-doc sudo apt-get install manpages-posix-dev) 動態初始化 int pthread_...
統計學習方法 - 樸素貝葉斯
引入問題:一機器在良好狀態生產合格產品幾率是 90%,在故障狀態生產合格產品幾率是 30%,機器良好的概率是 75%。若一日第一件產品是合格品,那么此日機器良好的概率是多少。 貝葉斯模型 生成模型與判別模型 判別模型,即要判斷這個東西到底是哪一類,也就是要求y,那就用給定的x去預測。 生成模型,是要生成一個模型,那就是誰根據什么生成了模型,誰就是類別y,根據的內容就是x 以上述例子,判斷一個生產出...
styled-components —— React 中的 CSS 最佳實踐
https://zhuanlan.zhihu.com/p/29344146 Styled-components 是目前 React 樣式方案中最受關注的一種,它既具備了 css-in-js 的模塊化與參數化優點,又完全使用CSS的書寫習慣,不會引起額外的學習成本。本文是 styled-components 作者之一 Max Stoiber 所寫,首先總結了前端組件化樣式中的最佳實踐原則,然后在此基...
19.vue中封裝echarts組件
19.vue中封裝echarts組件 1.效果圖 2.echarts組件 3.使用組件 按照組件格式整理好數據格式 傳入組件 home.vue 4.接口返回數據格式...