Sqlite3開發你一定要知道的大數據插入優化策略
標簽: 數據庫優化策略 sql sqlite ios objective-c 面試
Sqlite3
Sqlite3常用在移動端或者嵌入式設備開發中,經常擔任數據持久化存儲的作用,區別于MySQL,SQLServer等一些主流的數據庫,Sqlite更顯輕薄,運行速度更快,但是作為關系型數據庫,Sqlite數據庫和MySQL數據庫等都對插入查詢方式的不同而產生不同的效率,通過這篇博客,我們來側重分析對于大量數據插入的效率帶來的效率問題.(數據量達到千萬級或者億級別)
優化策略(默認采用user表)
name | age |
---|---|
TEXT | INTEGER |
我們先從插入語句入手逐步向數據庫優化進發。
- 優化策略一: 插入語句的書寫方式
(1)在測試時候,為了方便我們將下面這條插入SQL語句采用for循環方式進行插入到數據庫
INSERT INTO user(name,age) VALUES ('CreaterOS','21');
for(NSUInteger i = 0; i < 10000000; i++){
//省略執行語句,直接寫插入語句,代表插入過程
INSERT INTO user(name,age) VALUES ('CreaterOS','21');
}
這樣的插入方式,相當于是逐條寫入數據庫中,在Xcode根據內存和時間測試,我們來觀察一下,這樣的效率會有多低。
我們觀察到耗時兩分鐘左右都還沒有完全插入完成,并且內存會逐漸上升,根據實際測試,當達到11min左右,內存會增長到5GB~15GB不等,根據機器和中間做的處理不同會有不同的成功。不過,出現這種問題,我們能分析趨勢,插入時間長,內存逐漸增加,直到內存溢出。
(2) 采用一條語句多條插入操作
INSERT INTO user(name,age) VALUES ('CreaterOS','21'),('CreaterOS','21')...;
這里面的數據量是一條語句插入大概一萬六千條數據,為了快速營造一千六百萬條數據,這里面還是不合法的使用循環操作。
for(NSUInteger i = 0; i < 1000; i++){
INSERT INTO user(name,age) VALUES ('CreaterOS','21'),('CreaterOS','21')...;
}
及時這樣使用使用循環,效率也會提高很多,假設使用一條語句直接插入一千六百萬數據的效率可想而知,是最快的。
我們來看一下Xcode在上面這樣插入的表現情況:
我們用計算器測算一下耗時是0.06毫秒,假設一條語句插入一千六百萬數據,那樣的效率會是這個的好幾十倍。
根據上面兩組測試,我們發現了第一個優化策略。
逐行插入的效率遠遠低于多行插入
開發中,我們盡量多些多行插入,避免出現逐行插入的操作。
2. 優化策略二: 插入數據庫大小導致內存溢出
上面我們已經插入了一千六百萬的數據量,觀察一下,此時的數據庫大小。
一千六百萬條數據一個表,導致內存大小為704.7MB。
看到這里,我們考慮一下Sqlite3操作數據庫插入操作,雖然效率會比文件更高,但是,還是從硬盤上不斷的讀寫操作,對大文件持續讀寫,會增加內存的增加,怎么解決這個問題,是我們需要關心優化的問題。
小編測試,加入緩存池可以降低內存消耗。插入操作,到底是如何執行的,我們來看一下這個文件,一切就云開霧散了。
這是在插入過程中,數據被鎖住(locked)后,會不斷生成journal文件,通過這個文件不斷寫入數據庫中,這樣不間斷的寫入讀取,就增加了內存消耗。
3. 優化策略三: 修改數據庫配置
FULL,NORMAL,OFF對應數據庫三種操作。
PRAGMA synchronous = FULL;
PRAGMA synchronous = NORMAL;
PRAGMA synchronous = OFF;
這三個語句,默認Sqlite使用FULL方式,這個是最安全的操作,也是最耗時的操作。
假設不為回滾日志考慮,同步鎖我們可以關閉或者降低安全等級。在前面博主寫的文章中分析了提升效率。
NORMAL | OFF |
---|---|
50倍+ | 500倍+ |
可是,小編做了測試,時間上相差不多,基本上都是0.06毫秒,出現這樣的問題不排除數據量過小,或者循環導致,當我們把數據量增加到四億或者十億的時候,這個差距就更加明顯了。
4. 優化策略四: 開起事務(顯示事務)
BEGAIN
COMMIT
ROLLBACK
上面三種情況都是在,開起事務中進行操作的。事務可以保證插入數據的安全。Sqlite3中每一條插入語句就是一個事務(默認)。假設我們不顯示調用,那么事務鎖就會不斷的開起和關閉,這對于資源消耗是毀滅性的打擊。
顯示調用事務可以有效的加快運行效率。
BEGAIN
INSERT INTO user(name,age) VALUES ('CreaterOS','21'),('CreaterOS','21')...;
COMMIT
ROLLBACK
通過這樣的方式,可以取消Sqlite3默認的事務鎖。從而提高效率。
5.優化策略五: 修改Sqlite WAL
改變 checkpoint。我們在把 checkpoint 改成了10000(默認是1000),checkpoint = 1000 是
日志文件 1M 的時候回寫到數據庫,改成 10000 就變成了 日志文件 10M 時回寫數據到數據庫。 demo測試性能,有2倍+的提升
PRAGMA checkpoint = 10000;
這個方法也是很有效的一種日志回寫策略。
6…優化策略六: PRAGMA修改cache_size
PRAGMA cache_size = 8000;
修改緩存大小來提高性能,具體情況可以根據不同業務邏輯,安全性考慮進行插入優化。
總結
通過上面六點我們已經進行了Sqlite3數據庫插入優化,并且每種優化策略是實際測試有效的,假設大家還有更好的優化策略,可以在評論區留言一起分析數據庫性能優化的那些事。
智能推薦
Linux C系統編程-線程互斥鎖(四)
互斥鎖 互斥鎖也是屬于線程之間處理同步互斥方式,有上鎖/解鎖兩種狀態。 互斥鎖函數接口 1)初始化互斥鎖 pthread_mutex_init() man 3 pthread_mutex_init (找不到的情況下首先 sudo apt-get install glibc-doc sudo apt-get install manpages-posix-dev) 動態初始化 int pthread_...
統計學習方法 - 樸素貝葉斯
引入問題:一機器在良好狀態生產合格產品幾率是 90%,在故障狀態生產合格產品幾率是 30%,機器良好的概率是 75%。若一日第一件產品是合格品,那么此日機器良好的概率是多少。 貝葉斯模型 生成模型與判別模型 判別模型,即要判斷這個東西到底是哪一類,也就是要求y,那就用給定的x去預測。 生成模型,是要生成一個模型,那就是誰根據什么生成了模型,誰就是類別y,根據的內容就是x 以上述例子,判斷一個生產出...
styled-components —— React 中的 CSS 最佳實踐
https://zhuanlan.zhihu.com/p/29344146 Styled-components 是目前 React 樣式方案中最受關注的一種,它既具備了 css-in-js 的模塊化與參數化優點,又完全使用CSS的書寫習慣,不會引起額外的學習成本。本文是 styled-components 作者之一 Max Stoiber 所寫,首先總結了前端組件化樣式中的最佳實踐原則,然后在此基...
猜你喜歡
19.vue中封裝echarts組件
19.vue中封裝echarts組件 1.效果圖 2.echarts組件 3.使用組件 按照組件格式整理好數據格式 傳入組件 home.vue 4.接口返回數據格式...
【一只蒟蒻的刷題歷程】【藍橋杯】歷屆試題 九宮重排 (八數碼問題:BFS+集合set)
資源限制 時間限制:1.0s 內存限制:256.0MB 問題描述 如下面第一個圖的九宮格中,放著 1~8 的數字卡片,還有一個格子空著。與空格子相鄰的格子中的卡片可以移動到空格中。經過若干次移動,可以形成第二個圖所示的局面。 我們把第一個圖的局面記為:12345678. 把第二個圖的局面記為:123.46758 顯然是按從上到下,從左到右的順序記錄數字,空格記為句點。 本題目的任務是已知九宮的初態...
dataV組件容器寬高發生變化后,組件不會自適應解決方法
項目中需要大屏幕數據展示,于是使用了dataV組件,但是使用是發現拖動瀏覽器邊框,dataV組件顯示異常,如圖: 于是查了官網,官網的解釋如下: 于是按照官網的意思編寫代碼: 于是可以自適應了...
CSS3干貨10:如何做一個板塊標題水平線左邊帶顏色效果
很多網站在設計欄目標題的時候,喜歡用下劃線分開欄目標題和內容部分。 而且線條左邊的部分往往還有顏色,且這個顏色跟標題的文字長短保持一致。效果如圖所示: 這種效果其實很簡單。 我這里給大家推薦兩種方式: 假定我們的標題部分 HTML 結構如下: 方式一:利用下邊框。灰色部分是 h1 的下邊框,藍色部分是 span 標簽的下邊框。 h1 的高度為 40px,span 也設置它的高度為 40px。這樣,...