• <noscript id="e0iig"><kbd id="e0iig"></kbd></noscript>
  • <td id="e0iig"></td>
  • <option id="e0iig"></option>
  • <noscript id="e0iig"><source id="e0iig"></source></noscript>
  • Sqlite3開發你一定要知道的大數據插入優化策略

    標簽: 數據庫優化策略  sql  sqlite  ios  objective-c  面試

    Sqlite3

    Sqlite3常用在移動端或者嵌入式設備開發中,經常擔任數據持久化存儲的作用,區別于MySQL,SQLServer等一些主流的數據庫,Sqlite更顯輕薄,運行速度更快,但是作為關系型數據庫,Sqlite數據庫和MySQL數據庫等都對插入查詢方式的不同而產生不同的效率,通過這篇博客,我們來側重分析對于大量數據插入的效率帶來的效率問題.(數據量達到千萬級或者億級別)

    優化策略(默認采用user表)

    name age
    TEXT INTEGER

    我們先從插入語句入手逐步向數據庫優化進發。

    1. 優化策略一: 插入語句的書寫方式
      (1)在測試時候,為了方便我們將下面這條插入SQL語句采用for循環方式進行插入到數據庫
    INSERT INTO user(name,age) VALUES ('CreaterOS','21')
    for(NSUInteger i = 0; i < 10000000; i++){
    //省略執行語句,直接寫插入語句,代表插入過程
    	INSERT INTO user(name,age) VALUES ('CreaterOS','21')}
    

    這樣的插入方式,相當于是逐條寫入數據庫中,在Xcode根據內存和時間測試,我們來觀察一下,這樣的效率會有多低。
    逐行插入操作
    我們觀察到耗時兩分鐘左右都還沒有完全插入完成,并且內存會逐漸上升,根據實際測試,當達到11min左右,內存會增長到5GB~15GB不等,根據機器和中間做的處理不同會有不同的成功。不過,出現這種問題,我們能分析趨勢,插入時間長,內存逐漸增加,直到內存溢出。
    (2) 采用一條語句多條插入操作

    INSERT INTO user(name,age) VALUES ('CreaterOS','21'),('CreaterOS','21')...

    這里面的數據量是一條語句插入大概一萬六千條數據,為了快速營造一千六百萬條數據,這里面還是不合法的使用循環操作。

    for(NSUInteger i = 0; i < 1000; i++){
    	INSERT INTO user(name,age) VALUES ('CreaterOS','21'),('CreaterOS','21')...}
    

    及時這樣使用使用循環,效率也會提高很多,假設使用一條語句直接插入一千六百萬數據的效率可想而知,是最快的。
    我們來看一下Xcode在上面這樣插入的表現情況:
    多行插入操作
    我們用計算器測算一下耗時是0.06毫秒,假設一條語句插入一千六百萬數據,那樣的效率會是這個的好幾十倍。
    耗時
    根據上面兩組測試,我們發現了第一個優化策略。

    逐行插入的效率遠遠低于多行插入

    開發中,我們盡量多些多行插入,避免出現逐行插入的操作。
    2. 優化策略二: 插入數據庫大小導致內存溢出
    上面我們已經插入了一千六百萬的數據量,觀察一下,此時的數據庫大小。
    數據占用大小
    一千六百萬條數據一個表,導致內存大小為704.7MB。
    看到這里,我們考慮一下Sqlite3操作數據庫插入操作,雖然效率會比文件更高,但是,還是從硬盤上不斷的讀寫操作,對大文件持續讀寫,會增加內存的增加,怎么解決這個問題,是我們需要關心優化的問題。
    小編測試,加入緩存池可以降低內存消耗。插入操作,到底是如何執行的,我們來看一下這個文件,一切就云開霧散了。
    journal
    這是在插入過程中,數據被鎖住(locked)后,會不斷生成journal文件,通過這個文件不斷寫入數據庫中,這樣不間斷的寫入讀取,就增加了內存消耗。
    3. 優化策略三: 修改數據庫配置
    FULL,NORMAL,OFF對應數據庫三種操作。

    PRAGMA synchronous = FULL;
    PRAGMA synchronous = NORMAL;
    PRAGMA synchronous = OFF;
    

    這三個語句,默認Sqlite使用FULL方式,這個是最安全的操作,也是最耗時的操作。
    假設不為回滾日志考慮,同步鎖我們可以關閉或者降低安全等級。在前面博主寫的文章中分析了提升效率。

    NORMAL OFF
    50倍+ 500倍+

    可是,小編做了測試,時間上相差不多,基本上都是0.06毫秒,出現這樣的問題不排除數據量過小,或者循環導致,當我們把數據量增加到四億或者十億的時候,這個差距就更加明顯了。
    4. 優化策略四: 開起事務(顯示事務)

    BEGAIN
    COMMIT
    ROLLBACK
    

    上面三種情況都是在,開起事務中進行操作的。事務可以保證插入數據的安全。Sqlite3中每一條插入語句就是一個事務(默認)。假設我們不顯示調用,那么事務鎖就會不斷的開起和關閉,這對于資源消耗是毀滅性的打擊。
    顯示調用事務可以有效的加快運行效率。

    BEGAIN
    INSERT INTO user(name,age) VALUES ('CreaterOS','21'),('CreaterOS','21')...COMMIT
    ROLLBACK
    

    通過這樣的方式,可以取消Sqlite3默認的事務鎖。從而提高效率。
    5.優化策略五: 修改Sqlite WAL

    改變 checkpoint。我們在把 checkpoint 改成了10000(默認是1000),checkpoint = 1000 是
    日志文件 1M 的時候回寫到數據庫,改成 10000 就變成了 日志文件 10M 時回寫數據到數據庫。 demo測試性能,有2倍+的提升

    PRAGMA checkpoint = 10000

    這個方法也是很有效的一種日志回寫策略。
    6…優化策略六: PRAGMA修改cache_size

    PRAGMA cache_size = 8000

    修改緩存大小來提高性能,具體情況可以根據不同業務邏輯,安全性考慮進行插入優化。

    總結

    通過上面六點我們已經進行了Sqlite3數據庫插入優化,并且每種優化策略是實際測試有效的,假設大家還有更好的優化策略,可以在評論區留言一起分析數據庫性能優化的那些事。

    版權聲明:本文為weixin_39647415原創文章,遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處鏈接和本聲明。
    本文鏈接:https://blog.csdn.net/weixin_39647415/article/details/106727898

    智能推薦

    Linux C系統編程-線程互斥鎖(四)

    互斥鎖 互斥鎖也是屬于線程之間處理同步互斥方式,有上鎖/解鎖兩種狀態。 互斥鎖函數接口 1)初始化互斥鎖 pthread_mutex_init() man 3 pthread_mutex_init (找不到的情況下首先 sudo apt-get install glibc-doc sudo apt-get install manpages-posix-dev) 動態初始化 int pthread_...

    統計學習方法 - 樸素貝葉斯

    引入問題:一機器在良好狀態生產合格產品幾率是 90%,在故障狀態生產合格產品幾率是 30%,機器良好的概率是 75%。若一日第一件產品是合格品,那么此日機器良好的概率是多少。 貝葉斯模型 生成模型與判別模型 判別模型,即要判斷這個東西到底是哪一類,也就是要求y,那就用給定的x去預測。 生成模型,是要生成一個模型,那就是誰根據什么生成了模型,誰就是類別y,根據的內容就是x 以上述例子,判斷一個生產出...

    styled-components —— React 中的 CSS 最佳實踐

    https://zhuanlan.zhihu.com/p/29344146 Styled-components 是目前 React 樣式方案中最受關注的一種,它既具備了 css-in-js 的模塊化與參數化優點,又完全使用CSS的書寫習慣,不會引起額外的學習成本。本文是 styled-components 作者之一 Max Stoiber 所寫,首先總結了前端組件化樣式中的最佳實踐原則,然后在此基...

    基于TCP/IP的網絡聊天室用Java來實現

    基于TCP/IP的網絡聊天室實現 開發工具:eclipse 開發環境:jdk1.8 發送端 接收端 工具類 運行截圖...

    猜你喜歡

    19.vue中封裝echarts組件

    19.vue中封裝echarts組件 1.效果圖 2.echarts組件 3.使用組件 按照組件格式整理好數據格式 傳入組件 home.vue 4.接口返回數據格式...

    劍指Offer39-調整數組順序使奇數位于偶數前面

    一開始想著用冒泡排序的方法來做,但是bug還是很多,后來看了評論區答案,發現直接空間換時間是最簡單的,而且和快排的寫法是類似的。...

    【一只蒟蒻的刷題歷程】【藍橋杯】歷屆試題 九宮重排 (八數碼問題:BFS+集合set)

    資源限制 時間限制:1.0s 內存限制:256.0MB 問題描述 如下面第一個圖的九宮格中,放著 1~8 的數字卡片,還有一個格子空著。與空格子相鄰的格子中的卡片可以移動到空格中。經過若干次移動,可以形成第二個圖所示的局面。 我們把第一個圖的局面記為:12345678. 把第二個圖的局面記為:123.46758 顯然是按從上到下,從左到右的順序記錄數字,空格記為句點。 本題目的任務是已知九宮的初態...

    dataV組件容器寬高發生變化后,組件不會自適應解決方法

    項目中需要大屏幕數據展示,于是使用了dataV組件,但是使用是發現拖動瀏覽器邊框,dataV組件顯示異常,如圖: 于是查了官網,官網的解釋如下:   于是按照官網的意思編寫代碼: 于是可以自適應了...

    CSS3干貨10:如何做一個板塊標題水平線左邊帶顏色效果

    很多網站在設計欄目標題的時候,喜歡用下劃線分開欄目標題和內容部分。 而且線條左邊的部分往往還有顏色,且這個顏色跟標題的文字長短保持一致。效果如圖所示: 這種效果其實很簡單。 我這里給大家推薦兩種方式: 假定我們的標題部分 HTML 結構如下: 方式一:利用下邊框。灰色部分是 h1 的下邊框,藍色部分是 span 標簽的下邊框。 h1 的高度為 40px,span 也設置它的高度為 40px。這樣,...

    精品国产乱码久久久久久蜜桃不卡