• <noscript id="e0iig"><kbd id="e0iig"></kbd></noscript>
  • <td id="e0iig"></td>
  • <option id="e0iig"></option>
  • <noscript id="e0iig"><source id="e0iig"></source></noscript>
  • MongoDB系列--01、MongoDB入門

    標簽: MongoDB  數據庫  mongodb  nosql

    MongoDB理論基礎

    介紹

    MongoDB官網:https://www.mongodb.com/

    MongoDB 是一個基于【分布式文件存儲】的數據庫,它屬于NoSQL數據庫。是最像關系型數據庫的一個NoSQL數據庫

    MongoDB存儲數據是key-value結構的BSON(二進制json)文檔

    概念

    SQL術語/概念MongoDB術語/概念解釋/說明
    databasedatabase數據庫
    tablecollection數據庫表/集合
    rowdocument數據記錄行/文檔
    columnfield數據字段/域
    indexindex索引
    table joins表連接,MongoDB不支持
    primary keyprimary key主鍵,MongoDB自動將_id字段設置為主鍵

    通過下圖實例,我們也可以更直觀的了解Mongo中的一些概念:

    img

    數據庫(database)

    一個mongodb中可以建立多個數據庫。
    MongoDB的默認數據庫為db,該數據庫存儲在data目錄中(安裝時,可以默認或指定)。
    MongoDB的單個實例可以容納多個獨立的數據庫,每一個都有自己的集合和權限,不同的數據庫也放置在不同的文件中。

    數據庫命名規范

    • 不能是空字符串("")
    • 不得含有’ '(空格)、.、$、/、\和\0 (空字符)
    • 應全部小寫
    • 最多64字節

    集合(collection)

    集合就是 MongoDB 文檔組,類似于關系數據庫中的表格。

    集合存在于數據庫中,沒有固定的機構;比如我們可以向集合中插入不同數據結構的文檔

    {"name":"christy"}
    {"name":"christy","age":"18"}
    {"name":"christy","age":"18","desc":"shuai"}
    

    一旦有文檔插入,集合就會被創建

    一個collection(集合)中的所有field(域)是collection(集合)中所有document(文檔)中包含的field(域)的并集

    集合命名規范

    • 集合名不能是空字符串""

    • 集合名不能含有\0字符(空字符),這個字符表示集合名的結尾

    • 集合名不能以"system."開頭,這是為系統集合保留的前綴

    • 用戶創建的集合名字不能含有保留字符。有些驅動程序的確支持在集合名里面包含,這是因為某些系統生成的集合中包含該字符。除非你要訪問這種系統創建的集合,否則千萬不要在名字里出現$

    capped collections

    Capped collections就是固定大小的collection。與標準的collection不同,你必須要顯式的創建一個capped collection,指定一個 collection 的大小,單位是字節。它的存儲空間值是提前分配的。
    創建一個capped collection

    db.createCollection("mycollection",{capped:true, szie:99999})
    
    • 在 capped collection 中,你能添加新的對象
    • 能進行更新,然而,對象不會增加存儲空間。如果增加,更新就會失敗
    • 使用 Capped Collection 不能刪除一個文檔,但可以使用 drop() 方法刪除 collection 所有的行。
      刪除之后,你必須顯式的重新創建這個 collection
    • 在32bit機器中,capped collection 最大存儲為 1e9( 1X10的9次方)個字節。

    文檔(document)

    文檔是一組鍵值(key-value)對(即 BSON)。MongoDB 的文檔不需要設置相同的字段,并且相同的字段并不需要相同的數據類型

    對于文檔,需要注意

    • 文檔中的鍵/值對是有序的
    • 文檔中的值不僅可以是在雙引號里面的字符串,還可以是其他幾種數據類型(甚至可以是整個嵌入的文檔)。
    • MongoDB區分類型和大小寫
    • MongoDB的文檔不能有重復的鍵
    • 文檔的鍵是字符串。除了少數例外情況,鍵可以使用任意UTF-8字符

    文檔鍵命名規范

    • 鍵不能含有\0 (空字符)。這個字符用來表示鍵的結尾
    • .和$有特別的意義,只有在特定環境下才能使用
    • 以下劃線"_"開頭的鍵是保留的(不是嚴格要求的)

    元數據

    MongoDB數據庫中名字空間 .system.* 是包含多種系統信息的特殊集合(Collection)

    集合命名空間描述
    dbname.system.namespaces列出所有名字空間
    dbname.system.indexes列出所有索引
    dbname.system.profile列出數據庫概要(profile)信息
    dbname.system.users列出所有可訪問數據庫的用戶
    dbname.system.sources包含復制對端(slave)的服務器信息和狀態

    對于修改系統集合中的對象有如下限制

    • 在{{system.indexes}}插入數據,可以創建索引。但除此之外該表信息是不可變的(特殊的drop index命令將自動更新相關信息)
    • {{system.users}}是可修改的
    • {{system.profile}}是可刪除的

    數據類型

    MongoDB中常用的數據類型

    數據類型說明解釋舉例
    String字符串UTF-8編碼的字符串才是合法的{“name”:“Christy”}
    Integer整型數值隨服務器不同(32|64位){“age”:18}
    Boolean布爾值存儲布爾值:真|假{“falg”:true}
    Double浮點數存儲浮點值{“π”:3.14}
    ObjectId對象Id生成文檔的id{“_id”:ObjectId(“123456”)}
    Array數組將數組|列表|多個值存儲到一個鍵{“value”:[“1”,“2”]}
    Timestamp時間戳從紀元開始的毫秒數
    Object內嵌文檔可以作為文檔中某個key的value{“doc”:{“name”:“Christy”}}
    Null空值表示空值或者未定義的對象{“value”:null}
    Date日期用Unix日期格式來存儲當前日期或時間{“date”:new Date()}
    Regular正則表達式文檔中的正則表達式遵循js語法
    Code代碼可以包含js代碼{“js”:function(){}}
    File文件二進制轉碼(Base64)后存儲(<16M) GridFS(>16M)GridFS 用兩個集合來存儲一個文件:fs.files與fs.chunks

    下面說明下幾種重要的數據類型。

    ObjectId

    ObjectId 類似唯一主鍵,可以很快的去生成和排序,包含 12 bytes,含義是:

    • 前 4 個字節表示創建 unix 時間戳,格林尼治時間 UTC 時間,比北京時間晚了 8 個小時
    • 接下來的 3 個字節是機器標識碼
    • 緊接的兩個字節由進程 id 組成 PID
    • 最后三個字節是隨機數

    img

    MongoDB 中存儲的文檔必須有一個 _id 鍵。這個鍵的值可以是任何類型的,默認是個 ObjectId 對象

    由于 ObjectId 中保存了創建的時間戳,所以你不需要為你的文檔保存時間戳字段,你可以通過 getTimestamp 函數來獲取文檔的創建時間:

    > var newObject = ObjectId()
    > newObject.getTimestamp()
    ISODate("2017-11-25T07:21:10Z")
    

    ObjectId 轉為字符串

    > newObject.str
    5a1919e63df83ce79df8b38f
    

    字符串

    BSON 字符串都是 UTF-8 編碼。

    時間戳

    BSON 有一個特殊的時間戳類型用于 MongoDB 內部使用,與普通的 日期 類型不相關。 時間戳值是一個 64 位的值。其中:

    • 前32位是一個 time_t 值(與Unix新紀元相差的秒數)
    • 后32位是在某秒中操作的一個遞增的序數

    在單個 mongod 實例中,時間戳值通常是唯一的。

    在復制集中, oplog 有一個 ts 字段。這個字段中的值使用BSON時間戳表示了操作時間。

    BSON 時間戳類型主要用于 MongoDB 內部使用。在大多數情況下的應用開發中,你可以使用 BSON 日期類型。

    日期

    表示當前距離 Unix新紀元(1970年1月1日)的毫秒數。日期類型是有符號的, 負數表示 1970 年之前的日期。

    > var mydate1 = new Date()     //格林尼治時間
    > mydate1
    ISODate("2018-03-04T14:58:51.233Z")
    > typeof mydate1
    object
    > var mydate2 = ISODate() //格林尼治時間
    > mydate2
    ISODate("2018-03-04T15:00:45.479Z")
    > typeof mydate2
    object
    

    這樣創建的時間是日期類型,可以使用 JS 中的 Date 類型的方法。

    返回一個時間類型的字符串:

    > var mydate1str = mydate1.toString()
    > mydate1str
    Sun Mar 04 2018 14:58:51 GMT+0000 (UTC) 
    > typeof mydate1str
    string
    

    或者

    > Date()
    Sun Mar 04 2018 15:02:59 GMT+0000 (UTC)   
    

    MongoDB的應用場景

    適用場景

    更高的寫入負載

    默認情況下,MongoDB更側重高數據寫入性能,而非事務安全,MongoDB很適合業務系統中有大量“低價值”數據的場景。但是應當避免在高事務安全性的系統中使用MongoDB,除非能從架構設計上保證事務安全

    高可用性

    MongoDB的副本集(Master-Slave)配置非常簡潔方便,此外,MongoDB可以快速響應的處理單節點故障,自動、安全的完成故障轉移。這些特性使得MongoDB能在一個相對不穩定(如云主機)的環境中,保持高可用性

    數據量很大或者未來會變得很大

    依賴數據庫(MySQL)自身的特性,完成數據的擴展是較困難的事,在MySQL中,當一個單表達到5-10GB時會出現明顯的性能降級,此時需要通過數據的水平和垂直拆分、庫的拆分完成擴展,使用MySQL通常需要借助驅動層或代理層完成這類需求。而MongoDB內建了多種數據分片的特性,可以很好的適應大數據量的需求

    基于位置的數據查詢

    MongoDB支持二維空間索引,因此可以快速及精確的從指定位置獲取數據

    表結構不明確,且數據在不斷變大

    在一些傳統關系型數據庫中,增加一個字段會鎖住整個數據庫/表,或者在執行一個重負載的請求時會明顯造成其它請求的性能降級。通常發生在數據表大于1G的時候(當大于1TB時更甚)。 但MongoDB是文檔型數據庫,為非結構貨的文檔增加一個新字段是很快速的操作,并且不會影響到已有數據。另外一個好處當業務數據發生變化時,是將不在需要由DBA修改表結構

    沒有DBA支持

    如果沒有專職的DBA,并且準備不使用標準的關系型思想(結構化、連接等)來處理數據,那么MongoDB將會是你的首選。MongoDB對于對像數據的存儲非常方便,類可以直接序列化成JSON存儲到MongoDB中。 但是需要先了解一些最佳實踐,避免當數據變大后,由于文檔設計問題而造成的性能缺陷

    不適用場景

    在某些場景下,MongoDB作為一個非關系型數據庫有其局限性。MongoDB不支持事務操作,所以需要用到事務的應用建議不用MongoDB,另外MongoDB目前不支持join操作,需要復雜查詢的應用也不建議使用MongoDB

    版權聲明:本文為bbxylqf126com原創文章,遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處鏈接和本聲明。
    本文鏈接:https://blog.csdn.net/bbxylqf126com/article/details/109373098

    智能推薦

    MongoDB 入門

    學習自菜鳥教程 需要注意的是: 文檔中的鍵/值對是有序的。 文檔中的值不僅可以是在雙引號里面的字符串,還可以是其他幾種數據-類型(甚至可以是整個嵌入的文檔)。 MongoDB區分類型和大小寫。 MongoDB的文檔不能有重復的鍵。 文檔的鍵是字符串。除了少數例外情況,鍵可以使用任意UTF-8字符。 MongoDB 的條件語句查詢 Java 連接MongoDB...

    mongodb入門

    基礎概念 MongoDB中是通過數據庫、集合、文檔來管理數據庫的 傳統數據庫和MongoDB數據庫對比 1、一個mongodb實例可以創建多個數據庫 2、一個數據庫可以創建多個集合 3、一個集合可以包括多個文檔。 連接MongoDB 1、命令格式 2、使用mongodb自帶的javascript shell(mongo.exe)連接 cmd狀態執行mongo.exe: 集合 (表) 創建集合 op...

    HTML中常用操作關于:頁面跳轉,空格

    1.頁面跳轉 2.空格的代替符...

    freemarker + ItextRender 根據模板生成PDF文件

    1. 制作模板 2. 獲取模板,并將所獲取的數據加載生成html文件 2. 生成PDF文件 其中由兩個地方需要注意,都是關于獲取文件路徑的問題,由于項目部署的時候是打包成jar包形式,所以在開發過程中時直接安照傳統的獲取方法沒有一點文件,但是當打包后部署,總是出錯。于是參考網上文章,先將文件讀出來到項目的臨時目錄下,然后再按正常方式加載該臨時文件; 還有一個問題至今沒有解決,就是關于生成PDF文件...

    電腦空間不夠了?教你一個小秒招快速清理 Docker 占用的磁盤空間!

    Docker 很占用空間,每當我們運行容器、拉取鏡像、部署應用、構建自己的鏡像時,我們的磁盤空間會被大量占用。 如果你也被這個問題所困擾,咱們就一起看一下 Docker 是如何使用磁盤空間的,以及如何回收。 docker 占用的空間可以通過下面的命令查看: TYPE 列出了docker 使用磁盤的 4 種類型: Images:所有鏡像占用的空間,包括拉取下來的鏡像,和本地構建的。 Con...

    猜你喜歡

    requests實現全自動PPT模板

    http://www.1ppt.com/moban/ 可以免費的下載PPT模板,當然如果要人工一個個下,還是挺麻煩的,我們可以利用requests輕松下載 訪問這個主頁,我們可以看到下面的樣式 點每一個PPT模板的圖片,我們可以進入到詳細的信息頁面,翻到下面,我們可以看到對應的下載地址 點擊這個下載的按鈕,我們便可以下載對應的PPT壓縮包 那我們就開始做吧 首先,查看網頁的源代碼,我們可以看到每一...

    Linux C系統編程-線程互斥鎖(四)

    互斥鎖 互斥鎖也是屬于線程之間處理同步互斥方式,有上鎖/解鎖兩種狀態。 互斥鎖函數接口 1)初始化互斥鎖 pthread_mutex_init() man 3 pthread_mutex_init (找不到的情況下首先 sudo apt-get install glibc-doc sudo apt-get install manpages-posix-dev) 動態初始化 int pthread_...

    統計學習方法 - 樸素貝葉斯

    引入問題:一機器在良好狀態生產合格產品幾率是 90%,在故障狀態生產合格產品幾率是 30%,機器良好的概率是 75%。若一日第一件產品是合格品,那么此日機器良好的概率是多少。 貝葉斯模型 生成模型與判別模型 判別模型,即要判斷這個東西到底是哪一類,也就是要求y,那就用給定的x去預測。 生成模型,是要生成一個模型,那就是誰根據什么生成了模型,誰就是類別y,根據的內容就是x 以上述例子,判斷一個生產出...

    styled-components —— React 中的 CSS 最佳實踐

    https://zhuanlan.zhihu.com/p/29344146 Styled-components 是目前 React 樣式方案中最受關注的一種,它既具備了 css-in-js 的模塊化與參數化優點,又完全使用CSS的書寫習慣,不會引起額外的學習成本。本文是 styled-components 作者之一 Max Stoiber 所寫,首先總結了前端組件化樣式中的最佳實踐原則,然后在此基...

    精品国产乱码久久久久久蜜桃不卡