教你如何利用MySQL学习MongoDB之数据存储结构
创始人
2024-07-29 19:20:44
0

在上文中,我们了解了教你如何利用MySQL学习MongoDB之安装篇,本文中我们继续我们的学习之旅,学习其数据存储结构。

1、MySQL的数据存储结构

MySQL的每个数据库都对应存放在一个与数据库同名的文件夹中,MySQL数据库文件包括MySQL所建数据库文件和MySQL所用存储引擎创建的数据库文件。

MySQL如果使用MyISAM存储引擎,数据库文件类型就包括.frm、.MYD、.MYI

MySQL如果使用InnoDB存储引擎,数据库文件类型就包括.frm、ibdata1、.ibd

(1)、数据库文件:

.frm文件:存储数据表的框架结构,MySQL数据库文件名与表名相同,每个表对应一个同名frm文件,与操作系统和存储引擎无关,即不管MySQL运行在何种操作系统上,使用何种存储引擎,都有这个文件。除了必有的.frm文件,根据MySQL所使用的存储引擎的不同(MySQL常用的两个存储引擎是MyISAM和InnoDB),存储引擎会创建各自不同的数据库文件。

(2)、MyISAM数据库表文件:

  1. .MYD文件:即MY Data,表数据文件
  2. .MYI文件:即MY Index,索引文件
  3. .log文件:日志文件

(3)、InnoDB采用表空间:

ibdata1、ibdata2:系统表空间MySQL数据库文件,存储InnoDB系统信息和用户数据库表数据和索引,被所有表共用;

.ibd文件:单表表空间文件,每个表使用一个表空间文件(file per table),用于存放用户数据库表数据和索引;

日志文件:ib_logfile1、ib_logfile2。

2、MongoDB的数据存储结构

MongoDB对国内用户来说比较新, 它就像是一个黑盒子,但是如果对于它内部的数据存储了解多一些的话,那么将会很快的理解和驾驭MongoDB,让它发挥它更大的作用。

MongoDB的默认数据目录是/data/db,它负责存储所有的MongoDB的数据文件。在MongoDB内部,每个数据库都包含一个.ns文件和一些数据文件,而且这些数据文件会随着数据量的增加而变得越来越多。所以如果系统中有一个叫做foo的数据库,那么构成foo这个数据库的文件就会由foo.ns,foo.0,foo.1,foo.2 等等组成,具体如下:

  1. [root@localhost db]# ll /data/db/  
  2. 总计 196844  
  3. -rw------- 1 root root 16777216 04-15 16:33 admin.0  
  4. -rw------- 1 root root 33554432 04-15 16:33 admin.1  
  5. -rw------- 1 root root 16777216 04-15 16:33 admin.ns  
  6. -rw------- 1 root root 16777216 04-21 17:30 foo.0  
  7. -rw------- 1 root root 33554432 04-21 17:30 foo.1  
  8. -rw------- 1 root root 67108864 04-21 17:30 foo.2  
  9. -rw------- 1 root root 16777216 04-21 17:30 foo.ns  
  10. -rwxr-xr-x 1 root root 6 04-21 17:16 mongod.lock  
  11. -rw------- 1 root root 16777216 04-15 16:30 test.0  
  12. -rw------- 1 root root 33554432 04-15 16:30 test.1  
  13. -rw------- 1 root root 16777216 04-15 16:30 test.ns  
  14. drwxr-xr-x 2 root root 4096 04-21 17:30 _tmp  
  15. [root@localhost db]# 

 

 

MongoDB内部有预分配表空间的机制,每个预分配的文件都用0进行填充,由于有了这个机制, MongoDB始终保持额外的空间和空余的数据文件,从而有效避免了由于数据暴增而带来的磁盘压力过大的问题。

由于表中数据量的增加,数据文件每新分配一次,它的大小都会是上一个数据文件大小的2倍,每个数据文件***2G。这样的机制有利于防止较小的数据库浪费过多的磁盘空间,同时又能保证较大的数据库有相应的预留空间使用。

数据库的每张表都对应一个命名空间,每个索引也有对应的命名空间。这些命名空间的元数据都集中在*.ns文件中。

在下图中,foo这个数据库包含3个文件用于存储表和索引数据,foo.2文件属于预分配的空文件。foo.0和foo.1这两个数据文件被分为了相应的盘区对应不同的名字空间。

 

上图显示了命名空间和盘区的关系。每个命名空间可以包含多个不同的盘区,这些盘区并不是连续的。与数据文件的增长相同,每一个命名空间对应的盘区大小的也是随着分配的次数不断增长的。这样做的目的是为了平衡命名空间浪费的空间与保持某一个命名空间中数据的连续性。上图中还有一个需要注意的命名空间:$freelist,这个命名空间用于记录不再使用的盘区(被删除的Collection或索引)。每当命名空间需要分配新的盘区的时候,都会先查看$freelist是否有大小合适的盘区可以使用。

【编辑推荐】

  1. Craigslist采用MongoDB替代MySQL
  2. MongoDB源码分析--Command体系架构
  3. Mongodb源码分析--内存文件映射(MMAP)
  4. 浅析Mongodb源码之游标Cursor
  5. 如何解决PHP+MySQL出现乱码的现象

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...
《非诚勿扰》红人闫凤娇被曝厕所... 【51CTO.com 综合消息360安全专家提醒说,“闫凤娇”、“非诚勿扰”已经被黑客盯上成为了“木...