写给MongoDB开发者的50条建议Tip21

本系列文章翻译自《50 Tips and Tricks for MongoDB Developers》,暂时没有找到中文版,反正自己最近也在深入学习mongodb,所以正好拿来翻译一下。一方面加强自己学习的效果,另一方面让大 家也一起来体验一下需要我们这些mongodb使用者需要注意的地方。

成都创新互联云计算的互联网服务提供商,拥有超过13年的服务器租用、重庆服务器托管、云服务器、网络空间、网站系统开发经验,已先后获得国家工业和信息化部颁发的互联网数据中心业务许可证。专业提供云主机、网络空间、域名与空间、VPS主机、云服务器、香港云服务器、免备案服务器等。

首先声明自己的英文水平不是太高,加之有些英文翻译成中文也找不到合适的词来表达,所以在文章中可能会出现英文原词,或者说有些地方的翻译会有些生 硬,也就是说会出现直译的地方。翻译该书的主要目的是为大家学习探讨用的,如果有翻译不精准的地方,或者说有更加精准的翻译,还请大家指出,我会及时的更 正的,在此先谢过各位了。

Tip#21.Minimize disk access

将访问磁盘的次数降到最低

从RAM中中访问数据很快,而从磁盘中访问数据有点慢。因此,大多数优化技巧的基础都是最小化访问磁盘的数量。

模糊匹配

从磁盘中读取数据和从内存中读取数据相比要慢100万倍。

大多数碟式(旋转式)硬盘驱动器能在10毫秒内访问到数据,然后从内存中只需要10纳秒就可以访问到数据(这依赖于你使用的是什么样的硬盘驱动器,什么样的内存,在这里我们只是粗糙的估算一下)。这意味着磁盘和RAM的访问时间比例是:1毫秒/1纳秒。1毫秒是1百万个1纳秒,因此访问磁盘是访问内存个的1百万倍。

在Linux上通过运行下面的命令,可以测试顺序访问磁盘。

  1. sudo hdparm -t /dev/hdwhatever 

它可能不会返回精确的测量值,就像mongodb使用的是随机的读写,但是还是可以看出你的机器能干什么。

我们能做什么呢?下面是两个简单的方案:

使用SSD

SSD(solid state derives固态硬盘)在很多方面要比旋转式硬盘快很多,但是它们更小,更贵,很难安全的擦除,而且还是不能和从内存读取的速度相比。不是要阻止你使用SSD,他们可以和mongodb很好的配合,但是它不是万能的。

增加更多的RAM

增加更多的RAM意味着你减少了对磁盘的访问。但是,某些时候,你的数据可能不适合进入RAM。

因此,问题变成了:我们如何在磁盘上存储T字节,甚至是P自己的数据?如何编写这样一个,经常访问的数据已经在内存中,尽可能少的从磁盘中移动数据到内存,应用程序?

如果你访问数据的方式是实时的、随即的,你将会须要很多的RAM。但是,大多数应用不是这样的,访问近期的数据要比访问旧的数据次数多,一部分用户要比其他用户更活跃,一部分地域要比其他地域用户多。这样的应用,应该设计成在内存中保持特定的数据,很少直接访问磁盘。


文章名称:写给MongoDB开发者的50条建议Tip21
网页URL:http://pcwzsj.com/article/gdhoip.html