• 1
  • 2
  • 3
  • 4
  • 5
mysql数据库问题 首 页  »  帮助中心  »  数据库  »  mysql数据库问题
Mongodb与Mysql的优缺点
发布日期:2016-5-2 22:5:53

 一、与关系型数据库相比,MongoDB的优点:

  1.弱一致性(最终一致),更能保证用户的访问速度:

  例如,在传统的关系型数据库中,一个COUNT类型的操作会锁定数据集,这样可以保证得到“当前”情况下的精确值。这在某些情况下,例如通过ATM查看账户信息的 时候很重要,但是对于Wordnik来说,数据是不断更新与增长的,这种“精确”的保证几乎没有任何意义,反而会产生很大的延迟。他们需要的是一个“大约” 的数字以及更快的处理速度。

  但是某些情况下MongoDB会锁住数据库。若此时正有数百个请求,则它们会堆积起来,这就会造成许多问题。我们使用 了下面的优化方式来避免锁定:每次更新前,我们会先查询记录。查询操作会将对象放入内存,更新则会尽可能的迅速。在主/从部署方案中,从节点可以使用 “-pretouch”参数运行,这也可以得到相同的效果。

  使用多个mongod进程。根据访问模式,我们将数据库拆分成多个进程。

  2.文档结构的存储方式,能够更便捷的获取数据。

  若要将这样的数据使用扁平式的,表状的结构来保存数据,这对于一个层级式的数据结构来说,无论是在查询还是获取数据时都十分困难。

  3.内置GridFS,支持大容量的存储。

  GridFS是一个出色的分布式文件系统,能支持海量的数据存储。内置了GridFS了MongoDB,能够满足对大数据集的快速范围查询。

  4.内置Sharding。

  提供了基于Range的AutoSharding机制:一个collection可按照记录的范围,分成若干个段,切分到不同的Shard上。

  Shards可以和复制结合,配合Replicasets能够实现Sharding+fail-over,不同的Shard之间可以负载均衡。查询是对客 户端是透明的。客户端执行查询,统计,MapReduce等操作,这些会被MongoDB自动路由到后端的数据节点。这让我们关注于自己的业务,适当的时 候可以无痛的升级。MongoDB的Sharding设计能力最大可支持约20petabytes,足以支撑一般应用。

  这可以保证MongoDB运行在便宜的PC服务器集群上。PC集群扩充起来非常方便且成本很低,避免了“sharding”操作的复杂性和成本。

  5.第三方支持丰富。

  现在网络上的很多NoSQL开源数据库完全属于社区型的,没有官方支持,给使用者带来了很大的风险。

  而开源文档数据库MongoDB背后有商业公司10gen为其提供供商业培训和支持。

  且MongoDB社区非常活跃,很多开发框架都迅速提供了对MongDB的支持。不少知名大公司和网站也在生产环境中使用MongoDB,越来越多的创新型企业转而使用MongoDB作为和Django,RoR来搭配的技术方案。

  6.性能优越

  在 使用场合下,千万级别的文档对象,近10G的数据,对有索引的ID的查询不会比mysql慢,而对非索引字段的查询,则是全面胜出。mysql实际无法胜 任大数据量下任意字段的查询,而mongodb的查询性能实在让我惊讶。写入性能同样很令人满意,同样写入百万级别的数据,mongodb比我以前试用过 的couchdb要快得多,基本10分钟以下可以解决。补上一句,观察过程中mongodb都远算不上是CPU杀手。

  二、与关系型数据库相比,MongoDB的缺点:

  1.mongodb不支持事务操作。

  因此事务要求严格的系统(如果银行系统)肯定不能用它。(这点和优点①是对应的)

  2.mongodb占用空间过大。

  关于其原因,在官方的FAQ中,提到有以下所示的几个方面:

  (1) 空间的预分配:为避免形成过多的硬盘碎片,mongodb每次空间不足时都会申请生成一大块的硬盘空间,而且申请的量从64M、128M、256M那样的 指数递增,直到2G为单个文件的最大体积。随着数据量的增加,你可以在其数据目录里看到这些整块生成容量不断递增的文件。

  (2)字段名所占用 的空间:为了保持每个记录内的结构信息用于查询,mongodb需要把每个字段的key-value都以BSON的形式存储,如果value域相对于 key域并不大,比如存放数值型的数据,则数据的overhead是最大的。一种减少空间占用的方法是把字段名尽量取短一些,这样占用空间就小了,但这就 要求在易读性与空间占用上作为权衡了。我曾建议作者把字段名作个index,每个字段名用一个字节表示,这样就不用担心字段名取多长了。但作者的担忧也不 无道理,这种索引方式需要每次查询得到结果后把索引值跟原值作一个替换,再发送到客户端,这个替换也是挺耗费时间的。现在的实现算是拿空间来换取时间吧。

  (3)删除记录不释放空间:这很容易理解,为避免记录删除后的数据的大规模挪动,原记录空间不删除,只标记“已删除”即可,以后还能重复利用。

  (4)可以定期运行db.repairDatabase()来整理记录,但是这个过程会比较缓慢

  3.比起mysql,MongoDB没有如MySQL那样成熟的维护工具,这对于开发与IT运营都是个值得注意的地方。