Capped collections是高性能自动的维护对象的插入顺序。它非常适合类似记录日志的功能
创建一个 Capped Collection
和标准的collection不同,你必须要显式的创建一个capped collection,
指定一个collection的大小,单位是字节。collection的数据存储空间值提前分配的。
要注意的是指定的存储大小包含了数据库的头信息。
> db.createCollection("mycoll", {capped:true, size:100000})
使用和约束
•在capped collection中,你能添加新的对象。
•能进行更新,然而,对象不会增加存储空间。如果增加,更新就会失败 。
•数据库不允许进行删除。使用drop()方法删除collection所有的行。
注意: 删除之后,你必须显式的重新创建这个collection。
•在32bit机器中,capped collection最大存储为1e9个字节。
特性
•如果空间都被使用完毕,新添加的对象会取代最旧的那个数据。
•如果你执行find(),并没有指定顺序。返回的结果就是按照插入顺序排序。
•倒序使用 find().sort({$natural:-1})。
应用
•日志Logging. Capped collection性能非常优秀,可以来存储日志文档。
•插入一个没有索引的capped collection速度非常接近存储在文件系统。
• 额外的忧郁使用了内置的LRU机制,也不用担心超出硬盘空间。
•缓存Caching. 如果你希望在数据库缓存一些小数量的对象。
•capped collection提供了非常方便的机制来实现这个操作。
•注意的是要给capped table添加索引,因为这种应用,读频率高于写。
•自动存档Auto Archiving. 如果你希望数据自动过期。
•capped collection要比手写cron scripts更为方便。
建议
•为了最大化性能,不要再capped collection上创建索引。
•如果这个collection写操作多于读操作,更不需要索引了。
•注意的是,你可能创建了索引。速度就会降低,但是还是要比标准的collection要快。
•
•使用 natural ordering 来更有效的获取最近插入的元素。和linux的tail命令相似。
限制对象的个数
你可能也需要限定collection中对象的数量。如果到了限制的数量,就要移除一个最近的插入。
限制对象的数量, 指定 max参数。
注意: 当指定了对象的数量,你也必须要限制存储大小。
要确定的是存储大小要完全能够存储限制的对象数,
不然的话,移除对象速度会加快。你可以使用validate()工具来查看collection使用的存储空间,
这样就可以预估需要的空间。
注意: 只限制存储大小性能要更好一些。
db.createCollection("mycoll", {capped:true, size:100000, max:100});
db.mycoll.validate();
提示: 当编程的时候,存储最近对象的版本号的方法就是把max参数设为1(max=1)。
预分配普通的collection
createCollection 命令也可以用于不是capped collections。如
db.createCollection("mycoll", {size:10000000});
db.createCollection("mycoll", {size:10000000, autoIndexId:false});
通过createCollection来显式创建一个非capped collection允许指定一些参数。
如,指定collection大小,来预分配collection所需的硬盘空间。
autoIndexId 字段可以指定是否要在_id创建唯一索引。默认的情况下,
非capped collection要在_id上创建索引。
默认的情况下,capped collection不会在_id添加索引。
Sharding
Capped collections 还不支持数据切分
查看一个collection是否为capped collection
你可以调用isCapped方法来查看一个collection是否为capped collection。 db.foo.isCapped()
创建固定集合
我们通过createCollection来创建一个固定集合,且capped选项设置为true:
>db.createCollection("cappedLogCollection",{capped:true,size:10000})
还可以指定文档个数,加上max:1000属性:
>db.createCollection("cappedLogCollection",{capped:true,size:10000,max:1000})
判断集合是否为固定集合:
>db.cappedLogCollection.isCapped()
如果需要将已存在的集合转换为固定集合可以使用以下命令:
>db.runCommand({"convertToCapped":"posts",size:10000})
以上代码将我们已存在的 posts 集合转换为固定集合。
固定集合查询
固定集合文档按照插入顺序储存的,默认情况下查询就是按照插入顺序返回的,也可以使用$natural调整返回顺序。
>db.cappedLogCollection.find().sort({$natural:-1})
固定集合的功能特点
可以插入及更新,但更新不能超出collection的大小,否则更新失败,不允许删除,但是可以调用drop()删除集合中的所有行,但是drop后需要显式地重建集合。
在32位机子上一个cappped collection的最大值约为482.5M,64位上只受系统文件大小的限制。
固定集合属性及用法
属性
属性1:对固定集合进行插入速度极快
属性2:按照插入顺序的查询输出速度极快
属性3:能够在插入最新数据时,淘汰最早的数据
用法
用法1:储存日志信息
用法2:缓存一些少量的文档