NoSQL   发布时间:2022-05-24  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了NoSQL数据库:MongoDB初探大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

NoSQL数据库:MongoDB初探


跟着时下炒得火热的NOsql潮流,学习了一下mongodb,记录在此,希望与感兴趣的同学一起研究!

@H_149_12@mongoDB概述 @H_807_10@mongodb由C++写就,其名字来自hu@H_184_15@mongous这个单词的中间部分,是由10gen开发并维护的,关于它的一个最简洁描述为:scalable,high-perfoRMANce,open source,schema-free,document-oriented database。MongoDB的主要目标是在键/值存储方式(提供了高性能和高度伸缩性)以及传统的RDBMS系统(丰富的功能)架起一座桥梁,集两者的优势于一身。

@H_807_10@mongoDB特性:

l 面向文档存储

l 全索引支持,扩展到内部对象和内嵌数组

l 复制和高可用

l 自动分片支持云级扩展性

l 查询记录分析

l 动态查询

l 快速,就地更新

l 支持Map/Reduce操作

l GrIDFS文件系统

l 商业支持,培训和咨询

官网: http://www.mongodb.org/

配置

@H_740_44@master-slaves 模式 @H_10_49@master @H_502_122@
机器 IP 角色
test001 192.168.1.1
test002 192.168.1.2 slave
test003 192.168.1.3 slave
test004 192.168.1.4 slave
test005 192.168.1.5 slave
test006 192.168.1.6 slave

启动master:

@H_502_122@
1
./mongod -dbpath=/mongodb/data/ -logpath=/mongodb/logs/mongodb.log -oplogSize=10000 -logappend -master -port=27017 -fork

添加repl用户:

@H_502_122@
1
2
3
./mongo
>use local
> db.addUser('repl','Replication');

启动slaves:

@H_502_122@
1
2
./mongod -dbpath=/mongodb/data/ -logpath=/mongodb/logs/mongodb.log -slave -port=27017 -source=test001:27017 --autoresync
-fork

添加repl用户:

@H_502_122@
1
2
3
./mongo
>use local
> db.addUser('repl','Replication');

autoresync 参数会在系统发生意外情况造成主从数据不同步时,自动启动复制操作 (同步复制 10 分钟内仅执行一次)。除此之外,还可以用 –slavedelay 设定更新频率(秒)。

通常我们会使用主从方案实现读写分离,但需要设置 Slave_OK。

slaveOk

When querying a replica pair or replica set,drivers route their @R_616_10613@ests to the master mongod by default; to perform a query against an (arbitrarily-SELEcted) slave,the query can be run with the slaveOk option. Here’s how to do so in the sHell:

db.getMongo().setSlaveOk(); // enable querying a slave
db.users.find(...)

Note: some language drivers permit specifying the slaveOk option on each find(),others make this a connection-wIDe setTing. See your language’s driver for details.

Replica Set模式

Replica Sets 使用 n 个 Mongod 节点,构建具备自动容错转移(auto-failover)、自动恢复(auto-recovery) 的高可用方案。

@H_502_122@
机器 IP 角色
test001 192.168.1.1 secondary
test002 192.168.1.2 secondary
test003 192.168.1.3 priMary
test004 192.168.1.4 secondary
test005 192.168.1.5 secondary
test006 192.168.1.6 secondary
test007 192.168.1.7 secondary

启动:

@H_502_122@
1
./mongod -dbpath=/mongodb/data/ -logpath=/mongodb/logs/mongodb.log -oplogSize=10000 -logappend -replSet set1 -port=27017 -fork –rest

添加repl用户:

@H_502_122@
1
2
3
./mongo
>use local
> db.addUser('repl','Replication');

配置:

@H_502_122@
1
2
3
4
5
6
7
8
9
10
config={_ID:'set1',members:[
{_ID:0,host:'test001:27017'},
{_ID:1,host:'test002:27017'},
{_ID:2,host:'test003:27017'},
{_ID:3,host:'test004:27017'},
{_ID:4,host:'test005:27017'},
{_ID:5,host:'test006:27017'},
{_ID:6,host:'test007:27017'}]
}
rs.initiate(config);

查看:

访问 http://test001 :28017/_replSet

或者

@H_502_122@
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
./mongo
> rs.status()
{
"set" : "set1",
"date" : "Fri Dec 03 2010 00:57:44 GMT+0800 (CST)",
"myState" : 2,
"members" : [
{
"_ID" : 0,
"name" : "test001:27017",
"health" : 1,
"state" : 2,
"self" : true
},
{
"_ID" : 1,
"name" : "test002:27017",
"uptime" : 194451,
"lastHeartbeat" : "Fri Dec 03 2010 00:57:42 GMT+0800 (CST)"
},
{
"_ID" : 2,
"name" : "test003:27017",
"state" : 1,
"uptime" : 194689,
"lastHeartbeat" : "Fri Dec 03 2010 00:57:43 GMT+0800 (CST)"
},
{
"_ID" : 3,
"name" : "test004:27017",
{
"_ID" : 4,
"name" : "test005:27017",
{
"_ID" : 5,
"name" : "test006:27017",
{
"_ID" : 6,
"name" : "test007:27017",
"lastHeartbeat" : "Fri Dec 03 2010 00:57:42 GMT+0800 (CST)"
}
],
"ok" : 1
}

在Replica Sets上做操作后调用getlasterror使写操作同步到至少3台机器后才返回

db.runcommand( { getlasterror : 1,w : 3 } )

注:该模式不支持auth功能,需要auth功能请选择m-s模式

Sharding模式

要构建一个 MongoDB Sharding Cluster,需要三种角色:

  • Shard Server: mongod 实例,用于存储实际的数据块。
  • Config Server: mongod 实例,存储了整个 Cluster Metadata,其中包括 chunk 信息。
  • Route Server: mongos 实例,前端路由,客户端由此接入,且让整个集群看上去像单一进程数据库。
@H_10_49@mongod shard11:27017 @H_10_49@mongod shard21:27017 @H_10_49@mongod shard31:27017 @H_10_49@mongod config1:20000
mongs1:30000 @H_10_49@mongod config2:20000
mongs2:30000 @H_10_49@mongod config3:20000
mongs3:30000 @H_10_49@mongod shard12:27017 @H_10_49@mongod shard22:27017 @H_10_49@mongod shard32:27017 @H_502_122@
机器 IP 角色
test002 192.168.1.2
test003 192.168.1.3
test004 192.168.1.4
test005 192.168.1.5
test006 192.168.1.6
test007 192.168.1.7
test008 192.168.1.8
test009 192.168.1.9
test010 192.168.1.10

Shard配置

Shard1@H_982_944@

[test002; test008]@H_982_944@

test002:

@H_502_122@
1
./mongod -shardsvr -replSet shard1 -port 27017 -dbpath /mongodb/data/shard11 -oplogSize 10000 -logpath /mongodb/logs/shard11.log -logappend -fork

test008:

@H_502_122@
1
./mongod -shardsvr -replSet shard1 -port 27017 -dbpath /mongodb/data/shard12 -oplogSize 10000 -logpath /mongodb/logs/shard12.log -logappend -fork

初始化shard1@H_982_944@

@H_502_122@
1
2
3
4
5
config={_ID:'shard1',host:'test008:27017'}]
}
rs.initiate(config);

Shard2@H_982_944@

[test003; test009]@H_982_944@

test003:

@H_502_122@
1
./mongod -shardsvr -replSet shard2 -port 27017 -dbpath /mongodb/data/shard21 -oplogSize 10000 -logpath /mongodb/logs/shard21.log -logappend -fork

test009:

@H_502_122@
1
./mongod -shardsvr -replSet shard2 -port 27017 -dbpath /mongodb/data/shard22 -oplogSize 10000 -logpath /mongodb/logs/shard22.log -logappend -fork

初始化shard2@H_982_944@

@H_502_122@
1
2
3
4
5
config={_ID:'shard2',host:'test009:27017'}]
}
rs.initiate(config);

Shard3@H_982_944@

[test004; test010]@H_982_944@

test004:

@H_502_122@
1
./mongod -shardsvr -replSet shard3 -port 27017 -dbpath /mongodb/data/shard31 -oplogSize 10000 -logpath /mongodb/logs/shard31.log -logappend -fork

test010:

@H_502_122@
1
./mongod -shardsvr -replSet shard3 -port 27017 -dbpath /mongodb/data/shard32 -oplogSize 10000 -logpath /mongodb/logs/shard32.log -logappend -fork

初始化shard3@H_982_944@

@H_502_122@
1
2
3
4
5
config={_ID:'shard3',host:'test010:27017'}]
}
rs.initiate(config);

config server配置

[test005; test006; test007]@H_982_944@

@H_502_122@
1
./mongod -configsvr -dbpath /mongodb/data/config -port 20000 -logpath /mongodb/logs/config.log -logappend -fork
@H_171_42@mongos配置

[test005; test006; test007]@H_982_944@

@H_502_122@
1
./mongos -configdb test005:20000,test006:20000,test007:20000 -port 30000 -chunkSize 5 -logpath /mongodb/logs/mongos.log -logappend -fork

Route 转发请求到实际的目标服务进程,并将多个结果合并回传给客户端。Route 本身并不存储任何数据和状态,仅在启动时从 Config Server 获取信息。Config Server 上的任何变动都会传递给所有的 Route Process。

Configuring the Shard Cluster

1. 连接admin数据库

@H_502_122@
1
./mongo test005:30000/admin

2. 加入shards

@H_502_122@
1
2
3
db.runcommand({addshard:"shard1/test002:27017,test008:27017",name:"s1",maxsize:20480});
db.runcommand({addshard:"shard2/test003:27017,test009:27017",name:"s2",maxsize:20480});
db.runcommand({addshard:"shard3/test004:27017,test010:27017",name:"s3",maxsize:20480});

3. LisTing shards

@H_502_122@
1
db.runcommand({Listshards:1})

如果列出了以上3个shards,表示shards已经配置成功

4. 激活数据库和表分片

@H_502_122@
1
2
db.runcommand({enablesharding:"taobao"});
db.runcommand({shardcollection:"taobao.test0",key:{_ID:1}}); db.runcommand({shardcollection:"taobao.test1",key:{_ID:1}});

使用

sHell操作数据库

超级用户相关:@H_982_944@

1) 进入数据库admin

@H_502_122@
1
use admin

2) 增加或修改用户密码

@H_502_122@
1
db.addUser('name','pwd')

3) 查看用户列表

@H_502_122@
1
db.system.users.find()

4) 用户认证

@H_502_122@
1
db.auth('name','pwd')

5) 删除用户

@H_502_122@
1
db.removeUser('name')

6) 查看所有用户

@H_502_122@
1
show users

7) 查看所有数据库

@H_502_122@
1
show dbs

8) 查看所有的collection

@H_502_122@
1
show collections

9) 查看各collection的状态

@H_502_122@
1
db.printCollectionStats()

10) 查看主从复制状态

@H_502_122@
1
db.printReplicationInfo()

11) 修复数据库

@H_502_122@
1
db.repairDatabase()

12) 设置记录profiling,0=off 1=slow 2=all

@H_502_122@
1
db.setProfilingLevel(1)

13) 查看profiling

@H_502_122@
1
show profile

14) 拷贝数据库

@H_502_122@
1
db.copyDatabase('mail_addr','mail_addr_tmp')

15) 删除collection

@H_502_122@
1
db.mail_addr.drop()

16) 删除当前的数据库

@H_502_122@
1
db.droPDAtabase()

增加删除修改:@H_982_944@

1) Insert@H_982_944@

@H_502_122@
1
2
3
db.user.insert({'name':'dump','age':1})
or
db.user.save({'name':'dump','age':1})

嵌套对象:

@H_502_122@
1
db.foo.save({'name':'dump','address':{'city':'hangzhou','post':310015},'phone':[138888888,13999999999]})

数组对象:

@H_502_122@
1
db.user_addr.save({'UID':'dump','Al':['test-1@taobao.com','test-2@taobao.com']})

2) delete@H_982_944@

删除name=’dump’的用户信息:

@H_502_122@
1
db.user.remove({'name':'dump'})

删除foo表所有信息:

@H_502_122@
1
db.foo.remove()

3) update@H_982_944@

//update foo set xx=4 where yy=6

//如果不存在则插入,允许修改多条记录

@H_502_122@
1
db.foo.update({'yy':6},{'$set':{'xx':4}},upsert=true,multi=truE)

查询:@H_982_944@

@H_502_122@
1
2
3
4
5
6
7
8
coll.find() // SELEct * from coll
coll.find().limit(10) // SELEct * from coll limit 10
coll.find().sort({x:1}) // SELEct * from coll order by x asc
coll.find().sort({x:1}).skip(5).limit(10) // SELEct * from coll order by x asc limit 5,10
coll.find({x:10}) // SELEct * from coll where x = 10
coll.find({x: {$lt:10}}) // SELEct * from coll where x <= 10
coll.find({},{y:truE}) // SELEct y from coll
coll.count() //SELEct count(*) from coll

其他:

@H_502_122@
1
2
3
4
5
coll.find({"address.city":"gz"}) // 搜索嵌套文档address中city值为gz的记录
coll.find({likes:"math"}) // 搜索数组
coll.find({name: {$exists: truE}}); //查询所有存在Name字段的记录
coll.find({phone: {$exists: falsE}}); //查询所有不存在phone字段的记录
coll.find({name: {$type: 2}}); //查询所有name字段是字符类型的coll.find({age: {$type: 16}}); //查询所有age字段是整型的

索引:

1(ascending),-1(descending)

@H_502_122@
1
2
3
4
5
6
7
coll.ensureIndex({productID:1}) // 在productID上建立普通索引
coll.ensureIndex({diStrict:1,plate:1}) // 多字段索引
coll.ensureIndex({"address.city":1}) // 在嵌套文档的字段上建索引
coll.ensureIndex({productID:1},{unique:truE}) // 唯一索引
coll.ensureIndex({productID:1},{unique:true,dropDups:true|) // 建索引时,如果遇到索引字段值已经出现过的情况,则删除重复记录
coll.geTindexes() // 查看索引
coll.dropIndex({productID:1}) // 删除单个索引

@H_184_15@mongoDB Drivers

C

C#

C++

Haskell

Java

Javascript

Perl

php

Python

Ruby

Scala (via Casbah)

@R_734_4674@持的clIEnt 编程API非常多,由于dump中心是建立在hadoop的基础上的,所以着重介绍java API,后面的测试程序采用的也是java API.

@H_184_15@mongoDB in Java

下载MongoDB的Java驱动,把jar包(mongo-2.3.jar)扔到项目里去就行了,

Java中,Mongo对象是线程安全的,一个应用中应该只使用一个Mongo对象。Mongo对象会自动维护一个连接池,默认连接数为10。

@H_502_122@
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
import com.mongodb.*
try{
@H_85_138@mongo mg = new Mongo(server_Lists);// List<ServerAddress> server _Lists
DB db = mg.getDB("taobao");
if (db.isAuthenticated() == falsE) {
db.authenticate("name","pwd".tochararray());
}
DBCollection coll=db.getCollection("category_property_values");
coll.slaveOk();//repl set模式必须调用,否则所有query将只发到主节点查询
//insert
BasicDBObject doc = <strong>new</strong> BasicDBObject();
//赋值
doc.put("name","MongoDB");
doc.put("type","database");
coll.insert(doc);
……
//SELEct
//查询一条数据
BasicDBObject doc = <strong>new</strong> BasicDBObject();
doc.put("name","MongoDB");
DBObject query = coll.findOne(doc);
……
//使用游标查询
DBcursor cur = coll.find(doc);
while(cur.hasNext()) {
cur.next();
……
}
……
//update
DBObject dbList = new BasicDBObject();
DBObject qList = new BasicDBObject();
qList.put("_ID",j);
dbList.put("t1",str);
coll.update(qList,dbList);
……
//delete
DBObject dList = new BasicDBObject();
dList.put("_ID",j);
coll.remove(dList);
}catch(MongoException eX){
}

@H_184_15@mongoDB 测试

测试版本: 1.6.3

采用单线程分别插入100万,300万,500万,1000万数据和多个线程,每线程插入100万数据.

插入数据格式:

@H_502_122@
1
{ "_ID" : numberLong(16),"nID" : numberLong(16),"t1" : "search_ENGIne_insert","t2" : "search_ENGIne_insert","t3" : "search_ENGIne_insert","t4" : "search_ENGIne_insert" }

1) Master slaves模式

Insert@H_982_944@

@H_502_122@
Per-thread rows run time Per-thread insert @R_463_10586@l-insert @R_463_10586@l rows threads
1000000 20 50000 50000 1000000 1
3000000 60 50000 50000 3000000 1
5000000 99 50505 50505 5000000 1
8000000 159 50314 50314 8000000 1
10000000 208 48076 48076 10000000 1
1000000 64 15625 31250 2000000 2
@H_807_10@mongodb只有主节点才能进行插入和更新操作.

update@H_982_944@

数据格式:

@H_502_122@
1
{ "_ID" : numberLong(16),"t1" : "search_ENGIne_update","t2" : "search_ENGIne_update","t3" : "search_ENGIne_update","t4" : "search_ENGIne_update" }
@H_502_122@
Per-thread rows run time Per-thread update @R_463_10586@l-update @R_463_10586@l rows threads
1000000 96 10416 10416 1000000 1
3000000 287 10452 10452 3000000 1
1000000 188 5319 15957 3000000 3
1000000 351 2849 14245 5000000 5

SELEct@H_982_944@

以”_ID”字段为key,返回整条记录

a) 客户端:单机多线程

@H_502_122@
Per-thread rows run time Per-thread SELEct @R_463_10586@l-SELEct @R_463_10586@l rows threads
1000000 72 13888 13888 1000000 1
1000000 129 7751 77519 10000000 10
1000000 554 1805 90252 50000000 50
1000000 1121 892 89206 100000000 100
1000000 2256 443 88652 200000000 200

b) 客户端:分布式多线程

程序部署在39台机器上

@H_502_122@
Per-thread rows run time Per-thread SELEct @R_463_10586@l-SELEct @R_463_10586@l rows threads
1000000 173 5780 5780*39=223470 1000000*39 1
1000000 1402 713 7132*39=278148 10000000*39 10
500000 1406 355 7112*39=277368 10000000*39 20
200000 1433 139 6978*39=272142 10000000*39 50

2) Replica Set 模式

Insert@H_982_944@

@H_502_122@
Per-thread rows run time Per-thread insert @R_463_10586@l-insert @R_463_10586@l rows threads
1000000 40 25000 25000 1000000 1
3000000 117 25641 25641 3000000 1
5000000 211 23696 23696 5000000 1
8000000 289 27681 27681 8000000 1
10000000 388 25773 25773 10000000 1
1000000 83 12048 24096 2000000 2
1000000 210 4762 23809 5000000 5

update@H_982_944@

@H_502_122@
Per-thread rows run time Per-thread update @R_463_10586@l-update @R_463_10586@l rows threads
1000000 28 35714 35714 1000000 1
3000000 83 36144 36144 3000000 1
1000000 146 6849 20547 3000000 3
1000000 262 3816 19083 5000000 5

SELEct@H_982_944@

以”_ID”字段为key,返回整条记录

a) 客户端:单机多线程

@H_502_122@
Per-thread rows run time Per-thread SELEct @R_463_10586@l-SELEct @R_463_10586@l rows threads
1000000 198 5050 5050 1000000 1
1000000 264 3787 37878 10000000 10
1000000 436 2293 114678 50000000 50
1000000 754 1326 132625 100000000 100
1000000 1526 655 131061 200000000 200

b) 客户端:分布式多线程

程序部署在39台机器上

@H_502_122@
Per-thread rows run time Per-thread SELEct @R_463_10586@l-SELEct @R_463_10586@l rows threads
1000000 216 4629 4629*39=180531 1000000*39 1
1000000 1375 729 7293*39=284427 10000000*39 10
500000 1469 340 6807*39=265473 10000000*39 20
200000 1561 128 6406*39=249834 10000000*39 50

3) Sharding 模式

Insert@H_982_944@

@H_502_122@
Per-thread rows run time Per-thread insert @R_463_10586@l-insert @R_463_10586@l rows threads
1000000 58 17241 17241 1000000 1
3000000 180 16666 16666 3000000 1
5000000 373 13404 13404 5000000 1
2000000 234 8547 17094 4000000 2
2000000 447 4474 22371 10000000 5

update@H_982_944@

@H_502_122@
Per-thread rows run time Per-thread update @R_463_10586@l-update @R_463_10586@l rows threads
1000000 38 26315 26315 1000000 1
3000000 115 26086 26086 3000000 1
1000000 64 15625 46875 3000000 3
1000000 93 10752 53763 5000000 5

SELEct@H_982_944@

以”_ID”字段为key,返回整条记录

a) 客户端:单机多线程

@H_502_122@
Per-thread rows run time Per-thread SELEct @R_463_10586@l-SELEct @R_463_10586@l rows threads
1000000 277 3610 3610 1000000 1
1000000 456 2192 21929 10000000 10
1000000 1158 863 43177 50000000 50
1000000 2299 434 43497 100000000 100

b) 客户端:分布式多线程

程序部署在39台机器上

@H_502_122@
Per-thread rows run time Per-thread SELEct @R_463_10586@l-SELEct @R_463_10586@l rows threads
1000000 659 1517 1517*39= 59163 1000000*39 1
1000000 8540 117 1170*39=45630 10000000*39 10

小结:

@H_807_10@mongodb在M-S和Repl-Set模式下查询效率还是不错的,区别在于Repl-Set模式如果有priMary节点挂掉,系统自己会选举出另一个priMary节点,不会影响后续的使用,原来的主节点恢复后自动成为secondary节点,而M-S模式一旦master 节点挂掉需要手工将别的slaves 节点修改成master,另外Repl-Set模式最多只能有7个节点.

由于sharding模式查询速度下降明显,耗时太长,所以只测试了2轮,估计他的威力应该在数据量非常大的环境下才能体现出来吧,以上数据仅供参,现在只是简单的进行了测试,接下来会对源码进行一下研究,欢迎和感兴趣的同学多多交流!



大佬总结

以上是大佬教程为你收集整理的NoSQL数据库:MongoDB初探全部内容,希望文章能够帮你解决NoSQL数据库:MongoDB初探所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。
标签:记录在此