婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > MongoDB中強大的統計框架Aggregation使用實例解析

MongoDB中強大的統計框架Aggregation使用實例解析

熱門標簽:兗州電話外呼營銷系統 智能電銷機器人銷售話術 南京400電話怎樣辦理 徐州ai電銷機器人原理 機器人外呼系統軟件存在問題 沈陽營銷電銷機器人招商 企業智能外呼系統價格多少 高德地圖標注商戶位置 福州電銷機器人源代碼

聽說項目里面Aggregation用的多,那就專門針對這個多多練習一下。

基本的操作包括:

•$project - 可以從子文檔中提取字段,可以重命名字段

•$match - 可以實現查找的功能

•$limit - 接受一個數字n,返回結果集中的前n個文檔。

•$skip - 接受一個數字n,丟棄結果集中的前n個文檔。效率比較低,依然會遍歷前n個文檔。

•$unwind - 可以將一個包含數組的文檔切分成多個, 比如你的文檔有 中有個數組字段 A, A中有10個元素, 那么經過 $unwind處理后會產生10個文檔,這些文檔只有 字段 A不同

•$group - 統計操作, 還提供了一系列子命令

–$avg, $sum …

•$sort - 排序

Python篇
實驗一、學生數據統計
1、生成學生數據:

#!/usr/bin/env python
# coding=utf-8
from pymongo import MongoClient
from random import randint
name1 = ["yang ", "li ", "zhou "]
name2 = [
  "chao",
  "hao",
  "gao",
  "qi gao",
  "hao hao",
  "gao gao",
  "chao hao",
  "ji gao",
  "ji hao",
  "li gao",
  "li hao",
]
provinces = [
  "guang dong",
  "guang xi",
  "shan dong",
  "shan xi",
  "he nan"
]
client = MongoClient('localhost', 27017)
db = client.student
sm = db.smessage
sm.remove()
for i in range(1, 100):
  name = name1[randint(0, 2)] + name2[randint(0, 10)]
  province = provinces[randint(0, 4)]
  new_student = {
    "name": name,
    "age": randint(1, 30),
    "province": province,
    "subject": [
      {"name": "chinese", "score": randint(0, 100)},
      {"name": "math", "score": randint(0, 100)},
      {"name": "english", "score": randint(0, 100)},
      {"name": "chemic", "score": randint(0, 100)},
    ]}
  print new_student
  sm.insert_one(new_student)

print sm.count()

好了,現在數據庫里面有100條學生數據了。

現在我要得到廣東學生的平均年齡,在mongo控制臺輸入:

 如果想到得到所有省份的平均年齡,那就更加簡單了:

db.smessage.aggregate(
{$match: {province: "guang dong"}}
)

{ "_id" : "guang xi", "age" : 15.19047619047619 }
{ "_id" : "guang dong", "age" : 16.05263157894737 }
{ "_id" : "shan dong", "age" : 17.44 }
{ "_id" : "he nan", "age" : 20 }
{ "_id" : "shan xi", "age" : 16.41176470588235 }

如果想得到廣東省所有科目的平均成績:

db.smessage.aggregate(
{$match: {province: "guang dong"}},
{$unwind: "$subject"},
{$group: { _id: {province:"$province",sujname:"$subject.name"}, per:{$avg:"$subject.score"}}}
)

加上排序:

db.smessage.aggregate(
{$match: {province: "guang dong"}},
{$unwind: "$subject"},
{$group: { _id: {province:"$province",sujname:"$subject.name"}, per:{$avg:"$subject.score"}}},
{$sort:{per:1}}
)

實驗二、尋找發帖水王
有一個保存著雜志文章的集合,你可能希望找出發表文章最多的那個作者。假設每篇文章被保存為MongoDB中的一個文檔。

1、插入數據

#!/usr/bin/env python
# coding=utf-8
from pymongo import MongoClient
from random import randint


name = [
  'yangx',
  'yxxx',
  'laok',
  'kkk',
  'ji',
  'gaoxiao',
  'laoj',
  'meimei',
  'jj',
  'manwang',
]

title = [
  '123',
  '321',
  '12',
  '21',
  'aaa',
  'bbb',
  'ccc',
  'sss',
  'aaaa',
  'cccc',
]

client = MongoClient('localhost', 30999)
db = client.test
bbs = db.bbs
bbs.remove()
for i in range(1, 10000):
  na = name[randint(0, 9)]
  ti = title[randint(0, 9)]
  newcard = {
    'author': na,
    'title': ti,
  }
  bbs.insert_one(newcard)

print bbs.count()

現在我們擁有了10000條文章數據了。

2、用$project將author字段投射出來

{"$project": {"author":1}}

這個語法與查詢中的字段選擇器比較像:可以通過指定"fieldname" : 1選擇需要投射的字段,或者通過指定"fieldname":0排除不需要的字段。

執行完這個"$project"操作之后,結果集中的每個文檔都會以{"_id" : id, "author" : "authorName"}這樣的形式表示。這些結果只會在內存中存在,不會被寫入磁盤。

3、用group將作者名稱分組

{"group":{"_id":"$author","count":{"$sum":1}}}

這樣就會將作者按照名字排序,某個作者的名字每出現一次,就會對這個作者的"count"加1。

這里首先指定了需要進行分組的字段"author"。這是由"_id" : "$author"指定的。可以將這個操作想象為:這個操作執行完后,每個作者只對應一個結果文檔,所以"author"就成了文檔的唯一標識符("_id")。

第二個字段的意思是為分組內每個文檔的"count"字段加1。注意,新加入的文檔中并不會有"count"字段;這"$group"創建的一個新字段。

執行完這一步之后,結果集中的每個文檔會是這樣的結構:{"_id" : "authorName", "count" : articleCount}。

4、用sort排序

{"$sort" : {"count" : -1}}

這個操作會對結果集中的文檔根據"count"字段進行降序排列。

5、限制結果為前5個文檔

{"$limit" : 5}

這個操作將最終的返回結果限制為當前結果中的前5個文檔。
在MongoDB中實際運行時,要將這些操作分別傳給aggregate()函數:

> db.articles.aggregate({"$project" : {"author" : 1}},
... {"$group" : {"_id" : "$author", "count" : {"$sum" : 1}}},
... {"$sort" : {"count" : -1}},
... {"$limit" : 5}
... )

aggregate()會返回一個文檔數組,其中的內容是發表文章最多的5個作者。

{ "_id" : "yangx", "count" : 1028 }
{ "_id" : "laok", "count" : 1027 }
{ "_id" : "kkk", "count" : 1012 }
{ "_id" : "yxxx", "count" : 1010 }
{ "_id" : "ji", "count" : 1007 }


Java篇

我在db中造了些數據(數據時隨機生成的, 能用即可),沒有建索引,文檔結構如下:

Document結構:

 {
  "_id" : ObjectId("509944545"),
  "province" : "海南",
  "age" : 21,
  "subjects" : [
  {
  "name":"語文",
  "score" : 53
  },
  {
  "name":"數學",
  "score" : 27
  },
  {
  "name":"英語",
  "score" : 35
  }
   ],
  "name" : "劉雨"
 }

     接下來要實現兩個功能:

  1.     統計上海學生平均年齡
  2.     統計每個省各科平均成績

接下來一一道來

統計上海學生平均年齡

從這個需求來講,要實現功能要有幾個步驟: 1. 找出上海的學生. 2. 統計平均年齡 (當然也可以先算出所有省份的平均值再找出上海的)。如此思路也就清晰了

首先上 $match, 取出上海學生

{$match:{'province':'上海'}}

接下來 用 $group 統計平均年齡

{$group:{_id:'$province',$avg:'$age'}}

$avg 是 $group的子命令,用于求平均值,類似的還有 $sum, $max ....
上面兩個命令等價于

select province, avg(age) 
 from student 
 where province = '上海'
 group by province

下面是Java代碼

Mongo m = new Mongo("localhost", 27017);
 DB db = m.getDB("test");
 DBCollection coll = db.getCollection("student");
 
 /*創建 $match, 作用相當于query*/
 DBObject match = new BasicDBObject("$match", new BasicDBObject("province", "上海"));
 
 /* Group操作*/
 DBObject groupFields = new BasicDBObject("_id", "$province");
 groupFields.put("AvgAge", new BasicDBObject("$avg", "$age"));
 DBObject group = new BasicDBObject("$group", groupFields);
 
 /* 查看Group結果 */
 AggregationOutput output = coll.aggregate(match, group); // 執行 aggregation命令
 System.out.println(output.getCommandResult());

輸出結果:

{ "serverUsed" : "localhost/127.0.0.1:27017" ,    
 "result" : [ 
  { "_id" : "上海" , "AvgAge" : 32.09375}
  ] ,     
  "ok" : 1.0
 }

如此工程就結束了,再看另外一個需求

統計每個省各科平均成績

首先更具數據庫文檔結構,subjects是數組形式,需要先‘劈'開,然后再進行統計

主要處理步驟如下:

1. 先用$unwind 拆數組 2. 按照 province, subject 分租并求各科目平均分

$unwind 拆數組

{$unwind:'$subjects'}

按照 province, subject 分組,并求平均分

{$group:{
   _id:{
     subjname:”$subjects.name”,  // 指定group字段之一 subjects.name, 并重命名為 subjname
     province:'$province'     // 指定group字段之一 province, 并重命名為 province(沒變)
   },
   AvgScore:{
    $avg:”$subjects.score”    // 對 subjects.score 求平均
   }
 }

java代碼如下:

Mongo m = new Mongo("localhost", 27017);
 DB db = m.getDB("test");
 DBCollection coll = db.getCollection("student");
 
 /* 創建 $unwind 操作, 用于切分數組*/
 DBObject unwind = new BasicDBObject("$unwind", "$subjects");
 
 /* Group操作*/
 DBObject groupFields = new BasicDBObject("_id", new BasicDBObject("subjname", "$subjects.name").append("province", "$province"));
 groupFields.put("AvgScore", new BasicDBObject("$avg", "$subjects.scores"));
 DBObject group = new BasicDBObject("$group", groupFields);
 
 /* 查看Group結果 */
 AggregationOutput output = coll.aggregate(unwind, group); // 執行 aggregation命令
 System.out.println(output.getCommandResult());

輸出結果

{ "serverUsed" : "localhost/127.0.0.1:27017" , 
  "result" : [ 
   { "_id" : { "subjname" : "英語" , "province" : "海南"} , "AvgScore" : 58.1} , 
   { "_id" : { "subjname" : "數學" , "province" : "海南"} , "AvgScore" : 60.485} ,
   { "_id" : { "subjname" : "語文" , "province" : "江西"} , "AvgScore" : 55.538} , 
   { "_id" : { "subjname" : "英語" , "province" : "上海"} , "AvgScore" : 57.65625} , 
   { "_id" : { "subjname" : "數學" , "province" : "廣東"} , "AvgScore" : 56.690} , 
   { "_id" : { "subjname" : "數學" , "province" : "上海"} , "AvgScore" : 55.671875} ,
   { "_id" : { "subjname" : "語文" , "province" : "上海"} , "AvgScore" : 56.734375} , 
   { "_id" : { "subjname" : "英語" , "province" : "云南"} , "AvgScore" : 55.7301 } ,
   .
   .
   .
   .
   "ok" : 1.0
 }

統計就此結束.... 稍等,似乎有點太粗糙了,雖然統計出來的,但是根本沒法看,同一個省份的科目都不在一起。囧

接下來進行下加強,

支線任務: 將同一省份的科目成績統計到一起( 即,期望 'province':'xxxxx', avgscores:[ {'xxx':xxx}, ....] 這樣的形式)

要做的有一件事,在前面的統計結果的基礎上,先用 $project 將平均分和成績揉到一起,即形如下面的樣子

{ "subjinfo" : { "subjname" : "英語" ,"AvgScores" : 58.1 } ,"province" : "海南" }

再按省份group,將各科目的平均分push到一塊,命令如下:

$project 重構group結果

{$project:{province:"$_id.province", subjinfo:{"subjname":"$_id.subjname", "avgscore":"$AvgScore"}}

$使用 group 再次分組

{$group:{_id:"$province", avginfo:{$push:"$subjinfo"}}}

java 代碼如下:

Mongo m = new Mongo("localhost", 27017);
DB db = m.getDB("test");
DBCollection coll = db.getCollection("student");
       
/* 創建 $unwind 操作, 用于切分數組*/
DBObject unwind = new BasicDBObject("$unwind", "$subjects");
       
/* Group操作*/
DBObject groupFields = new BasicDBObject("_id", new BasicDBObject("subjname", "$subjects.name").append("province", "$province"));
groupFields.put("AvgScore", new BasicDBObject("$avg", "$subjects.scores"));
DBObject group = new BasicDBObject("$group", groupFields);
       
/* Reshape Group Result*/
DBObject projectFields = new BasicDBObject();
projectFields.put("province", "$_id.province");
projectFields.put("subjinfo", new BasicDBObject("subjname","$_id.subjname").append("avgscore", "$AvgScore"));
DBObject project = new BasicDBObject("$project", projectFields);
       
/* 將結果push到一起*/
DBObject groupAgainFields = new BasicDBObject("_id", "$province");
groupAgainFields.put("avginfo", new BasicDBObject("$push", "$subjinfo"));
DBObject reshapeGroup = new BasicDBObject("$group", groupAgainFields);
 
/* 查看Group結果 */
AggregationOutput output = coll.aggregate(unwind, group, project, reshapeGroup);
System.out.println(output.getCommandResult());

結果如下:

{ "serverUsed" : "localhost/127.0.0.1:27017" , 
 "result" : [ 
    { "_id" : "遼寧" , "avginfo" : [ { "subjname" : "數學" , "avgscore" : 56.46666666666667} , { "subjname" : "英語" , "avgscore" : 52.093333333333334} , { "subjname" : "語文" , "avgscore" : 50.53333333333333}]} , 
    { "_id" : "四川" , "avginfo" : [ { "subjname" : "數學" , "avgscore" : 52.72727272727273} , { "subjname" : "英語" , "avgscore" : 55.90909090909091} , { "subjname" : "語文" , "avgscore" : 57.59090909090909}]} , 
    { "_id" : "重慶" , "avginfo" : [ { "subjname" : "語文" , "avgscore" : 56.077922077922075} , { "subjname" : "英語" , "avgscore" : 54.84415584415584} , { "subjname" : "數學" , "avgscore" : 55.33766233766234}]} , 
    { "_id" : "安徽" , "avginfo" : [ { "subjname" : "英語" , "avgscore" : 55.458333333333336} , { "subjname" : "數學" , "avgscore" : 54.47222222222222} , { "subjname" : "語文" , "avgscore" : 52.80555555555556}]} 
  .
  .
  .
  ] , "ok" : 1.0}

您可能感興趣的文章:
  • 基于Django統計博客文章閱讀量
  • MongoDB 中聚合統計計算--$SUM表達式
  • django項目用higcharts統計最近七天文章點擊量
  • 使用django的ORM框架按月統計近一年內的數據方法
  • Golang 函數執行時間統計裝飾器的一個實現詳解
  • Vue自定義指令上報Google Analytics事件統計的方法
  • Golang 統計字符串字數的方法示例
  • 利用Celery實現Django博客PV統計功能詳解
  • Google 統計圖表(Flash)小插件
  • go語言之給定英語文章統計單詞數量(go語言小練習)

標簽:丹東 鶴崗 邯鄲 昭通 本溪 大理 景德鎮 吉安

巨人網絡通訊聲明:本文標題《MongoDB中強大的統計框架Aggregation使用實例解析》,本文關鍵詞  MongoDB,中強,大的,統計,框架,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《MongoDB中強大的統計框架Aggregation使用實例解析》相關的同類信息!
  • 本頁收集關于MongoDB中強大的統計框架Aggregation使用實例解析的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    欧美精品欧美精品系列| 国产不卡免费视频| 亚洲欧洲日韩一区二区三区| 久久网站热最新地址| 久久午夜老司机| 久久人人97超碰com| 久久五月婷婷丁香社区| 国产欧美日韩综合| 自拍偷拍国产精品| 亚洲免费在线观看视频| 亚洲午夜激情网页| 蜜桃精品视频在线| 国产一区二区三区国产| 不卡一区中文字幕| 91豆麻精品91久久久久久| 欧美日韩美少妇| 日韩亚洲欧美综合| 国产亚洲一区字幕| 亚洲视频在线一区观看| 亚洲国产精品一区二区尤物区| 亚洲成av人片| 九九**精品视频免费播放| 国内成人免费视频| 91影视在线播放| 欧美顶级少妇做爰| 久久精品无码一区二区三区| 中文字幕中文字幕在线一区| 香港成人在线视频| 国产高清视频一区| 欧美视频一二三区| 精品国产3级a| 亚洲一线二线三线视频| 国产综合久久久久影院| 色先锋久久av资源部| 26uuu亚洲综合色| 国产精品久久看| 免费成人av在线| av一区二区三区在线| 日韩视频免费观看高清完整版 | 日本久久一区二区三区| 日韩视频免费直播| 亚洲天堂网中文字| 精品一区二区在线观看| 色哟哟国产精品| 精品1区2区在线观看| 一区二区三区在线观看动漫 | 国产拍揄自揄精品视频麻豆| 亚洲一二三区在线观看| 国产呦精品一区二区三区网站| 在线亚洲一区观看| 欧美国产在线观看| 久久国产精品99久久人人澡| 日本精品一区二区三区高清| 久久综合狠狠综合久久激情| 亚洲大片在线观看| 色婷婷av一区二区| 亚洲欧洲99久久| 国产米奇在线777精品观看| 91精品在线观看入口| 亚洲一区二区四区蜜桃| 99精品一区二区| 久久精品夜色噜噜亚洲a∨| 美女网站色91| 制服丝袜日韩国产| 亚洲香蕉伊在人在线观| 欧美三级欧美一级| 一区二区三区欧美日| 91香蕉视频mp4| 国产精品色呦呦| 福利一区二区在线| 久久久99免费| 国产成人欧美日韩在线电影| 欧美精品一区二区三区四区| 蜜乳av一区二区| 欧美大肚乱孕交hd孕妇| 蜜桃一区二区三区在线| 日韩欧美国产一区在线观看| 日本系列欧美系列| 日韩精品在线网站| 国产高清不卡一区二区| 国产清纯白嫩初高生在线观看91| 国产69精品久久久久777| 亚洲国产精品ⅴa在线观看| 粉嫩av亚洲一区二区图片| 中文字幕不卡一区| 99国产精品久久久久久久久久久| 综合久久综合久久| 欧美日韩一区在线观看| 日韩vs国产vs欧美| 久久蜜桃av一区二区天堂 | 亚洲r级在线视频| 欧美日韩久久不卡| 紧缚奴在线一区二区三区| 国产偷v国产偷v亚洲高清| 99精品桃花视频在线观看| 亚洲精品免费在线| 日韩一区二区在线观看视频播放| 国产在线视视频有精品| 亚洲视频综合在线| 欧美一区中文字幕| 成人免费高清视频| 天天色天天爱天天射综合| 久久亚洲综合色一区二区三区| 成人精品一区二区三区四区| 亚洲午夜精品在线| 国产欧美一区二区精品秋霞影院| 一本到高清视频免费精品| 老司机精品视频导航| 国产精品国产自产拍在线| 欧美肥妇毛茸茸| 99re这里只有精品6| 老司机精品视频在线| 有码一区二区三区| 国产日韩亚洲欧美综合| 欧美视频一区在线| 成人不卡免费av| 久久精品国产亚洲高清剧情介绍| 国产精品成人在线观看| 精品免费一区二区三区| 欧洲一区在线电影| 国产福利电影一区二区三区| 无吗不卡中文字幕| 国产精品嫩草影院av蜜臀| 日韩亚洲欧美一区| 欧美日韩国产中文| 在线观看不卡一区| 99国内精品久久| 成人动漫视频在线| 国产精品中文字幕一区二区三区| 天天综合色天天综合色h| 亚洲精品免费在线观看| 中文字幕一区二| 国产色婷婷亚洲99精品小说| 欧美成人官网二区| 91精品国产一区二区| 欧美日韩国产首页在线观看| 色婷婷狠狠综合| 91麻豆文化传媒在线观看| 成人av网站免费| 福利视频网站一区二区三区| 国产99精品在线观看| 国产精品系列在线观看| 国产在线视视频有精品| 国产又黄又大久久| 国产美女精品在线| 国产麻豆欧美日韩一区| 国产精品一区不卡| 大美女一区二区三区| 国产精品资源在线观看| 黄色精品一二区| 国产在线麻豆精品观看| 国产精品一卡二卡在线观看| 国产一区视频网站| 国产精品一区三区| 盗摄精品av一区二区三区| 国产精品自在在线| 成人av免费观看| 色婷婷精品久久二区二区蜜臂av| 99精品国产视频| 欧美三级日本三级少妇99| 欧美一区二区性放荡片| 精品国产乱码91久久久久久网站| 精品国产第一区二区三区观看体验| 精品动漫一区二区三区在线观看| 欧美v日韩v国产v| 欧美高清一级片在线观看| 国产精品色噜噜| 一区二区三区四区在线播放| 日韩国产一二三区| 国产91综合网| 欧美在线免费视屏| 精品噜噜噜噜久久久久久久久试看 | 日韩丝袜情趣美女图片| 久久久精品tv| 亚洲一区二区av在线| 麻豆91精品视频| av在线免费不卡| 欧美剧情电影在线观看完整版免费励志电影 | 成人ar影院免费观看视频| 91久久久免费一区二区| 欧美成人一区二区三区在线观看| 国产精品夫妻自拍| 视频一区视频二区中文字幕| 国产成人av在线影院| 欧美影视一区二区三区| 久久久噜噜噜久久人人看| 亚洲一区在线电影| 国模少妇一区二区三区| 91福利区一区二区三区| 久久欧美中文字幕| 亚洲一区av在线| 成人18视频在线播放| 日韩欧美一区二区免费| 亚洲欧美日韩国产手机在线| 久久99精品国产.久久久久久| 91麻豆免费视频| 日本一区二区视频在线观看| 人人超碰91尤物精品国产| a亚洲天堂av| 国产日韩欧美精品综合|