Redis中统计各种数据大小的方法

时间：2020-03-04 08:10:21 作者：ARPLEN 综合材料收藏本文下载本文

“ARPLEN”通过精心收集，向本站投稿了8篇Redis中统计各种数据大小的方法，下面是小编为大家推荐的Redis中统计各种数据大小的方法，欢迎阅读，希望大家能够喜欢。

目录
第1篇：Redis中统计各种数据大小的方法第2篇：linux中配置安装redis方法介绍linux操作系统第3篇：统计数据挖掘的方法及应用第4篇：WPS表格中筛选统计数据第5篇：提高环境统计数据质量方法的探讨第6篇：负数比较大小的方法第7篇：江河湖海怎么区分大小方法是什么第8篇：分数大小比较方法课件

篇1：Redis中统计各种数据大小的方法

这篇文章主要介绍了Redis中统计各种数据大小的方法,本文使用PHP实现统计Redis内存占用比较大的键,需要的朋友可以参考下

如果 MySQL 数据库比较大的话，我们很容易就能查出是哪些表占用的空间；不过如果 Redis 内存比较大的话，我们就不太容易查出是哪些（种）键占用的空间了，

有一些工具能够提供必要的帮助，比如 redis-rdb-tools 可以直接分析 RDB 文件来生成报告，可惜它不能百分百实现我的需求，而我也不想在它的基础上二次开发。实际上开发一个专用工具非常简单，利用 SCAN 和 DEBUG 等命令，没多少行代码就能实现：

代码如下:

<?php

$patterns = array(

‘foo:.+‘,

‘bar:.+‘,

‘.+‘,

);

$redis = new Redis;

$redis->setOption(Redis::OPT_SCAN, Redis::SCAN_RETRY);

$result = array_fill_keys($patterns, 0);

while ($keys = $redis->scan($it, $match = ‘*‘, $count = 1000)) {

foreach ($keys as $key) {

foreach ($patterns as $pattern) {

if (preg_match(“/^{$pattern}$/”, $key)) {

if ($v = $redis->debug($key)) {

$result[$pattern] += $v[‘serializedlength‘];

}

break;

}

var_dump($result);

当然，前提是你需要提前总结出可能的键模式，简单但不严谨的方法是 MONITOR：

代码如下:

shell>/path/to/redis-cli monitor |

awk -F ‘“‘ ‘$2 ~ ”ADD|SET|STORE|PUSH“ {print $4}‘

此外，需要注意的是：因为 DEBUG 返回的 serializedlength 是序列化后的长度，所以最终计算的值小于实际内存占用，但考虑到相对大小依然是有参考意义的，

篇2：linux中配置安装redis方法介绍linux操作系统

今天想搞一下自己机器的性能所在要安装redis了，下面我把我安装redis方法与过程分享给各位同学，希望此方法对大家会有所帮助，

redis的安装不需要 ./configure, 这点比较好，简单！

代码如下复制代码

#下载

wget redis.googlecode.com/files/redis-2.6.14.tar.gz

#解压

tar -zxvf redis-2.6.14.tar.gz

#拷贝到目标目录

mkdir -p /usr/local/redis

cp -r ./redis-2.6.14 /usr/local/redis

cd /usr/local/redis

#安装

make && make install

装好了之后，

./conf 配置文件

./src/redis-server redis 的server

./src/redis-client redis客户端

【改配置】

这个时候 redis 已经是可以启动了

界面比较的漂亮，但是用起来不方便，我们需要把它改成后台运行的：

打开redis.conf 找到daemonize no 改为 daemonize yes 就OK了，其他的配置先用默认的吧！

然后就可以启动了：

view sourceprint?

1 /usr/local/redis/src/redis-server /usr/local/redis/redis.conf

然后看一下redis的进程:

已经启动起来了，用的默认的6379端口，

然后最好加一个开机启动动，在 /etc/rc.d/rc.local 最下边加一行刚才的启动命令，这样就不会出出现忘记启动的意外了

【安装php扩展】

装过了其他的PHP扩展之后，发现装php扩展是太简单了，每一个扩展，只用 phpize && ./configure && make && make install ，最后再改一下php.ini就OK了

代码如下复制代码

1 wget github.com/owlient/phpredis/archive/master.zip

2 unzip master.zip

3 /usr/local/php/bin/phpize

4 ./configure --with-php-config=/usr/local/php/bin/php-config

5 make && make install

然后在php.ini中加一行：

代码如下复制代码

[redis]

extension=redis.so

就OK了

这样PHP就可以使用 redis 相关的类了

性能

下面是官方的bench-mark数据：

测试完成了50个并发执行100000个请求。

设置和获取的值是一个256字节字符串。

Linux box是运行Linux 2.6,这是X3320 Xeon 2.5 ghz。

文本执行使用loopback接口(127.0.0.1)。

结果:写的速度是110000次/s,读的速度是81000次/s 。

篇3：统计数据挖掘的方法及应用

摘要：在我国，经济统计工作的进行是为了有效地反映经济发展状况，为决策者提供有效决策的依据。

因此，统计部门在进行经济统计时必须重视经济统计信息的准确性和可靠性。

统计数据挖掘技术可以从混乱、纷繁的数据中提取关键的信息与知识，有利于过程控制、决策支持、查询优化、信息管理等工作的顺利开展，在信息爆炸的时代具有十分重要的应用价值。

因此，分析统计数据挖掘的方法，探究统计数据挖掘技术的恰当应用是非常必要的。

关键词：统计数据挖掘;聚类分析方法;统计基础方法

数据挖掘是由数据采集、数据处理、数据规则知识表达和知识应用与服务等几个方面组成。

其中，数据采集是基础，数据处理是关键，数据规则知识表达是形式，知识应用与服务是目的。

现实世界中的大部分数据是有污染的，任何对数据的分析和挖掘都是建立在或多或少的病态数据基础上的，没有好的数据，就不可能提供可靠的规则和知识。

规则往往是被大量复杂的数据项隐藏，有些数据是冗余的，有些数据是完全无关的，它们的存在有可能影响到有价值规则的发现，这必然要求我们在数据处理过程中把好数据关，即选择什么样的数据，如何进行数据清理，对选择好的数据如何处理、要进行哪些处理，只有过好数据关才能保证整个基于统计分析的数据挖掘工作的顺利完成。

一、数据挖掘技术的概念及特征

数据挖掘技术，简单地说就是从大量的数据信息中挖掘出有用的信息。

这里大量的数据信息通常被认为是不完全的、模糊的、有噪音的、随机的，是完全没有加以处理的信息。

而挖掘之后呈现的就是有效的、潜在有用的、新颖的信息。

这样的一个变化过程，也常常被认为是数据挖掘。

数据挖掘，可以是经济信息转换的一个过程，还可以是一门交叉的学科。

数据挖掘是一门涉及面广的学科，包括机器学习、神经网络、数据库、数据统计等等，现在广泛应用于统计界。

数据挖掘作为一个信息转换的过程，其大体的步骤是：数据准备――数据挖掘――结果分析总结。

数据挖掘的主要功能是：分类、预测模型、数据聚类、数据总结等。

数据挖掘的特点，同时又是数据挖掘的优点有以下几点：其一，处理的数据量巨大;其二，具有自动找寻信息的功能;其三，能够有效地描绘过去和预测未来;其四，信息反映快捷及时。

数据挖掘常常采用的一些技术有：关联规则方法、聚集检测、记忆基础推理方法、链接分析等等。

二、统计数据挖掘的内容

随着统计信息化工程的'进展，各地市统计系统的数据库建设正在紧锣密鼓地进行，有的已经开始，有的正在酝酿之中。

一般小型数据库采用了FoxPro、Access等数据库软件，大型数据库采用了oracle系统，同时一些大型企业也都建立了自己的统计数据库。

另外还有基于Web的统计数据库系统，这些不同数据源收集的统计信息，通过数据清理、数据变换、数据集成、数据装人和定期数据刷新就构成了一个大型的统计数据仓库，为统计数据的挖掘创造了条件。

具体来讲统计数据挖掘的内容有：

(一)时间序列数据序的挖掘

时间序列数据库是存放随时间变化序列值的数据库，包括反映月度、季度变化的进度数据库以及年度数据库，由于这些数据是经过长期历史积累形成的，因此显得尤其珍贵。

其中有些是反映国家或某一地区国家经济和社会发展的，出现在各种统计年鉴中的，有些是反映企业的生产、销售、成本等状况的，有些是反映市场状况的，如交易状况。

通过对时间序列数据库的挖掘，可以发现数据库中对象演变特征或对象的变化趋势，以及相互之间的长期均衡的各种关系，利用这些信息可以进行有关预测及决策和进一步的定量分析。

(二)截面数据库的挖掘

截面数据库是存放同一时间上不同个体数据指标的数据库，包括不同省市、城市、县镇区的宏观经济指标数据库，也包括不同企业、家庭及居民的各种行为指标数据库，反映了不同个体之间的差异性及特殊性。

通过对截面数据库的挖掘，可以发现不同个体之间呈现出的各种规律及量化关系，以及通过统计中的聚类分析、判别分析，对不同个体进行分类，还可以进行孤立点分析，判别出那些数据与数据的一般行为或模型不一致，例如可以发现信用卡欺诈、为骗取保险金的伪保险、交易中的违规交易等。

(三)统计信息数据库的挖掘

统计信息涵盖了国家社会、经济、科技信息的主要方面，是国家重要的基本信息资源。

统计工作信息化的建设一直是各级统计部门工作中的重点，已经初具规模，有FoxPro为系统的小型信息数据库，也有oracle大型数据库管理系统，此外，还开发引进了一些通用的和专用的报表处理、统计报表排版、统计分析等应用较件，各种统计信息资源应有尽有。

同是大型企业也十分重视建立统计信息管理系统，主要用于企业内部的统计业务处理和向上级公司和政府机关上报报表。

通过对统计信息数据库的挖掘，可以全方位掌握和了解最新的国民经济、社会发展、企业景气状况的动态，为政府和企业的决策服务。

(四)统计普查数据库的挖掘

普查是专门组织的一次性全面调查，是全面系统地掌握国情国力统计资料的重要途径。

例如工业普查、农业普查、人口普查、物质库存普查、工作设备普查等等。

由于进行普查的工作量大，需要动员较多的人力、物力，组织一次很不容易，因此普查的统计资料就显得尤为珍贵，需要对普查后的数据整理、保存，建立相关统计普查数据库，通过对统计普查数据库的挖掘，可以掌握相关的真实数据，从普查中提炼出有价值的信息。

(五)抽样调查数据库的挖掘

在社会经济现象中，有很多现象，是无法进行全面调查的，有些也不必要进行全面调查，这样抽样调查的方法就显得比较重要，它较全面调查有节省人力、财力，速度快等优点。

由于抽样调查需要事先设计好抽样框，要体现出随机性原则，因此随机抽样，并不是简单地抽取，要完成一次好的随机抽样也并不是易事，抽样调查的结果也非常有价值，抽样调查的结果保存在计算机中，就形成了抽样调查数据库。

通过抽样调查数据库的挖掘可以及时了解社会经济，特别是居民生活方面的现实状况，对企业来讲可全方位地了解市场信息及市场行情。

三、统计数据挖掘的方法及应用探析

(一)统计基础方法

数据挖掘经常能够用到统计的基础方法，例如，用直方图和茎叶图对样本数据作描述;数据结构的基本特征可以用数据的集中频次和频率进行描述;数据中心可以用均值、中位数和众数进行描述;数据的离散特征可以用极值与百分位点等进行点状描述;数据的离散特征可以用极差和离差进行区间描述;数据特征的综合描述可以用样本方差或箱形图等。

此外，数据挖掘中，还广泛的应用了回归分析，回归又包括线性回归和非线性回归。

线性回归是最简单的回归形式。

双变量回归是将一个随机变量看作另一个随机变量的线性函数。

非线性回归用于描述变量间的曲线性式关系。

回归分析表明了数据间的相关关系，为进一步的数据分析提供了依据。

(二)聚类分析方法

在模式类型无法得知的情况下，可以运用聚类分析法进行分类、识别。

按照模式间的相似程度进行自动分类的聚类分析法，能够将相似度大的模式归为一类。

聚类分析法有凝聚算法、分裂算法、增量聚类和划分聚类。

例如，层次方法就是按照一定的层次分解给定的数据对象集合，可以分为分裂层次方法和凝聚层次方法。

聚类分析法适用于分析样本之间的内部关系，合理的评价样本结构。

此外，孤立点的检测也可以应用聚类分析。

聚类是为了将某个对象从大量的数据中分离出来，不是简单地将数据集聚在一起。

目前，聚类分析广泛应用于图像处理、模式识别、经济分析等多个领域。

(三)粗集方法

在缺少数据先验知识的情况下，例如隶属函数、隶属度和概率分布等，直接从给定的问题出发，问题的近似域确定可以运用不可分辨类与不可分辨关系，找出问题中存在的规律。

粗集理论和证据理论、神经网络、模糊集等一样都是进行不确定性计算的重要理论方法，粗集方法在数据挖掘中有着广泛的应用，在残缺、模糊信息和知识的分类与获取上有着较大的应用优势，比较有代表性的方法有：统计检验方法;单规则离散器方法;信息嫡方法等。

这些方法都各具特点，但又存在着一个共同的缺陷――每个属性的离散化过程是各自独立的，这忽视了不同属性之间的关联，进而导致离散的结果中包含了不合理或冗余的分割点。

四、结束语

可以确信，如果数学是统计方法的首要工具，那么以计算机和网络为代表的信息技术，正在成为统计应用的首要工具。

随着统计学与现代信息技术的融合，在方法上不断进行新的探索，一定会为统计学和数据挖掘未来的发展开辟一片新的天地。

参考文献：

[1]陈凤兰.数据挖掘技术在经济统计中的应用[J].现代商业,,05

[2]吴慧香.数据挖掘在财务风险警报系统中的应用[J].财会通讯,,02

[3]丁卫平,王杰华,管致锦.基于数据挖掘技术的教学评估智能辅助决策平台的设计与实现[J].电化教育研究,,04

[4]李占宣.数据库中面向复杂应用的查询方法[J].电脑学习,2009,04

篇4：WPS表格中筛选统计数据

WPS表格的自动筛选操作非常简单，选中表格中任意单元格，执行‘数据’菜单中的‘筛选’-‘自动筛选’命令。此时，每一个列标题右侧均出现一个下拉按钮。

下拉按钮

要求A：列出英语成绩为98分的学生成绩：

操作步骤：点击列标题‘英语’右侧下拉按钮，选择下拉菜单中的‘98’即可。

注意，这时英语成绩不是98分的学生成绩都被隐藏起来，并不是被删掉了。自动筛选后的结果是只显示满足指定条件的行、把不满足指定条件的行隐藏起来。

如果需要显示全部，那么请执行‘数据’菜单中的‘筛选’-‘显示全部’命令，

要求B：列出政治成绩在60分以上的学生成绩：

操作步骤：点击列标题‘政治’右侧下拉按钮，选择下拉菜单中的‘自定义’，弹出‘自定义自动筛选方式’对话框，选择‘大于’，输入‘60’后单击‘确定’。

要求C：列出语文成绩大于等于60分并且小于85分的男生成绩

操作步骤：点击列标题‘语文’右侧下拉按钮，选择下拉菜单中的‘自定义’，弹出‘自定义自动筛选方式’对话框，选择‘大于或等于’，输入‘60’，选择‘与’的关系后，选择‘小于’，输入‘85’，单击确定。

点击列标题‘性别’右侧下拉按钮，选择‘男’，这时，只是鼠标轻轻点击几下，符合要求C的结果已被筛选出来。

以上就是利用WPS表格的筛选功能来完成学生成绩的统计工作。其实方法很简单，只要你的基本数学常识没问题的话，就可以统计出你想要知道不同分数段的男女人数。希望以上的内容对你有所帮助。

篇5：提高环境统计数据质量方法的探讨

关于提高环境统计数据质量方法的探讨

环境统计覆盖面广,牵涉多方面利益.目前,环保部门监管存在缺位、不到位,个体数据错漏较多,同时,部分环保部门在统计工作中弄虚作假,导致汇总结果误差较大.改进核算方法,改变统计是数字汇总的传统观念,通过综合评估,宏观调控,能有效地提高数据质量,可操作性强.

作者：潘烁陈刚宁王彦刚 PAN Shuo CHEN Gang-ning WANG Yan-gang 作者单位：潘烁,PAN Shuo(广东省环境保护监测中心站,广州,510045)

陈刚宁,王彦刚,CHEN Gang-ning,WANG Yan-gang(广东省环境信息中心,广州,510630)

刊名：环境科学与技术 ISTIC PKU英文刊名：ENVIRONMENTAL SCIENCE & TECHNOLOGY 年，卷(期)： 28(z2) 分类号：X32 关键词：环境统计抽样推算总量测算分级核算下算一级

篇6：负数比较大小的方法

负数是数学术语，指小于0的实数，如-3。负数是同绝对值正数的相反数。任何正数前加上负号都等于负数。在数轴线上，负数都在0的左侧，所有的负数都比自然数小。负数用负号（Minus Sign，即相当于减号）“－”标记，如-2，-5.33，-45，-0.6等。

据史料记载，早在两千多年前,我国就有了正负数的'概念，掌握了正负数的运算法则。人们计算的时候用一些小竹棍摆出各种数字来进行计算。比如，356摆成||| ，3056摆成等等。这些小竹棍叫做“算筹”算筹也可以用骨头和象牙来制作。我国三国时期的学者刘徽在建立负数的概念上有重大贡献。刘徽首先给出了正负数的定义，他说：“今两算得失相反，要令正负以名之。”意思是说，在计算过程中遇到具有相反意义的量，要用正数和负数来区分它们。

篇7：江河湖海怎么区分大小方法是什么

江河湖海怎么区分大小

1、江”和“河”没有什么区别，只是人们常用的习惯。在中国古代汉语言中，“江”zhi常代指长江，“河”常代指黄河，而对于其他的江河，则必须说出全称，如“湘江”、“黑龙江”、“塔里木河”、“资水”、“汉水”等。可见，“江”、“河”、“水”并没有本质上的区别。一般情况下，在我国境内，通常把注入内海或者湖泊的河流叫河。例如：黄河，注入渤海叫河;

辽河，注入渤海叫河;塔里木河，注入罗布泊，也叫河，等等。而通常把注入外海或大洋的河流叫江。例如：长江注入黄海，叫江;珠江，注入南海叫江，等等。我们也可看一下其它的河流：黑龙江，珠江，乌苏里江，怒江，萨尔温江，钱塘江，雅鲁藏布江……

2、“湖”只的是在陆地上的一个水系，它与江河的区别是，湖泊必须是具有一定的几何形状，而不能像江河那样是线性的。当然，湖的几何形状可以千差万别，大小也是千差万别，但是“湖”都是面状的`，而不像河那样是线状的。湖有内流湖和外流湖之分。如我国的洞庭湖属于外流湖，而青海湖则是内流湖。

江河湖海从大到小分别是什么

海最大,河最小

湖泊定义：陆地上洼地积水形成的、水域比较宽广、换流缓慢的水体.在地壳构造运动、冰川作用、河流冲淤等地质作用下,地表形成许多凹地,积水成湖。露天采矿场凹地积水和拦河筑坝形成的水库也属湖泊之列,称人工湖.湖泊因其换流异常缓慢而不同于河流,又因与大洋不发生直接联系而不同于海.在流域自然地理条件影响下,湖泊的湖盆、湖水和水中物质相互作用,相互制约,使湖泊不断演变.

江定义：江,江水(河流)也.长江是世界第三大河。

篇8：分数大小比较方法课件

分数大小比较方法课件

一、复习旧知，温故而知新

1. 师：什么是分数，你能举几个例子吗？

2. 谁能读一读这几个分数，并说一说它各部分的名称。

二、小组合作，探究新知

如何比较分母相同的分数？

1.拿出一张长方形的纸，让学生平均分成4份，用彩笔涂出期中的一份。

2. 用分数表示出涂出的1份。1/4

3. 生汇报，师板书1/4

4. 拿出一张长方形的纸，让学生平均分成4份，用彩笔涂出期中的3份。

5. 用分数表示出涂出的3份。

6. 生汇报，师板书 3/4

7.让学生观察比较得出这两个分数的大小。

8.师提问：怎样比较这两个分数的大小？

9.引导学生得出结论：分母相同的分数，分子大，分数就大，分数就小。分子小，分数就小。

如何比较分子相同的分数？

1.拿出一张长方形的纸，让学生平均分成4份，用彩笔涂出其中的1份。

2. 用分数表示出涂出的1份。

3. 生汇报，师板书 1/4

4. 拿出一张长方形的纸，让学生平均分成2份，用彩笔涂出期中的1份。

5. 用分数表示出涂出的1份。

6. 生汇报，师板书 1 /2

7.让学生观察比较得出这两个分数的大小。

8.师提问：怎样比较这两个分数的大小？

9.引导学生得出结论：分子相同的分数，分母大，分数就小，分母小，分数就大。

三．巩固练习，强化新知分母相同的分数，

1.完成课后练习的第一小题，独立完成，然后指名汇报。

2.以抢答形式完成做一做第二小题，再汇报。

3.独立完成96页的第三题，再汇报自己的`想法。

4.独立完成96页的第四题，再汇报自己的想法。

5.独立完成96页的第六题，说说自己的想法。

四、讨论总结

1.说一说本节课你学会了什么，你有什么收获？

2你对分数有哪些了解了？

教学反思

本节课的内容是在学生已经学习过看图形比较同分母分数的大小和分子是1的异分母分数的大小比较的基础上进行的，比较的分数范围扩大到同分子的异分母分数。同分母分数和同分子分数比较大小的方法，是比较分数大小的最基本方法，基本方法必须牢固、准确地掌握。

教学设计时，不仅考虑到让学生掌握比较的方法，更注重让学生从分数的意义、分数单位的意义上来理解“为什么要这样比”的算理，所以教学过程中安排了直观图形、动手折叠等，使学生对算理的理性认识有充分的感知基础，同时也培养了学生动手操作，观察比较和概括问题的能力。并在此同时理解通分并学会通分的方法。教学时我主要做到以下几点：

一、复习旧知识启发新知识，符合学生的认知规律，既能达到以问促学的目的，又激发了学生的求知欲。

二、让学生说出自己的想法，总结归纳结论。让学生在观察中充分感知，展开思维，尝试发现。这样既减缓了教学坡度，又培养了学生探索、分析、归纳的能力，从而突破了难点。

三、学生通过尝试解答、自我训练、自我检查，培养了独立自学和思考的能力。

四、提倡用多种方法比较分数大小，通过比较分析，选择最简便的方法。

★ redis的个人学习总结

★ 英文简历中描述性格方法

★ 大小的英文翻译

★ Redis总结笔记（一）：安装和常用命令