描述性统计分析法(如何用Excel实现描述性统计分析)

访客3年前黑客文章462

什么叫描述统计?

描述统计剖析要对调研整体全部自变量的相关数据信息做统计分析性描述,关键包含数据信息的频数剖析、数据信息的集中化变化趋势、数据信息离散程度剖析、数据信息的遍布、及其一些基础的统计分析图型。

常见的指标值有平均值、中位值、众数、标准差、标准偏差这些。数据信息的集中化发展趋势一般选用均值、中位值表明。数据信息的离散程度一般选用标准差、标准偏差表明。数据信息的遍布状况一般选用条形图表明。

实际定义前一篇有做详细说明,也不过多阐释了。下面我将用Excel来各自表述每一种统计分析 *** 的运用及其这种统计分析 *** 在Excel中的完成 *** 。

Excel数据统计分析专用工具库

技术专业的数据分析专用工具有SPSS,R或Python,但针对绝大多数初学者一天两天较为难入门。始终别忘记全能的Excel,Excel 2016 里内置以了一个数据分析专用工具——“分析工具库”。事实上便是一个外界宏(程序流程)控制模块,专业为客户出示一些高級统计函数和好用的数据统计分析专用工具。

分析工具库位置了19个控制模块,能够分成下列几类:

载入EXCEL分析工具库

更先你得要有Excel 2016 。( 文尾有获得 *** )

安裝好2016版后,文档—选择项—转换到“载入项”菜单栏,在“管理 *** ”下拉框中挑选“EXCEL载入项”选择项,点击“转到”按键,自动跳转到以下“载入宏”提示框,启用“分析工具库”勾选框,再点击“明确”按键

之上一波实际操作后,“数据信息”菜单栏中会表明出加上的“数据统计分析”作用。

经典案例:

现在有一份北京房价数据信息:

1)北京市 *** 为管控房产价格,期待了解北京市各住宅小区房子价钱的遍布,请剖析房产价格的集中化发展趋势,并挑选适合的图型展现。

2)房地产开发商想要知道北京市每个外环线房子装修情况的比照状况,便于开展设计产品和市场开拓,测算指标值并设计方案适合的图型展现結果,最终给房地产开发商一些提议。

3)挑选适合的图型体现北京市每个区住宅小区房子遍布状况

操作流程:

基础描述统计开启excel数据库文件

挑选描述统计,点击“明确”按键。

接着,便会转化成以下的数据分析結果,就省多一个个涵数去测算了。

条形图

依据描述统计的結果,在空缺列结构间距为0.5的等差数列做为接受地区D1:D19,更高值为9,极小值为0。

挑选数据信息,点击“数据信息”菜单栏,挑选“数据统计分析”选择项框中的“条形图”选择项

键入地区挑选房子价钱avgprice列$B$2:$B$186,接受地区挑选之一步结构的读取数据,即D1:D19数据信息。

輸出地区挑选G3,启用数据图表輸出,随后点击“明确”按键。

选定全部条形图,右键单击挑选“设定数据信息系列产品文件格式”,点击“系列产品选择项”,归类间隔设成0。

能够看得出,北京的房价广泛遍布在2W~4.5W,2.5W占绝大部分。

有关条形图

条形图是描述统计中很普遍的一个运用,不一样条形图意味着的业务流程实际意义不一样。

箱型图

针对数据信息的离散变量状况,还有一个更形象化的方式,便是箱线图。箱线图运用6个指标值叙述数据信息的离散变量状况。这6个指标值分别是极小值,之一四分位数、中位值、第三四分位数与更高值和出现异常值。

中位值:中位值是一组由小到大排列数据信息中部位在最正中间的一个数据信息(2个数据信息取平均值)。

之一(下)四分位数:之一四分位数与中位值优化算法相近,是对一组数据信息中50%数据信息再取中位值。一组数据信息中如果有25%的数据信息低于这一数,那麼这一数是之一四分位数。

第三(上)四分位数:一组数据信息中如果有75%的数据信息低于这一数据信息,那麼这一数是第三四分位数。

出现异常值:出现异常值就是指这一数据信息与四分位数的差做到5倍的值。箱线图中出现异常值的表明方式有二种,1.5倍-3倍差中间用中空的点表明。超出3倍的出现异常值,用实心点表明。

限制和低限数:除开出现异常值以外,挨近上边沿和下边沿的2个标值为限制数和低限数。

如今来掌握北京各区的楼价剖析,把他生产加工成箱型图,这也是最常见的叙述统计图。

Excel 2016 能够立即制做箱型图。Excel的箱型图精准定位6个数据信息:更高值、极小值、中位值、上四分位数、下四分位数、均值,也有出现异常值。

操作流程:

1、挑选所要统计分析的数据信息,即平均价。

2、挑选箱型图

3、“挑选数据库”中,水准归类轴再加上“地区”,以下

调节一下款式获得以下箱型图。

正中间灰黑色出現是各地区中上游水准的楼价规范(中位值);x是全地区的平均房价水准(均值);箱形上方意味着上游水准;箱形下方意味着中上游水准,依此类推。简单点来说,楼价遍布被四等分了。

大家来讲解一下:北京朝阳区的楼价遍布范畴较广,高矮值差别很大,很有可能和跨过多环相关,总体平均坐落于四地区前端。北京海淀区平均房价其次,但都不低。丰台区房价遍布比较集中化且偏态较小,跨距相对性较小。成都市很显著总体楼价最少。

这幅图能一眼看得出许多 內容,想来大伙儿早已搞清楚箱线图的功效了,它能读出数据的总体遍布和歪斜发展趋势(偏态)。

到这儿,描述统计的內容就结束了。描述统计是分析数据的一种 *** ,包括数据信息的集中化衡量(平均值、中位值、众数)、数据信息的离散变量(标准差、标准偏差)、数据信息的遍布(箱线图、条形图、条形图)三块。

来源于:莫然blog,热烈欢迎共享文中!

相关文章

随着人工智能的不断发展 新加坡强调需要建立信任

随着人工智能的不断发展 新加坡强调需要建立信任

从工作杀手到杀手机器人,人工智能(AI)越来越成为其对人类生命潜在不利影响的焦点。然而,新加坡正在倡导在技术不断发展的同时推迟判断的必要性,而是将重点放在建立信任上。 新加坡通信和信息部长兼贸易...

神一样的运营经理:把脉高手与测试狂人二者兼顾

神一样的运营经理:把脉高手与测试狂人二者兼顾

神一样的运营司理,首先是一个切脉好手,其次是一个测试狂人。二者缺一不行。 “雪绒,你说说你是那边人?” “南京!” “我擦,怎么会这样、不行能呀……” 慕容雪菲成婚那天,特意给运营人布置了一桌酒肉。曾...

safari是什么意思(苹果手机的safari怎么使用)

  假如你第一次用上Safari,坚信很多人跟二师兄全是一个念头,它是什么玩意儿?兄弟花了几千买的iPhone,电脑浏览器就那么……“简单”啊?!   的确,大家开启Safari后,能见到就仅有以下...

企业风控管理怎么做(企业风控管理现状及改进措施)

企业风控管理怎么做(企业风控管理现状及改进措施)

第一章 汉合房地产开拓有限公司风控打点制度总则 第1条为成立类型、有效的风险节制体系,类型公司风险打点,提高风险防御本领,担保公司安详、稳健运行,提高策划打点程度,团结公司的实际环境,拟定本步伐。...

微信强制查看对方位置_专业代封微信号网站

  梅开二度什么意思(梅开二度的由来典故)梅开二度,指同一件事成功地做到两次,通常接连两次喜事都可以叫“梅开二度”。此成语在足球很常见,意指在足球比赛中一名足球员在一场赛事中进两球。梅开二度实源于惜阴...

昆凌奶奶长什么样 昆凌奶奶个人资料简介

近日周董和周杰伦老婆一起亮相为周杰伦老婆姥姥庆贺九十岁生日,从相片上看周杰伦老婆姥姥的五官十分震撼和漂亮,年轻的时候也是一位大美女。那麼周杰伦老婆姥姥长什么样 周杰伦老婆姥姥个人信息介绍。产生有关详...