从数据到大数据,数据技术工具的演变

访客4年前黑客文章813

编辑导语:大数据近些年来是一个十分火热的话题,关于大数据的文章也是数不胜数。本文作者通过梳理本身看过的大数据相关的资料和书籍,为我们先容了从“小数据”演化为“大数据”的进程是奈何的?而且分享了一些数据技能以及东西。

从数据到大数据,数据技能东西的演变

对付大数据,叮当一直都很感乐趣,最近正亏得看数据相关的书和资料,就把这些对象梳理了一下。本文将用4张逻辑图为主线,简朴先容一个产物从“小数据”演化为“大数据”的进程,及大概用到的东西。

本文焦点逻辑:

从数据到大数据,数据技能东西的演变

一、一个简略版互联技能架构

假设我们要搭建一个小网站,在不利用成熟SaaS产物的前提下,我们的产物内里最少要有以下两个部门:

从数据到大数据,数据技能东西的演变

1. 客户端

可以是APP,小措施,甚至是一个Web网站,作为进口给我们的用户会见。

2. 处事端

处事端包罗应用处事器和数据库,应用处事器用来陈设应用端措施,处理惩罚前端请求,并举办处事响应;数据库用来存储数据,处事器通过专门与数据库交互的措施对数据库举办读写操纵(如:SQL)。

1. 我们是如何与技能系统交互的?

假设一个场景:张三打开了一个小网站,打开后呈现了登录界面,张三输入本身的账号和暗码之后点击“登录”,这时客户端会发送给处事端一个请求,查询一下数据库里有没有张三的账号信息。

假如数据库有的话张三就能登录乐成,可以利用小网站了;假如数据库没有张三的账号信息,大概就会引导张三先举办注册,注册乐成后数据库中的用户表中就会新增一条张三的信息,张三就能愉快的利用小网站了。

我们通过客户端进口与这个系统交互,我们通过操纵客户端界面,对处事端举办请求拉取处事器&数据库中的信息,给以我们反馈。

2. 处事器与数据库有什么区别?

一般我们常称为“处事器”的全称叫“应用处事器”,数据库全称叫“数据库处事器”,它们都是处事器,只是由于应用情况的差异,需要的机能差异做了区分。

数据库处事器的处理惩罚器机能要求较量高,因为其要举办频繁的操纵,内存要求大,加速数据存取速度,应用处事器相对而言要求低一些。

3. 常用数据库有哪些?

常用数据库主要有“干系型数据库”和“非干系型数据库”:

1)干系型数据库

折射现实中的实体干系,将现实中的实体干系拆分维度,通过干系模子表达出来(表及表与表之间的干系),常用的有MySQL(开源数据库)、SQL Server(微软家的)、Oracle(甲骨文家的,有完善的数据打点成果可以实现数据客栈操纵)。

2)非干系型数据库

一种相对松散且可以不按严格布局类型举办存储的数据库,一边叫NoSQL(常用的有mongoDB、 CouchDB,在MongoDB中利用键值对的 *** 暗示和存储数据,键值雷同干系型数据库表中的字段名对应的值,在MngoDB中,利用 *** ON名目标数据举办数据暗示和存储)。

二、跟着用户增长技能架构的进级

从数据到大数据,数据技能东西的演变

小网站的用户逐渐越来越多,小网站酿成了大网站,单个处事器的负载很快就到了极限,这时就需要增加多台处事器,构成处事器组,同时引入负载平衡处事器,对流量进动作态分派。

由于数据是互联网产物的焦点资产,为了担保系统数据的安详性,还需要增加数据备份处事器,多台数据库处事器同时运行,这样哪怕一个数据库出问题了,也不会影响业务正常运转。

三、数据客栈的降生

从数据到大数据,数据技能东西的演变

跟着产物用户量越来越大,市场竞争也越发剧烈,急切需要越发精确的计谋决定信息,数据库中的数据固然对付产物的运营很是有用,但由于布局巨大,数据脏乱,难以领略,缺少汗青,大局限查询等问题对贸易决定和方针拟定的浸染甚微。

在更好的发挥数据代价,1990数据客栈之父比尔·恩门(Bill Inmon)提出了“数据客栈”的观念,构建一种对汗青数据举办存储和阐明的数据系统,支撑企业的贸易阐明与计谋决定。

1. 数据客栈的实现道理是什么?

数据客栈的数据来历凡是是汗青业务数据(订单数据、商品数据、用户数据、操纵日志、行为数据……),这些数据统一汇总存储至企业数据客栈,通过对客栈里的综合数据举办有目标的阐明支撑业务决定。

2. 数据库与数据客栈有什么区别?

数据库是对及时数据举办存储和事务性处理惩罚的系统,而数据客栈则是为了阐明而设计。

3. 数据客栈与大数据客栈有什么区别?

相关文章

文案不会写?8年总结5个步骤,小白请收好!

文案不会写?8年总结5个步骤,小白请收好!

不仅互联网从业者需要文案写作,各行各业基本都需要文案写作。本篇文章中,作者结合自身工作经验,梳理总结了文案高效学习五步骤,与大家分享。 文案是个抽象的东西,越是抽象的东西,学习起来越是困难,你有同感...

社区团购的幸运者偏差

社区团购的幸运者偏差

编辑导读:糊口中布满了幸存者毛病的状况,可是只要你能意识到这个问题地址,穿破问题外貌深入挖掘,就能相识到工作的真像,不被成见所蒙蔽。巨头围猎,社区团购正热门,但想要做好这弟子意平台并不简朴,企业必需找...

深度分析:微信视频号的不足及未来展望

深度分析:微信视频号的不足及未来展望

本文作者从产品用户、内容创作和产品体验三个方面出发,对微信视频号目前存在的一些问题进行了深度剖析,并分享了自己的改进猜想。 官方对视频号的定义是这样的:视频号是人人可记录和创作的内容平台,是了解他人...

产品分析 | 千亿美金赛道的流量猛兽——作业帮

产品分析 | 千亿美金赛道的流量猛兽——作业帮

本文主要分析在线教育产品作业帮的产业链、核心业务和产品结构,以及对作业帮的运营策略和成功经验进行了分析探讨。 2020年3月21日,国内用户规模最大的在线教育平台作业帮APP,日活跃用户数突破410...

知乎引流,看懂这篇文章你就出师了

知乎引流,看懂这篇文章你就出师了

知乎引流如何做?这个问题有点宽泛,本文作者团结自身实际履历,分享了详细的留意事项和操纵要领,但愿可以或许对你带来些辅佐。 最近几个月我一直在研究知乎引流的一些要领和套路,根基上看过了市面上所有知乎引...

新消费经济时代,老字号怎么玩?

新消费经济时代,老字号怎么玩?

编辑导读:新消费时代,有一批新品牌凭借着产物、营销脱颖而出,火爆市场,也有一批老字号品牌在寻找打破。想在新的时代抓住年青用户,他们是怎么做的?存在着哪些问题?本文作者对此展开了梳理阐明,一起来看看~...