先办事黑客在线接单专业黑客接单qq免费接单黑客

访客4年前黑客文章1012

Facebook一直是大数据技术最积极的应用者,因为它拥有的数据量极其巨大,一份资料显示2011年它拥有的压缩数据已经有25PB,未压缩数据150PB,每天产生的未压缩的新数据有400TB。在Facebook,大数据技术被广泛应用在广告、新闻源、消息/聊天、搜索、站点安全、特定分析、报告等各个领域。Facebook也是Apache大数据开源项目的更大贡献者之一。Facebook是2007年前后正式转向Hadoop计算框架,随之它向Apache基金会贡献了大名鼎鼎的Hive、ZooKeeper、Scribe、Cassandra等开源工具,当前Facebook的开源进程仍在积极推进着。Facebook大数据技术架构经历了三个演变阶段。

Facebook早期的大数据技术架构是建立在Hadoop、HBase、Hive、Scribe等开源工具基础上的。日志数据流从HTTP服务器产生,通过日志收集系统Scribe耗费秒级时间传送到共享存储NFS文件系统,然后通过小时级的Copier/Loader(即MapReduce作业)将数据文件上传到Hadoop。数据摘要通过每天例行的流水作业产生,它是基于Hive的类SQL语言开发,结果会定期会更新到前端的Mysql服务器,以便通过OLTP工具产生报表。Hadoop集群节点有3000个,扩展性和容错性方面的问题能够很好地解决,但是早期系统的主要问题是整体的处理延迟较大,从日志产生起1~2天后才能得到最终的报表。

Facebook当前的大数据技术架构是在早期架构基础上对数据传输通道和数据处理系统进行了优化,如图所示,主要分为分布式日志系统Scribe、分布式存储系统HDFS和HBase、分布式计算和分析系统(MapReduce、Puma和Hive)等。

其中,Scribe日志系统用于聚合来自大量HTTP服务器的日志数据。Thrift是Facebook提供的软件框架,用于跨语言的服务开发,能够在C 、Java、PHP 、Python和Ruby等语言之间实现无缝的支持。采用Thrift RPC来调用Scribe日志收集服务进行日志数据汇总。Scribe Policy是日志流量和模型管理节点,将元数据传送给Scribe客户端和Scribe HDFS,采集的日志数据存储在Scribe HDFS。Facebook对早期系统优化后的数据通道称为Data Freeway,能够处理峰值9GB/s的数据并且端到端的延迟在10s以内,支持超过2500种的日志种类。Data Freeway主要包括4个组件,Scribe、Calligraphus、Continuous Copier和PTail。Scribe用于客户端,负责通过Thrift RPC发送数据;Calligraphus在中间层梳理数据并写到HDFS,它提供了日志种类的管理,利用Zookeeper进行辅助;Continuous Copier将文件从一个HDFS拷贝到另一个HDFS;PTail并行地tail多个HDFS上的目录,并写文件数据到标准输出。在当前架构中,一部分数据处理仍然以批处理的方式通过MapReduce进行小时级的处理,存储在中央的HDFS,每天通过Hive进行分析处理。另一部分接近实时的数据流则通过Puma来进行分钟级的处理。Facebook对专门分析提供Peregrine(Hipal)工具、对周期性分析提供Nocron工具进行分析。

Facebook未来的大数据技术架构的雏形已经出来。首先开源的是可能替代Hadoop系统中MapReduce的Corona,类似于Yahoo提出的YARN。Corona更大的一个进步是其集群管理器做到了基于CPU、内存和其他作业处理的需求资源的管理,这可以使得Corona既可以处理MapReduce 作业,也可以处理非MapReduce 作业,使Hadoop集群的应用领域更加广泛。二是Facebook最新的交互式大数据查询系统Presto,类似于Cloudera的Impala和Hortonworks的Stinger,解决了Facebook迅速膨胀的海量数据仓库快速查询需求。据Facebook称,使用Presto进行简单的查询只需要几百毫秒,即使是非常复杂的查询,也只需数分钟便可完成,它在内存中运行,并且不会向磁盘写入。第三是Wormhole流计算系统,类似于Twiitter的Storm和Yahoo的Storm-YARN。第四个重要项目是Pri *** ,它能够运行一个超大的、能够将全球数据中心都连起来的Hadoop集群,可能在一个数据中心宕掉的时候即时的将数据重新分布,这是一个与Google的Spanner类似的项目。


相关文章

黑客帝国数字雨内容(黑客帝国文字雨代码)

黑客帝国数字雨内容(黑客帝国文字雨代码)

本文目录一览: 1、谁教我黑客帝国那个数据流的特效 2、怎么用FLASH做出黑客帝国数字雨的特效 3、要黑客帝国3 neo与smith 雨中的对话,写清楚哪句是谁说的? 4、黑客帝国到底讲...

科幻电影精彩视频黑客帝国(黑客帝国纪录片)

科幻电影精彩视频黑客帝国(黑客帝国纪录片)

本文目录一览: 1、黑客帝国动画版高清完整版下载 2、求 黑客帝国动画版 百度网盘免费资源链接,谢谢 3、为什么电影《黑客帝国》系列评价很高? 黑客帝国动画版高清完整版下载 《黑客帝国动画版...

房产知识:购房可提取住房公积金吗提取具体是

相信现在有很多的朋友们对于购房可提取住房公积金吗提取具体是什么流程都想要了解吧,那么今天小编就来给大家针对购房可提取住房公积金吗提取具体是什么流程进行一个介绍吧,希望小编介绍的内容能够为大家起到帮助哦...

免费查开宾馆记录查询,网上查开宾馆记录软件

每日要闻如果你想要外出旅游,那么,对于目的地也一定是精挑细选之后才定下来的,如果你到了自己的旅游地点,那么我相信,在哪里住的地方一定是你最期待的存在吧。就像是吃、穿、住、行这四个是我们在平常的生活中是...

拼多多砍价机:新用户天天免费赚2元!

我发现人人对这种所谓自动赚钱天天分红的机器人挺感兴趣的,骗子们也乐此不疲换汤不换药,做了一个又一个类似平台,圈完一波又一波,都是小规模诈骗,很难被人捉住把柄,我推荐除了揭破,主要是因为它们还免费送钱!...

服务器怎么有效阻止ddos攻击(教你一招最简单有

服务器怎么有效阻止ddos攻击(教你一招最简单有

随着网络技术和网络应用的发展,网络安全问题显得越来越重要,已经被提到一个很高高的高度。DDOS攻击随着互联网的快速发展,也日益猖獗,从原来的的几兆、几十兆,到现在的几十G、几十T的流量攻击,形成了一个...