亚洲熟女综合色一区二区三区,亚洲精品中文字幕无码蜜桃,亚洲va欧美va日韩va成人网,亚洲av无码国产一区二区三区,亚洲精品无码久久久久久久

給Java開發(fā)者的10個(gè)大數(shù)據(jù)結(jié)構(gòu)和工具

當(dāng)今IT開發(fā)人員面對(duì)的最大應(yīng)戰(zhàn)即是雜亂性,硬件越來(lái)越雜亂,OS越來(lái)越雜亂,編程語(yǔ)言和API越來(lái)越雜亂,咱們構(gòu)建的運(yùn)用也越來(lái)越雜亂。依據(jù)外媒的一項(xiàng)調(diào)查報(bào)告,中軟杰出專家列出了Java程序員在曩昔12個(gè)月內(nèi)一向運(yùn)用的一些東西或結(jié)構(gòu),或許會(huì)對(duì)你有意義。

先來(lái)看看大數(shù)據(jù)的概念。根據(jù)維基百科,大數(shù)據(jù)是龐大或復(fù)雜的數(shù)據(jù)集的廣義術(shù)語(yǔ),因此傳統(tǒng)的數(shù)據(jù)處理程序不足以支持如此龐大的體量。

在許多情況下,使用SQL數(shù)據(jù)庫(kù)存儲(chǔ)/檢索數(shù)據(jù)都是很好的選擇。而現(xiàn)如今的很多情況下,它都不再能滿足我們的目的,這一切都取決于用例的變化。

現(xiàn)在來(lái)討論一些不同的非SQL存儲(chǔ)/處理數(shù)據(jù)工具,例如,NoSQL數(shù)據(jù)庫(kù),全文搜索引擎,實(shí)時(shí)流式處理,圖形數(shù)據(jù)庫(kù)等。

1、MongoDB——最受歡迎的,跨平臺(tái)的,面向文檔的數(shù)據(jù)庫(kù)。

MongoDB是一個(gè)基于分布式文件存儲(chǔ)的數(shù)據(jù)庫(kù),使用C++語(yǔ)言編寫。旨在為Web應(yīng)用提供可擴(kuò)展的高性能數(shù)據(jù)存儲(chǔ)解決方案。應(yīng)用性能高低依賴于數(shù)據(jù)庫(kù)性能,MongoDB則是非關(guān)系數(shù)據(jù)庫(kù)中功能最豐富,最像關(guān)系數(shù)據(jù)庫(kù)的,隨著MongDB 3.4版本發(fā)布,其應(yīng)用場(chǎng)景適用能力得到了進(jìn)一步拓展。

MongoDB的核心優(yōu)勢(shì)就是靈活的文檔模型、高可用復(fù)制集、可擴(kuò)展分片集群。你可以試著從幾大方面了解MongoDB,如實(shí)時(shí)監(jiān)控MongoDB工具、內(nèi)存使用量和頁(yè)面錯(cuò)誤、連接數(shù)、數(shù)據(jù)庫(kù)操作、復(fù)制集等。

2、Elasticsearch ——為云構(gòu)建的分布式RESTful搜索引擎。

ElasticSearch是基于Lucene的搜索服務(wù)器。它提供了分布式多用戶能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java開發(fā)的,并作為Apache許可條款下的開放源碼發(fā)布,是比較流行的企業(yè)級(jí)搜索引擎。

ElasticSearch不僅是一個(gè)全文本搜索引擎,還是一個(gè)分布式實(shí)時(shí)文檔存儲(chǔ),其中每個(gè)field均是被索引的數(shù)據(jù)且可被搜索;也是一個(gè)帶實(shí)時(shí)分析功能的分布式搜索引擎,并且能夠擴(kuò)展至數(shù)以百計(jì)的服務(wù)器存儲(chǔ)及處理PB級(jí)的數(shù)據(jù)。ElasticSearch在底層利用Lucene完成其索引功能,因此其許多基本概念源于Lucene。

3、Cassandra——開源分布式數(shù)據(jù)庫(kù)管理系統(tǒng),最初是由Facebook開發(fā)的,旨在處理許多商品服務(wù)器上的大量數(shù)據(jù),提供高可用性,沒(méi)有單點(diǎn)故障。

Apache Cassandra是一套開源分布式NoSQL數(shù)據(jù)庫(kù)系統(tǒng)。集Google BigTable的數(shù)據(jù)模型與Amazon Dynamo的完全分布式架構(gòu)于一身。于2008開源,此后,由于Cassandra良好的可擴(kuò)展性,被Digg、Twitter等Web 2.0網(wǎng)站所采納,成為了一種流行的分布式結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)方案。

因Cassandra是用Java編寫的,所以理論上在具有JDK6及以上版本的機(jī)器中都可以運(yùn)行,官方測(cè)試的JDK還有OpenJDK 及Sun的JDK。 Cassandra的操作命令,類似于我們平時(shí)操作的關(guān)系數(shù)據(jù)庫(kù),對(duì)于熟悉MySQL的朋友來(lái)說(shuō),操作會(huì)很容易上手。

4、Redis?——開源(BSD許可)內(nèi)存數(shù)據(jù)結(jié)構(gòu)存儲(chǔ),用作數(shù)據(jù)庫(kù),緩存和消息代理。 Redis是一個(gè)開源的使用ANSI?C語(yǔ)言編寫的、支持網(wǎng)絡(luò)、可基于內(nèi)存亦可持久化的日志型、Key-Value數(shù)據(jù)庫(kù),并提供多種語(yǔ)言的API。Redis 有三個(gè)主要使其有別于其它很多競(jìng)爭(zhēng)對(duì)手的特點(diǎn):Redis是完全在內(nèi)存中保存數(shù)據(jù)的數(shù)據(jù)庫(kù),使用磁盤只是為了持久性目的; Redis相比許多鍵值數(shù)據(jù)存儲(chǔ)系統(tǒng)有相對(duì)豐富的數(shù)據(jù)類型; Redis可以將數(shù)據(jù)復(fù)制到任意數(shù)

5、Hazelcast ——基于Java的開源內(nèi)存數(shù)據(jù)網(wǎng)格。

Hazelcast 是一種內(nèi)存數(shù)據(jù)網(wǎng)格 in-memory data grid,提供Java程序員關(guān)鍵任務(wù)交易和萬(wàn)億級(jí)內(nèi)存應(yīng)用。雖然Hazelcast沒(méi)有所謂的“Master”,但是仍然有一個(gè)Leader節(jié)點(diǎn)(the oldest member),這個(gè)概念與ZooKeeper中的Leader類似,但是實(shí)現(xiàn)原理卻完全不同。同時(shí),Hazelcast中的數(shù)據(jù)是分布式的,每一個(gè)member持有部分?jǐn)?shù)據(jù)和相應(yīng)的backup數(shù)據(jù),這點(diǎn)也與ZooKeeper不同。

Hazelcast的應(yīng)用便捷性深受開發(fā)者喜歡,但如果要投入使用,還需要慎重考慮。

6、EHCache——廣泛使用的開源Java分布式緩存。主要面向通用緩存、Java?EE和輕量級(jí)容器。

EhCache 是一個(gè)純Java的進(jìn)程內(nèi)緩存框架,具有快速、精干等特點(diǎn),是hibernate中默認(rèn)的CacheProvider。主要特性有:快速簡(jiǎn)單,具有多種緩存策略;緩存數(shù)據(jù)有兩級(jí),內(nèi)存和磁盤,因此無(wú)需擔(dān)心容量問(wèn)題;緩存數(shù)據(jù)會(huì)在虛擬機(jī)重啟的過(guò)程中寫入磁盤;可以通過(guò)RMI、可插入API等方式進(jìn)行分布式緩存;具有緩存和緩存管理器的偵聽(tīng)接口;支持多緩存管理器實(shí)例,以及一個(gè)實(shí)例的多個(gè)緩存區(qū)域;提供Hibernate的緩存實(shí)現(xiàn)。

7、Hadoop?——用Java編寫的開源軟件框架,用于分布式存儲(chǔ),并對(duì)非常大的數(shù)據(jù)用戶可以在不了解分布式底層細(xì)節(jié)的情況下,開發(fā)分布式程序。充分利用集群進(jìn)行高速運(yùn)算和存儲(chǔ)。Hadoop實(shí)現(xiàn)了一個(gè)分布式文件系統(tǒng)(Hadoop Distributed File System),簡(jiǎn)稱HDFS。Hadoop的框架最核心的設(shè)計(jì)就是:HDFS和MapReduce。HDFS為海量的數(shù)據(jù)提供了存儲(chǔ),MapReduce則為海量的數(shù)據(jù)提供了計(jì)算。

8、Solr ——開源企業(yè)搜索平臺(tái),用Java編寫,來(lái)自Apache Lucene項(xiàng)目。

Solr是一個(gè)獨(dú)立的企業(yè)級(jí)搜索應(yīng)用服務(wù)器,它對(duì)外提供類似于Web-service的API接口。用戶可以通過(guò)http請(qǐng)求,向搜索引擎服務(wù)器提交一定格式的XML文件,生成索引;也可以通過(guò)Http Get操作提出查找請(qǐng)求,并得到XML格式的返回結(jié)果。

與ElasticSearch一樣,同樣是基于Lucene,但它對(duì)其進(jìn)行了擴(kuò)展,提供了比Lucene更為豐富的查詢語(yǔ)言,同時(shí)實(shí)現(xiàn)了可配置、可擴(kuò)展并對(duì)查詢性能進(jìn)行了優(yōu)化。

9、Spark?——Apache Software Foundation中最活躍的項(xiàng)目,是一個(gè)開源集群計(jì)算框架。

Spark 是一種與 Hadoop 相似的開源集群計(jì)算環(huán)境,但是兩者之間還存在一些不同之處,這些不同之處使 Spark 在某些工作負(fù)載方面表現(xiàn)得更加優(yōu)越,換句話說(shuō),Spark 啟用了內(nèi)存分布數(shù)據(jù)集,除了能夠提供交互式查詢外,它還可以優(yōu)化迭代工作負(fù)載。

Spark 是在?Scala?語(yǔ)言中實(shí)現(xiàn)的,它將 Scala 用作其應(yīng)用程序框架。與 Hadoop 不同,Spark 和 Scala 能夠緊密集成,其中的 Scala 可以像操作本地集合對(duì)象一樣輕松地

10、Memcached ——通用分布式內(nèi)存緩存系統(tǒng)。

Memcached是一套分布式快取體系,當(dāng)初是Danga Interactive為了LiveJournal所開展的,但被很多軟件(如MediaWiki)所運(yùn)用。Memcached作為高速運(yùn)行的分布式緩存服務(wù)器,具有以下的特色:協(xié)議簡(jiǎn)單,根據(jù)libevent的事件處理,內(nèi)置內(nèi)存存儲(chǔ)方法。

相關(guān)新聞

歷經(jīng)多年發(fā)展,已成為國(guó)內(nèi)好評(píng)如潮的Linux云計(jì)算運(yùn)維、SRE、Devops、網(wǎng)絡(luò)安全、云原生、Go、Python開發(fā)專業(yè)人才培訓(xùn)機(jī)構(gòu)!