- 軟件大?。?span>287.00M
- 軟件語言:中文
- 軟件類型:國產(chǎn)軟件
- 軟件類別:免費(fèi)軟件 / 其他行業(yè)
- 更新時間:2021-10-23 11:51
- 運(yùn)行環(huán)境:WinAll, Win7
- 軟件等級:
- 軟件廠商:
- 官方網(wǎng)站:http://spark.apache.org/
53.78M/中文/10.0
170.00M/中文/10.0
144.69M/中文/10.0
144.69M/中文/10.0
19.52M/中文/10.0
spark大數(shù)據(jù)分析軟件為你提供了一個全新的平臺,你可以使用該平臺來進(jìn)行大數(shù)據(jù)學(xué)習(xí)、計算等等,支持的行業(yè)也是相當(dāng)?shù)膹V泛。軟件中的內(nèi)容豐富,而且還有相當(dāng)多的功能。歡迎下載!
Apache Spark 是一種多語言引擎,用于在單節(jié)點(diǎn)機(jī)器或集群上執(zhí)行數(shù)據(jù)工程、數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)。
1、機(jī)器學(xué)習(xí)
在筆記本電腦上訓(xùn)練機(jī)器學(xué)習(xí)算法,并使用相同的代碼擴(kuò)展到由數(shù)千臺機(jī)器組成的容錯集群。
2、SQL 分析
為儀表板和臨時報告執(zhí)行快速、分布式的 ANSI SQL 查詢。運(yùn)行速度快于大多數(shù)數(shù)據(jù)倉庫。
3、批處理/流數(shù)據(jù)
使用您的首選語言:Python、SQL、Scala、Java 或 R,統(tǒng)一批量和實(shí)時流式處理數(shù)據(jù)。
4、大規(guī)模數(shù)據(jù)科學(xué)
對 PB 級數(shù)據(jù)執(zhí)行探索性數(shù)據(jù)分析 (EDA),而不必求助于下采樣
1、速度快
基于內(nèi)存進(jìn)行計算(當(dāng)然也有部分計算基于磁盤,比如shuffle)。
2、集成Hadoop
并不是要成為一個大數(shù)據(jù)領(lǐng)域的“獨(dú)裁者”,一個人霸占大數(shù)據(jù)領(lǐng)域所有的“地盤”,而是與Hadoop進(jìn)行了高度的集成,兩者可以完美的配合使用。Hadoop的HDFS、Hive、HBase負(fù)責(zé)存儲,YARN負(fù)責(zé)資源調(diào)度;復(fù)雜大數(shù)據(jù)計算。實(shí)際上,Hadoop+的組合,是一種“double win”的組合。
3、極高的活躍度
目前是Apache基金會的頂級項目,全世界有大量的優(yōu)秀工程師是的committer。并且世界上很多頂級的IT公司都在大規(guī)模地使用。
4、容易上手開發(fā)
的基于RDD的計算模型,比Hadoop的基于Map-Reduce的計算模型要更加易于理解,更加易于上手開發(fā),實(shí)現(xiàn)各種復(fù)雜功能,比如二次排序、topn等復(fù)雜操作時,更加便捷。
5、超強(qiáng)的通用性
提供了 RDD、SQL、Streaming、MLlib、GraphX等技術(shù)組件,可以一站式地完成大數(shù)據(jù)領(lǐng)域的離線批處理、交互式查詢、流式計算、機(jī)器學(xué)習(xí)、圖計算等常見的任務(wù)。
請描述您所遇到的錯誤,我們將盡快予以修正,謝謝!
*必填項,請輸入內(nèi)容