国产99久久久久免费精品无码_欧美在线国产精品_538PROM精品视频线放_超碰97人人射妻_日本黄色一级网站_野花香在线视频免费观看第一集_久久人妻少妇嫩草_日韩精品无码中文字幕一区二区_无码区免费真人爱爱动态视频_无码专区国产精品第一页,狠狠色丁香婷婷综合潮喷,孕妇被各种姿势C到高视频,变态另类玩孕妇临盆

?
當(dāng)前位置:諸城新聞網(wǎng) > 新聞 > 國內(nèi) > 社會 > 星環(huán)科技正式發(fā)布一站式大數(shù)據(jù)平臺軟件TDH4.6版本

星環(huán)科技正式發(fā)布一站式大數(shù)據(jù)平臺軟件TDH4.6版本

2016-08-24 13:43:24 來源:大智博通

  過去十年間,,全世界的數(shù)據(jù)量每兩年大約增加10倍,,已經(jīng)遠(yuǎn)遠(yuǎn)超過計算領(lǐng)域的摩爾定律,因此人們需要有更高效的方式來處理數(shù)據(jù),。在如此強(qiáng)烈的需求推動下,,大數(shù)據(jù)技術(shù)發(fā)展日新月異,。

  作為摩爾定律堅定的踐行者,星環(huán)科技一直致力于實現(xiàn)大數(shù)據(jù)技術(shù)領(lǐng)域的摩爾定律:近日,,星環(huán)科技正式發(fā)布TDH 4.6版本,,實現(xiàn)6個月內(nèi)單位性能提升60%,并發(fā)布了一系列新產(chǎn)品組件,,進(jìn)一步降低了大數(shù)據(jù)技術(shù)從概念到落地的復(fù)雜度,。

  此次TDH 4.6發(fā)布兩大特色組件:

  SQL on Elastic Search:在海量數(shù)據(jù)中快速檢索到精確信息的利器;

  Graphene:在超級復(fù)雜的關(guān)聯(lián)網(wǎng)絡(luò)中快速找到社區(qū)結(jié)構(gòu)的圖計算產(chǎn)品,。

  除此以外,TDH眾多功能組件也都迎來了重大升級,。

  一,、Transwarp Inceptor

  1. 性能提升

  作為TDH家族的兄長,Inceptor努力踐行著摩爾定律:單位計算資源的性能在6個月內(nèi)提升了60%,。同時,,相同資源能夠支持的數(shù)據(jù)量也有同樣比例的增長,這意味著在半年內(nèi),,使用TDH的用戶可以在不做硬件擴(kuò)充的情況下,,只要升級至4.6版本,就能夠多處理50%的業(yè)務(wù)量,。下圖為TDH最近三個版本在TPC-DS基準(zhǔn)測試上的性能對比數(shù)據(jù),。

  為了有更好的分析性能,Inceptor 4.6開發(fā)了全新的Inter-SQL-Optimizer,,可以分析一個文件中多個業(yè)務(wù)SQL,,并生成依賴圖,在此基礎(chǔ)上進(jìn)一步對業(yè)務(wù)SQL優(yōu)化,,包括刪除未使用的字段,、消除非有效的SQL等,并結(jié)合Cost Based Optimizer來提升性能,。

  2.圖計算

  Inceptor 4.6另外一個亮點是圖計算產(chǎn)品Graphene的正式推出,。Graphene提供基于SQL的擴(kuò)展語言進(jìn)行圖計算編程,通過Inceptor引擎完成分布式計算,,可以在海量數(shù)據(jù)中執(zhí)行多達(dá)14種圖算法,。

  3.Holodesk再升級

  為了提供更好的檢索和分析性能,Inceptor 4.6正式推出了Holodesk V2,,包含存儲層的一系列優(yōu)化,,更好的適配各種規(guī)格的SSD,并推出了全局索引,,以及基于全局索引的各種優(yōu)化,。在我們的基準(zhǔn)測試中,Holodesk V2相對于V1的性能顯著提升,,對于一些精確檢索類的業(yè)務(wù)SQL,,查詢延時降至毫秒級。

  4.數(shù)據(jù)字典

  為了更好的幫助用戶查看和管理元數(shù)據(jù),,Inceptor 4.6正式推出了數(shù)據(jù)字典,。在數(shù)據(jù)字典中,用戶可以通過基于SQL的方式來查詢各種元數(shù)據(jù)信息,從而更好的對數(shù)據(jù)進(jìn)行監(jiān)管,,同時也可以滿足各種第三方工具的對接需求,。

  5.SQL支持

  Inceptor 4.6在 SQL支持程度得到進(jìn)一步提升,包括正式支持SQL Sequence語法,,全面兼容VARCHAR和CHAR數(shù)據(jù)類型,,并通過方言控制與Oracle以及DB2保持一致行為。

  Inceptor 4.6新發(fā)布的功能提升用戶體驗,,包括支持使用中文字符作表名或者字段名,,更好的滿足國內(nèi)客戶的需求;規(guī)范化的報錯,快速定位問題并構(gòu)建知識庫;PL/SQL支持在編譯期對SQL做語義檢查,,幫助用戶更早的發(fā)現(xiàn)問題;支持持久化的UDF,用戶只要一次加載就可以持續(xù)使用,。

  二,、Transwarp Hyperbase

  全新面貌交付,產(chǎn)品矩陣,、運(yùn)維支撐以及架構(gòu)方面均有重大的提升,。

  首先,為了更好的適應(yīng)海量數(shù)據(jù)的檢索需求,,Hyperbase 4.6正式發(fā)布了SQL on Elastic Search功能,,包含SQL Engine,ES-Drive組件以及Elastic Search 2.0,。其中,,SQL Engine主要用于解析SQL以及全文檢索的語法,并通過ES-Drive最終生成對Elastic Search的API調(diào)用,。相比較于直接用ES API,,SQL編程在便利性、可管理性以及性能上都有更好的優(yōu)勢,。

  以如下場景為例,,我們可以看到使用SQL做全文檢索的便利性?!安檎页鐾瑫r存在transwarp和outstand的文檔,,且兩單詞間距不超過10個單詞的文本,并且要求transwarp一定出現(xiàn)在outstand之前,?!盨QL: select * from test001 where contains(content, 'NEAR((transwarp, outstand), 20)')

  其次,Hyperbase拋棄了傳統(tǒng)的InputFormat/OutputFormat的方式來操作HBase,,而是通過HyperDrive組件來使用HBase,。SQL操作會被直接翻譯為對HBase的RDD操作,最終直接體現(xiàn)為HBase的API調(diào)用。使用這種全新的架構(gòu),,大幅減少HBase原子操作的調(diào)用棧的復(fù)雜度,,對HBase中錯誤的處理更方便。 此外,,Hyperbase加強(qiáng)了對集群運(yùn)維的支撐,。我們基于HTrace實現(xiàn)了一套RPC的監(jiān)控工具,通過標(biāo)準(zhǔn)化的輸出日志,,快速定位;并對各個組件做關(guān)聯(lián)分析,,更方便的甄別系統(tǒng)問題。同時,,HBase提供Performance Metrics日志收集,、分析和展現(xiàn)框架,用戶可將自定義的Metrics收集起來,,通過第三方工具做報表展現(xiàn),,從而掌握集群的狀況。

  三,、Transwarp Stream

  StreamSQL在4.6版本中新增了多項重要功能,,更有效的應(yīng)對復(fù)雜的實時應(yīng)用場景。新版本中支持動態(tài)流控,,當(dāng)任務(wù)出現(xiàn)積壓時,,通過限制數(shù)據(jù)接收的速度來保證系統(tǒng)的穩(wěn)定性;針對一些實時應(yīng)用中可能出現(xiàn)過多的小文件問題,Stream通過Batch Flush模式進(jìn)行規(guī)避,。

  Stream SQL支持Socket以及Kafka的數(shù)據(jù)源,,此外由于數(shù)據(jù)格式的多樣性,Stream SQL支持用戶自定義的Decoder,,并允許使用自定義的Decoder來解析通過Socket進(jìn)入的數(shù)據(jù),。

  此外,Stream SQL在處理數(shù)據(jù)的亂序問題上也做了增強(qiáng),。當(dāng)Kafka中某一個時間段內(nèi)有亂序的數(shù)據(jù)時,,Stream正常接收數(shù)據(jù)并對相關(guān)的數(shù)據(jù)做重排序來恢復(fù)正常的數(shù)據(jù)流。

  四,、Transwarp Manager

  Manager 4.6新增了磁盤問題管理,。當(dāng)某一個硬盤出現(xiàn)問題后,用戶可以很方便的讓所有的組件不再使用該硬盤,,無需多次修改配置,。新版本支持一鍵刪除節(jié)點,并且支持Transwarp Manager HA的自動化配置,,Manager本身的穩(wěn)定性得到進(jìn)一步完善,。

  為了讓用戶更好的了解集群狀況,Transwarp Manager新增了報表頁面。用戶可以通過選取感興趣的Metrics生成報表,,通過對報表數(shù)據(jù)的閱讀來掌握集群的運(yùn)行狀況,。

  在集群運(yùn)維和檢查方面,Manager增加了頁面版本的環(huán)境檢查工具,,對當(dāng)前系統(tǒng)的軟件環(huán)境,、網(wǎng)絡(luò)狀況等進(jìn)行快速檢查,找出潛在的環(huán)境問題,。下圖為環(huán)境檢查工具在某個集群上的綜合檢查報告,。

  五、Transwarp Guardian

  Guardian 4.6新增了列級數(shù)據(jù)權(quán)限控制,,支持設(shè)置特定列對特定用戶脫敏顯示; 支持?jǐn)?shù)據(jù)庫級別的權(quán)限管理,,支持按數(shù)據(jù)庫批量賦予表的權(quán)限;可以通過SQL設(shè)置Inceptor表對應(yīng)HDFS文件的ACL以及用戶組;此外,在對Kafka的安全認(rèn)證中,,可以使用IP或者Host name作為Principal ,,使用更靈活。

  六,、Transwarp Discover

  從有效的數(shù)據(jù)中找出數(shù)據(jù)的價值是數(shù)據(jù)挖掘的主要使命,數(shù)據(jù)的質(zhì)量對挖掘的效果有著非常大的影響,,因此數(shù)據(jù)預(yù)處理一般是數(shù)據(jù)挖掘項目的首個重要任務(wù),。為了讓用戶對數(shù)據(jù)預(yù)處理更容易,Discover 4.6 提供了一套新的預(yù)處理的方法,,包括數(shù)據(jù)歸一化txNormalization和對異常數(shù)據(jù)的修改txReplacingData,。

  除了在預(yù)處理部分的提升外,Discover 4.6增強(qiáng)了分布式算法和R算法的適配,,可以讓同一套代碼靈活的調(diào)用分布式算法或者本地R算法,。目前常用的一些算法如決策樹/ANN/SVD/PCA都可以在兩個模型之間切換。

  此外,,Discover 4.6允許用戶將已實現(xiàn)的Spark算法加入Discover算法庫中,,并可以通過Discover Data Frame接口來調(diào)用,無需將代碼重新遷移,。

  七,、結(jié)語

  幫助更多的開發(fā)者將大數(shù)據(jù)技術(shù)落地并創(chuàng)造價值是星環(huán)科技的使命,也是驅(qū)動Transwarp Data Hub升級換代的直接動力,。從最早解決大數(shù)據(jù)分析的難題,,到現(xiàn)在推出的圖計算,海量數(shù)據(jù)檢索等功能,,我們希望將易用/可靠/穩(wěn)定/高性能的數(shù)據(jù)平臺交付給開發(fā)者,,讓數(shù)據(jù)更容易流轉(zhuǎn),讓大數(shù)據(jù)上的分析和挖掘更高效更敏捷,讓數(shù)據(jù)的價值驅(qū)動業(yè)務(wù)的發(fā)展,。

  1 條記錄 1/1 頁
編輯:博通

新聞排行

精彩熱圖

娛樂新聞

?

關(guān)于我們 - 諸城新聞 - 娛樂新聞 - 網(wǎng)站公告 - 版權(quán)聲明 - 設(shè)為首頁 - 加入收藏
新聞信息服務(wù)許可證  備案號:魯ICP備2021025553號-1  主管:中共諸城市委宣傳部  主辦:諸城市融媒體中心  技術(shù)支持:諸城信息港
版權(quán)所有:諸城市融媒體中心  地址:諸城市和平街173號 郵編:262200 安全狗網(wǎng)站安全檢測