china0114.com-日韩欧美中文免费,免费视频一区,免费视频一区,国产精品色网

公眾號
關注微信公眾號
移動端
創頭條企服版APP

比Spark快100倍的GPU加速SQL引擎:BlazingSQL開源了

5409
網絡大數據 2019-08-08 11:26 搶發第一評
BlazingSQL 是基于英偉達 RAPIDS 生態系統構建的 GPU 加速 SQL 引擎,可以為各種 ETL 大數據集提供 SQL 接口,并且完全運行在 GPU 之上。近日,其研發團隊宣布,BlazingSQL 基于 Apache 2 0 許可完全開源!

BlazingSQL 是基于英偉達 RAPIDS 生態系統構建的 GPU 加速 SQL 引擎,可以為各種 ETL 大數據集提供 SQL 接口,并且完全運行在 GPU 之上。近日,其研發團隊宣布,BlazingSQL 基于 Apache 2.0 許可完全開源!

開源項目地址: https://github.com/blazingdb/pyBlazing/

關于 BlazingSQL

?

?

BlazingSQL 是一個基于英偉達 RAPIDS 生態系統構建的 GPU 加速 SQL 引擎。RAPIDS 包含一組軟件庫(BlazingSQL、cuDF、cuML、cuGraph),用來在 GPU 上執行端到端的數據科學計算和分析管道。RAPIDS 基于 Apache Arrow 列式存儲格式,其中 cuDF 是一個 GPU DataFrame 庫,用于加載、連接、聚合、過濾和操作數據。BlazingSQL 是面向 cuDF 的 SQL 接口,具備支持大規模數據科學工作流和企業數據集的各種功能。

官方稱,BlazingSQL(幾乎)可以處理任何你想要的數據。它的前身是 BlazingDB,但因為它并不是一個數據庫,所以研發團隊將 BlazingDB 改名為 BlazingSQL。

BlazingSQL 主要特性:

查詢外部存儲數據 :僅需一行代碼就可以注冊遠程存儲解決方案,例如 Amazon S3。

簡單的 SQL:非常容易使用,運行 SQL 查詢就能得到 GPU DataFrames(GDF)的查詢結果。

互操作性:任意一個 RAPIDS 庫都可以訪問查詢到的 GDF,并用于任意的數據科學工作負載。

BlazingSQL 解決的痛點

價格昂貴:進行大規模數據科學研究通常需要包含數千臺服務器的集群,而 BlazingSQL + RAPIDS 運行相同規模的工作負載只需要其中一小部分基礎設施。

速度慢:在大型數據集上運行工作負載和查詢可能需要數小時或數天,而 BlazingSQL + RAPIDS 借助 GPU 加速可以在幾秒內得到結果,幫助數據科學家快速迭代新模型。

復雜型:數據科學工作負載通常基于小數據集開發出原型,然后針對分布式系統進行重建。BlazingSQL + RAPIDS 讓用戶能夠只編寫一次代碼,并且只需要一行代碼就能動態地改變分布式集群規模。

在開發團隊看來,迄今為止,SQL 是每一個主流分析生態系統的支柱之一,RAPIDS 是下一代分析生態系統,而 BlazingSQL 是 RAPIDS 的 SQL 標準。

BlazingSQL 完全基于 cuDF 和 cuIO 構建,這些項目的新功能會直接影響 BlazingSQL 的功能和性能。同時,由于 BlazingSQL 運行在 GDF 上,它與 RAPIDS 的所有庫都是 100%可互操作的。

如果你正在使用 RAPIDS,或者正在考慮使用 RAPIDS,BlazingSQL 將為你提供更多便利,包括但不限于:

降低代碼復雜性:SQL 語句非常簡單,你可以用單個語句替換數十到數百個 cuDF 函數調用。

連接到數據湖:你不再需要同步其他數據庫,BlazingSQL 可以查詢云端或網絡文件系統中的任意原始文件。

讓 RAPIDS 變得更快:更先進的 SQL 優化器讓 RAPIDS 技術棧更智能地運行。

BlazingSQL 性能表現

目前,BlazingSQL+RAPIDS 已經上線 Google Colab,研發團隊在 GCP 上搭建了兩個價格相當的集群,一個用于 Spark,另一個用于 BlazingSQL。他們在集群上運行端到端的數據分析工作負載:從數據湖到 ETL/ 特征工程,再到 XGBoost 訓練,并對 Spark 和 BlazingSQL 的性能進行了對比測試。

研發人員在超過兩千萬行 Netflow 數據上運行兩次相同的特定工作負載(具體實驗參見 Colab 鏈接)。首先運行 BlazingSQL + RAPIDS,然后使用 PySpark(Spark 2.4.1)再次運行,得到如下結果:

如果把從 Google Drive 中加載 CSV 到各自 DataFrame 所需的時間考慮在內,BlazingSQL 比 Spark 快 71 倍。

?

?

如果只看 ETL 時間,則BlazingSQL 和 RAPIDS 的速度比 Spark 快 100 倍!

?

?

運行以下 Colab 演示,用戶可以使用免費英偉達 T4 GPU 資源進行同樣的測試,對 BlazingSQL 的實際效果進行驗證。

https://colab.research.google.com/drive/1EbPE9FwFur7fE2054BH9s23Kd0FiUgGo

據介紹,BlazingSQL 大部分性能提升來自團隊的內部引擎項目,BlazingSQL 團隊的工程師們希望開發一種專為 GPU DataFrames(GDF)構建的 GPU 執行內核,稱之為“SIMD 表達式解釋器”(SIMD Expression Interpreter)。研發團隊分享了一些關于 SIMD 表達式解釋器的細節,SIMD 表達式解釋器通過幾個關鍵步驟帶來提升性能:

接收多個輸入,包括 GDF 列、字面量,在不久的將來也會支持函數。

在加載這些輸入時,SIMD 表達式解釋器將對 GPU 寄存器的分配進行優化,這可以優化 GPU 線程占用率,并提高性能。

然后,虛擬機處理這些輸入,并生成多個輸出。假設有以下 SQL 查詢:

SELECT colA + colB * 10,sin(colA) - cos(colD)FROM tableA

在以前,BlazingSQL 會將這條查詢語句轉換為 5 個操作(+,*,sin,cos, - ),每個操作都需要單獨執行。在使用 SIMD 表達式解釋器后,它會同時接收(colA、colB、colD)作為輸入,并在單次內核執行中執行所有 5 個操作,最終生成兩個輸出。這意味著 colA 只需要加載一次,而不是兩次。

目前,SIMD 表達式解釋器支持 BlazingSQL 的過濾和投影,因此它對許多主流的 SQL 查詢都有影響。

如何使用 BlazingSQL

使用 BlazingSQL 在 Amazon S3 中查詢 CSV 文件的示例代碼:

更多 BlazingSQL 的操作方法參見 GitHub 項目和官方網站。

分享到:0收藏

上一篇:經典機器學習:如何做到預流失與流失挽回? Hadoop時代正式終結? HPE 宣布收購 MapR!下一篇:

聲明:該文章版權歸原作者所有,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請在30日內與本網聯系。
您閱讀這篇文章花了0
轉發這篇文章只需要1秒鐘
喜歡這篇 0
評論一下 0
凱派爾知識產權全新業務全面上線
相關文章
評論
試試以這些內容開始評論吧
登錄后發表評論
凱派爾知識產權全新業務全面上線
寧波城市站
金華城市站
×
#熱門搜索#
精選雙創服務
歷史搜索 清空

Tel:18514777506

關注微信公眾號

創頭條企服版APP

china0114.com-日韩欧美中文免费,免费视频一区,免费视频一区,国产精品色网
香港成人在线视频| 91麻豆福利精品推荐| voyeur盗摄精品| 欧美日韩国产在线播放网站| 国产精品区一区二区三| 青青草97国产精品免费观看 | 高清国产午夜精品久久久久久| 精品视频在线免费| 国产精品剧情在线亚洲| 激情综合一区二区三区| 欧美欧美欧美欧美| 亚洲乱码中文字幕| 大白屁股一区二区视频| 精品日韩在线观看| 五月激情综合色| 91国在线观看| 日韩美女视频19| 丰满少妇在线播放bd日韩电影| 日韩欧美123| 日日摸夜夜添夜夜添国产精品| 色哟哟一区二区三区| 国产精品色在线| 国产成人亚洲综合色影视 | 另类小说图片综合网| 欧美亚洲高清一区二区三区不卡| 国产精品理论片在线观看| 国产美女在线观看一区| 欧美成人激情免费网| 日韩va欧美va亚洲va久久| 欧美做爰猛烈大尺度电影无法无天| 中文字幕中文字幕一区| 丁香一区二区三区| 欧美激情一区二区三区全黄| 国产成人免费高清| 久久精品一区八戒影视| 国模一区二区三区白浆| 日韩欧美在线123| 日本vs亚洲vs韩国一区三区| 在线电影一区二区三区| 午夜国产精品一区| 欧美精品日日鲁夜夜添| 天堂在线一区二区| 7878成人国产在线观看| 亚洲mv大片欧洲mv大片精品| 欧美日韩激情在线| 午夜精品久久久久久久99水蜜桃| 欧美色男人天堂| 五月婷婷激情综合网| 欧美日韩黄视频| 日本女人一区二区三区| 日韩欧美一区二区免费| 久久66热re国产| 久久九九影视网| 成人免费视频网站在线观看| 亚洲欧洲一区二区三区| 色婷婷综合久色| 亚洲国产精品久久久久婷婷884| 欧美日韩国产小视频在线观看| 午夜av电影一区| 日韩欧美一区二区三区在线| 国产美女一区二区| 中文字幕一区二区在线观看| 在线观看亚洲精品视频| 日韩精品一级中文字幕精品视频免费观看 | 亚洲精品久久7777| 欧美性色欧美a在线播放| 亚洲成人综合视频| 欧美一级国产精品| 国产精品18久久久久久久网站| 国产精品美女久久福利网站| 色婷婷久久99综合精品jk白丝| 亚洲午夜久久久久久久久电影网| 91精品中文字幕一区二区三区| 久久99精品久久久| 国产精品久久久久久久久免费相片 | 欧美一二三四区在线| 激情综合网最新| 中文字幕一区二区三区在线观看| 欧美伊人精品成人久久综合97| 蜜乳av一区二区| 中文字幕精品一区二区精品绿巨人 | youjizz国产精品| 亚洲一区二区三区四区五区中文| 91精品国产色综合久久ai换脸| 国产在线日韩欧美| 亚洲免费观看高清完整版在线观看| 欧美精品久久99| 国产91丝袜在线播放| 亚洲成人综合视频| 国产片一区二区| 在线观看91视频| 黑人精品欧美一区二区蜜桃| 亚洲精品视频在线看| 欧美www视频| 91久久线看在观草草青青| 久久精品国产免费看久久精品| 国产精品国产三级国产三级人妇| 欧美日韩高清一区| 东方aⅴ免费观看久久av| 午夜精品免费在线观看| 欧美国产一区视频在线观看| 欧美视频在线一区二区三区| 国产麻豆精品在线观看| 亚洲午夜精品在线| 欧美国产在线观看| 欧美一区二区三区在线电影| 风间由美一区二区三区在线观看 | eeuss鲁片一区二区三区在线观看| 天天综合网天天综合色| 国产精品久久久久久久久免费樱桃| 欧美精选午夜久久久乱码6080| 国产91丝袜在线播放0| 日韩av网站在线观看| 亚洲美女区一区| 久久亚区不卡日本| 欧美色大人视频| www.久久久久久久久| 久久av资源网| 天天综合日日夜夜精品| 亚洲欧洲三级电影| 久久综合九色综合97婷婷女人 | 中文字幕的久久| 欧美一级在线免费| 91福利在线看| 成人免费的视频| 国模一区二区三区白浆| 日韩精品一卡二卡三卡四卡无卡| 亚洲色图清纯唯美| 国产三级一区二区| 欧美v日韩v国产v| 欧美欧美午夜aⅴ在线观看| 99精品视频中文字幕| 国产一区二区三区四区五区美女 | 日本午夜一区二区| 亚洲精品一二三| 国产精品久久久久影视| xfplay精品久久| 日韩视频在线永久播放| 欧美日本国产一区| 欧美综合欧美视频| 91在线视频观看| 成人高清视频在线| 国产精品一区二区久久不卡| 美女视频第一区二区三区免费观看网站| 亚洲欧美偷拍卡通变态| 国产精品嫩草影院com| 国产午夜亚洲精品羞羞网站| 欧美变态tickle挠乳网站| 51精品国自产在线| 欧美久久一二区| 欧美日韩国产在线观看| 欧美性猛片xxxx免费看久爱| 色婷婷综合久久| 色噜噜久久综合| 色综合久久99| 91麻豆精东视频| 91亚洲精品一区二区乱码| 99视频在线精品| 99久久婷婷国产| 91视视频在线观看入口直接观看www | 精品福利一区二区三区| 欧美电影精品一区二区| 日韩欧美的一区二区| 日韩精品一区在线| 亚洲精品一区二区三区精华液| 日韩欧美高清在线| 欧美变态tickle挠乳网站| 精品三级在线看| 久久综合久久综合久久综合| 久久久久久久免费视频了| 久久久精品中文字幕麻豆发布| 久久久91精品国产一区二区三区| 久久精品在这里| 国产精品―色哟哟| 亚洲视频免费观看| 樱花影视一区二区| 亚洲综合男人的天堂| 亚洲国产欧美一区二区三区丁香婷| 亚洲一区在线电影| 亚洲aⅴ怡春院| 免费看日韩精品| 久久精品国产久精国产| 国产露脸91国语对白| 成人av高清在线| 色婷婷久久久久swag精品 | 日韩成人一级片| 免费成人在线观看视频| 激情偷乱视频一区二区三区| 国产精品一区二区在线播放| 丁香五精品蜜臀久久久久99网站| jlzzjlzz亚洲日本少妇| 色婷婷久久一区二区三区麻豆| 欧美专区日韩专区| 91精品国产综合久久蜜臀| ww久久中文字幕| 综合分类小说区另类春色亚洲小说欧美| 一区二区三区中文字幕电影| 天堂成人免费av电影一区| 国产综合久久久久久久久久久久| 国产东北露脸精品视频|