手機版
你好,游客 登錄 注冊
背景:
閱讀新聞

BlazingSQL開源了,基于RAPIDS構建的GPU加速SQL引擎

[日期:2019-08-07] 來源:Linux公社  作者:醉落紅塵 [字體: ]

昨天,BlazingSQL團隊在Apache 2.0許可下開源BlazingSQL。 它是一個基于RAPIDS生態系統構建的輕量級,GPU加速的SQL引擎。RAPIDS 包含一組軟件庫(BlazingSQL、cuDF、cuML、cuGraph),用來在 GPU 上執行端到端的數據科學計算和分析管道。

BlazingSQL首席執行官Rodrigo Aramburu在媒體博客文章中寫道:“隨著RAPIDS的采用不斷普及,開源的BlazingSQL加快了我們的開發周期,讓我們的產品掌握在更多用戶手中,并使我們的許可和消息與更大的RAPIDS人工智能生態系統保持一致。”

Aramburu將RAPIDS稱為“下一代分析生態系統”,其中BlazingSQL作為SQL標準。 它還可以作為cuDF的SQL接口,cuDF是一個用于加載,連接,聚合和過濾數據的GPU DataFrame(GDF)庫。

以下是BlazingSQL如何適應RAPIDS人工智能生態系統的概述:

使用BlazingSQL的優點

  • 經濟高效:客戶通常需要集中數千臺服務器來大規模處理數據,這可能非常昂貴。 BlazingSQL只占基礎設施的一小部分,以同等規模運行。
  • 更好的性能:在提取,轉換和加載數據時,BlazingSQL比Apache Spark群集快20倍。它可以在幾秒鐘內生成GPU加速結果,使數據科學家能夠快速迭代新模型。
  • 輕松擴展工作負載:通常,工作負載首先以小規模進行原型設計,然后針對分布式系統進行重建。使用BlazingSQL,您只需編寫一次代碼,可以根據分發的規模動態更改代碼,只需最少的代碼更改。
  • 連接到多個數據源:它連接到多個數據源,用于查詢本地和分布式文件系統中的文件。目前,它支持AWS S3和Apache HDFS,團隊計劃在未來支持更多。
  • 運行聯合查詢:它允許您在聯合查詢的幫助下以原始格式直接將原始數據查詢到GPU內存中。聯合查詢允許您跨多種數據格式連接來自多個數據存儲的數據。它目前支持CSV,Apache Parquet,JSON和現有的GPU DataFrame。

NVIDIA的數據科學總監Josh Patterson在公告中表示,“NVIDIA和RAPIDS生態系統很高興BlazingSQL開源其基于RAPIDS的SQL引擎。 通過在GPU上利用Apache Arrow并與Dask集成,BlazingSQL將擴展開源功能,并推動加速數據科學生態系統中的下一波互操作性。“

Linux公社的RSS地址http://www.nluszu.live/rssFeed.aspx

本文永久更新鏈接地址http://www.nluszu.live/Linux/2019-08/159895.htm

linux
相關資訊       RAPIDS  BlazingSQL  BlazingSQL開源 
本文評論   查看全部評論 (0)
表情: 表情 姓名: 字數

       

評論聲明
  • 尊重網上道德,遵守中華人民共和國的各項有關法律法規
  • 承擔一切因您的行為而直接或間接導致的民事或刑事法律責任
  • 本站管理人員有權保留或刪除其管轄留言中的任意內容
  • 本站有權在網站內轉載或引用您的評論
  • 參與本評論即表明您已經閱讀并接受上述條款
彩票投注骗局