最前線 | 開源數據編排服務商「Alluxio」獲5000萬美元C輪融資,高瓴創投領投
文 | 詠儀
編輯 | 蘇建勛
36氪獲悉,Alluxio宣布完成5000萬美元C輪融資,該輪融資由高瓴創投領投,戰略投資方和原股東a16z, Seven Seas Partners,火山石投資跟投。
本輪融資將用于繼續加大產品研發力量,在全球擴大目標市場規模和研發運營覆蓋范圍,推動公司業務快速增長。
與此同時,Alluxio也宣布將大力拓展國內市場業務,將北京設立為中國區總部,并成立本地化的研發團隊,以快速響應并滿足眾多國內企業的個性化需求。
Alluxio是一家開源云原生數據編排軟件開發商,成立于——年。Alluxio的主要產品為分布式超大規模數據編排系統,其前身為開源項目Tachyon,孵化于加州伯克利大學Amp實驗室。創始人兼CEO李浩源
從云計算的架構來看,最底層的是物理資源層,再到存儲層、計算層、應用層等。Alluxio所做的事情,是在計算框架和現有的存儲系統之間建立了一個虛擬層,這能極大地加速數據調度的效率。
Alluxio的數據團隊能夠將計算與存儲分離,同時讓數據更接近計算,用于跨云、跨集群和跨區域的分析和人工智能/機器學習工作負載。簡單來說,就是把在不同存儲中的所有的數據給虛擬化和抽象化。抽象起來之后進行編排,為上層的數據應用,如Spark、Presto、TensorFlow、Pytorch等等,能夠達到幾倍乃至幾十倍性能的提升。體現在一線業務人員處,工作效率提升可以達到2-6倍,原來一年需要做的工作量,同樣的人花費兩個月或四個月就能完成。
伴隨著本輪融資,Alluxio也正式發布了數據編排平臺2.7版本。2.7版本通過并行數據加載、數據預處理和訓練工作流,可將機器學習(ML)訓練的I/O效率提高5倍,從而顯著降低成本。新版本還提供了更強的性能分析,并能更好地支持Apache Hudi和Iceberg等開放表格格式,使得對數據湖的訪問更易于擴展,從而實現了Presto和Spark的分析提速。
CEO李浩源在發布會中表示,當前社會和行業都更加數字化,導致數據本身越來越多,而基于數據的存儲產品以及數據分析、機器學習等各種各樣的數據產品都在增加,數據世界是割裂的,各種復雜的數據平臺直接導致了數據使用的低效。
“從方法論的角度來講,著名的計算機專家David Wheeler就提到過:在計算機領域所有的問題,沒有任何一個問題不能通過添加一層抽象來解決,我們也是遵循了這個方法論。Alluxio在整個技術棧中提出了新的抽象的一層,也就是統一了數據入口,可插拔所有的大數據、AI機器學習的軟件棧,打通全域數據,這是我們所做的工作?!彼硎尽?/p>
目前,全球十大互聯網公司中已有包括Facebook、Airbnb、Uber、阿里巴巴、騰訊和字節跳動在內的八家企業部署了Alluxio。Alluxio的主要客戶集中在科技、金融、電信、基因制藥等行業,有不少大型企業都在生產環節中使用Alluxio的產品,單一用戶單一集群已經做到了三四千臺服務器以上規模。當前公司商業化進展不斷提速,今年年初第一季度已取得正向現金流。
開源是近期的創投熱點,開源與商業化的關系是最受關注的話題之一。Alluxio如何能夠在全球各個行業中建立標桿,并且做好商業化?
李浩源對36氪表示,十多年前,開源軟件的商業化還是處于比較原始的狀態,一般是做支持服務從而實現商業化,但從2010年開始,新的商業化模型就越來越成熟,Alluxio的商業化模型其實是基于開源上,添加商業化功能,以企業版輸出。當前,Alluxio絕大部分客戶都是單一來源,而且90%的客戶都是全球500強,已經得到很好的市場驗證。
對于未來規劃,李浩源也以Alluxio新版本為例,介紹了以后的產品和技術方向,第一是加強對大規模數據分析的支持;第二是加強加深了對人工智能技術的支持,第三是讓平臺的用戶使用更容易,增強跟k8s的整合。
目前,Alluxio已經實現了在全球范圍內的開源,已經有超過300多個組織機構和超過1100位貢獻者參與開發,包括目前國內頭部的計算機領域的高校、實驗室、科技公司、電信公司和金融公司等。
相關閱讀
以數據編排技術提高數據提取效率,「Alluxio」已收獲全球五大云廠商用戶
像虛擬機一樣虛擬數據,開源項目Alluxio要發力中國市場