
我猜,我們是最早和你說春天來了的人。
一年前,我們還在小心謹慎地定義著Cloud HPC,一臉?gòu)尚叩啬肗ovartis 諾華制藥在5年前做的案例當(dāng)作標桿。
不久前,Hyperion Research正式宣布2019年是Cloud HPC的轉(zhuǎn)折年。
暴風(fēng)哭泣,云端高性能計算終于有了姓名。
HPC:HighPerformance Computing高性能計算,換句話說,對算力要求高
這一年,我們幫不少用戶落地了云端算力解決方案。像我們老板說的,對用戶來說,最重要的是提供一種Accessibility(可觸達),后面的Efficiency(效率)都是水到渠成的事兒。

同時,我們也看到很多用戶在云的邊緣瘋狂試探,等某個未知的神秘力量來推上一把;還有些用戶驚喜地發(fā)現(xiàn),我們提供了一種解決他們現(xiàn)有問題的新思路。
今天,我們盤一盤國內(nèi)外Cloud HPC現(xiàn)在的局面:
1. 全球越來越多企業(yè)踏足HPC領(lǐng)域,AI和高性能數(shù)據(jù)分析首當(dāng)其沖
2. 不同Cloud HPC細分領(lǐng)域未來5年年均復(fù)合增長率超過21%
3. 從兩個全球超大規(guī)模CPU、GPU的溢出到云案例看云的可伸縮彈性能力
4. 我們觀察到的國內(nèi)外部分行業(yè)用云現(xiàn)狀:制藥/基因測序/EDA/CAE/高校
溢出到云:本地不夠,云來補上的意思
友情提醒:如果你還在為算力不足而頭疼,或?qū)υ朴兴诖宋慕ㄗh轉(zhuǎn)發(fā)給你的老板,讓我們等待一個“真香”~~
全球越來越多企業(yè)踏足HPC領(lǐng)域,AI和高性能數(shù)據(jù)分析首當(dāng)其沖
全球越來越多企業(yè)級用戶開始踏足HPC領(lǐng)域,比如欺詐/異常檢測、商業(yè)智能、關(guān)聯(lián)營銷、精準醫(yī)療、智慧城市、物聯(lián)網(wǎng)等等。
大數(shù)據(jù)和HPC的結(jié)合提供了很多新的解決方案,基于HPDA高性能數(shù)據(jù)分析的AI人工智能,ML機器學(xué)習(xí),DL深度學(xué)習(xí)是最熱的領(lǐng)域。
HPDA高性能數(shù)據(jù)分析領(lǐng)域的增長速度超過HPC市場整體增長速度。
AI領(lǐng)域的增長速度高于整個HPDA高性能數(shù)據(jù)分析領(lǐng)域的增長速度。

眾所周知:AI現(xiàn)在還處在早期發(fā)展階段。推理功能弱,主要解決觀察識別類問題,而不是決策問題。比較落地的應(yīng)用場景是在圖像和聲音識別,高級駕駛輔助系統(tǒng),MRI醫(yī)療影像識別領(lǐng)域。
AI不是什么包治百病的神奇藥丸,不過是數(shù)學(xué)罷了。
從OPENAI在2019年11月發(fā)布的圖片中就能明顯看出,自2012年以來,AI訓(xùn)練對計算的要求3、4個月就會翻一倍。在可見的未來,這個趨勢應(yīng)該會持續(xù)。

不同Cloud HPC細分領(lǐng)域,未來5年年均復(fù)合增長率超過21%
Hyperion Research預(yù)測未來5年HPC用戶的用云趨勢:

這個圖不包括沒有任何本地機器,天生用云的用戶。
縱軸指的是用戶在第三方云資源上的花費,包括了公有云,混合云,第三方搭建的私有云。
不同Cloud HPC細分領(lǐng)域未來5年年均復(fù)合增長率都超過了21%。
生命科學(xué)、EDA半導(dǎo)體領(lǐng)域甚至超過了25%。

從兩個全球超大規(guī)模CPU、GPU的溢出到云案例看云的可伸縮彈性能力
關(guān)于為什么要用云這個問題。
Hyperion Research的調(diào)查結(jié)果跟ANSYS不謀而合。
對用戶來說,云的可伸縮彈性是當(dāng)之無愧的第一大法寶。

那云的彈性現(xiàn)在到底大到什么程度?
我們看看兩個全球超大規(guī)模CPU、GPU的溢出到云的案例。
CPU。
2019年10月,克萊姆森大學(xué)計算學(xué)院(Clemson University School of Computing)創(chuàng)下了云端高性能計算領(lǐng)域一個記錄。
他們花了大概5萬美金,運行了4個小時,使用214萬個vCPU在Google云上跑了一個數(shù)據(jù)密集型應(yīng)用,在200萬小時的視頻中對車輛進行計數(shù),視頻數(shù)據(jù)文件大小為210TB。
這是個概念驗證實驗,為了驗證在現(xiàn)實數(shù)據(jù)量極大,時間緊迫的情況下,云端高性能計算有能力為應(yīng)急處理提供決策支持。有了云計算,公司或組織不需要擁有大量機器,或者停止手頭上一切工作來處理應(yīng)急情況。

GPU。
2019年11月,SDSC圣地亞哥超級計算中心聯(lián)合威斯康星州冰立方粒子天體物理中心(Wisconsin IceCube Particle Astrophysics Center)在AWS,Azure和Google云上一共調(diào)度了超過5萬GPU完成一次仿真模擬計算試驗。

黑線是用于計算的GPU數(shù)量,最高達到51,500個。
不同顏色代表在某家云廠商的某個區(qū)域購買的GPU數(shù)量。
PFLOP32s的峰值約為350。
相比之下,美國橡樹嶺國家實驗室Summit系統(tǒng)的名義性能約為400 PFLOP32s。
因此,這次計算,基于云的集群提供了全球排名第一超算中心峰值90%的性能。
IceCube的Riedel說:
“這場實驗主要有三個目標:一是用于天體物理學(xué)模擬仿真研究;第二是測試網(wǎng)絡(luò)基礎(chǔ)設(shè)施是不是做好了未來E級計算的準備;第三是想測一下一個小時左右的時間內(nèi),能買到多少商用云計算GPU資源。這次調(diào)度了三大洲(北美、歐洲和亞洲)28個區(qū)域的所有可用GPU。結(jié)果說明云端彈性可以沖擊非常大規(guī)模的GPU,適用于天文學(xué)和其他科學(xué)領(lǐng)域的廣泛挑戰(zhàn)。”
我們觀察到的國內(nèi)外部分行業(yè)上云現(xiàn)狀:制藥/基因測序/EDA/CAE/高校
制藥/新藥研發(fā)領(lǐng)域
計算機輔助藥物設(shè)計(Computer-Aided Drug Design,CADD),國內(nèi)相比于美國、英國等國家,的確有點落后,但是發(fā)展速度非常快,已經(jīng)成為藥物研發(fā)流程中不可或缺的一部分。
要求越高越準確,需要的數(shù)據(jù)就更多,計算量就越大。
怎么利用計算工具和資源,解決新藥研發(fā)過程中的各種問題?
怎么找到具備復(fù)合能力的人才?
是這個領(lǐng)域最受關(guān)注的問題。
人才方面,我們可以盡可能幫助企業(yè)降低對他們的各種云、HPC技術(shù)等方面的知識技能要求,更專注在藥物研發(fā)業(yè)務(wù)方向。
計算這一塊,拿虛擬篩選來舉例。我們能幫助用戶讓過去需要耗費幾個月的篩選時間縮短到1天以內(nèi)。

案例:我們用Schrodinger(薛定諤)輔助用戶對7.8億多個分子進行了篩選,用了云上的幾萬個Core,計算時長僅花費了3-13個小時(每個Core上所需時間不一樣)。
詳情可聯(lián)系文末小F
基因測序/精準醫(yī)療領(lǐng)域
基因測序天然地數(shù)據(jù)量大,而且計算復(fù)雜程度高,整個分析工作流程復(fù)雜,經(jīng)常需要修改算法。
這個領(lǐng)域主要關(guān)注測序技術(shù)的發(fā)展和數(shù)據(jù)計算和分析。
怎么拿到數(shù)據(jù)?
怎么在最短時間內(nèi)對海量生物數(shù)據(jù)進行計算,找出單個基因或多個基因組合和一系列疾病的關(guān)系?
對云的需求主要基于兩點:
一個是計算量有明顯季節(jié)性。而本地計算資源的分析能力有限,升級成本高,云的彈性伸縮能力能很好地應(yīng)對;
第二是主要是消費級基因公司對計算的時效性要求高。
案例:我們有個基因用戶就要求8小時內(nèi)處理完當(dāng)日5點前數(shù)據(jù),而且每天對計算資源的要求很不確定,只有計算時間要求是固定的,這種情況下云端算力就是比較理想的解決方案。而且我們還能將其復(fù)雜的分析流程進行優(yōu)化封裝,進一步提升計算效率。
詳情可聯(lián)系文末小F
CAE/CFD領(lǐng)域
ANSYS作為CAE仿真里的巨頭,也是目前唯一一個真正采用云端計費模式的企業(yè)。他們在2019年5月做的調(diào)查顯示:云端仿真有很大的增長潛力。

市場變化很快:
在未來的12個月,大多數(shù)預(yù)計將使用SaaS解決方案(62%),其次是公有云(45%),緊隨其后的是混合云解決方案:私有云+合作伙伴管理的數(shù)據(jù)中心(44%)或私有云+合作伙伴管理的公有云(40%)。
案例:我們幫助一家風(fēng)電新能源用戶優(yōu)化他們的核心應(yīng)用Bladed,利用云上更新,主頻更高的CPU硬件最大化發(fā)揮應(yīng)用性能,調(diào)度任務(wù)同時支持本地和云上的Windows節(jié)點和Linux節(jié)點。
詳情可聯(lián)系文末小F
EDA/半導(dǎo)體
放眼全球,整個半導(dǎo)體產(chǎn)業(yè)鏈核心角色:EDA軟件/Foundry/Fabless芯片設(shè)計公司/IP廠商無一缺席,早在幾年前就在布局上云。三大EDA巨頭Synopsys/Cadence/Mentor和芯片制造廠TSMC臺積電可以說引領(lǐng)了整個行業(yè)。
國內(nèi)半導(dǎo)體行業(yè)已經(jīng)在暗中追趕。
從AI芯片初創(chuàng)企業(yè)到大型Foundry芯片代工廠,從SaaS模式到多區(qū)域+多公有云的混合模式,到多云PaaS平臺的搭建。我們編了一本《半導(dǎo)體行業(yè)解決方案白皮書》。

詳情可聯(lián)系文末小F
接下來幾年,我們拭目以待。
高校/科研
高校一直走在科研界的最前沿。但他們面臨的問題也十分明顯:
- 人手不足,項目時間有限
- 不管是云,還是HPC,非計算機專業(yè)使用門檻高
- 本地機器過舊,資源少,申請新機器困難
- 學(xué)校IT支持往往也不足
對很多高校來說,500 core的計算資源峰值需求就足以成為一個障礙。
除了常用的工程應(yīng)用,生物分析,化學(xué)計算等常見高性能計算場景,不少高校和科研院所都在搭建自己的一站式AI計算平臺或AI實驗室,滿足自身人工智能應(yīng)用創(chuàng)新開發(fā)或者學(xué)校的AI課程相關(guān)實驗等需求。
在汽車出現(xiàn)之前,我們只想要更快的馬。
汽車出現(xiàn)之后帶來的很多可能性,在馬的時代都是不可想象的。
現(xiàn)在,又到了發(fā)揮想象力的時候啦~
祝大年新春大吉鴨!
- END -
關(guān)于我們:
速石科技專為有高算力需求的企業(yè)級用戶提供一站式算力運營解決方案,幫助用戶提升10-20倍業(yè)務(wù)運算效率,降低成本達到75%以上,加快市場響應(yīng)速度。目前主要應(yīng)用領(lǐng)域包括藥物研發(fā)、基因測序分析、半導(dǎo)體行業(yè)的EDA仿真及電路設(shè)計、汽車行業(yè)的自動駕駛開發(fā)、虛擬碰撞試驗以及AI人工智能。
想了解更多,可添加小F微信(ID:imfastone)
統(tǒng)找它-1024x468.jpg)
文章推薦:
>>靈魂畫師,在線科普多云平臺/CMP云管平臺/中間件/虛擬化/容器是個啥
>>AWS、阿里云、Azure、Google Cloud、華為云、騰訊云 各種云服務(wù)器價格收費對比(上)
>>云資源中的低成本戰(zhàn)斗機——競價實例,AWS、阿里云等六家云廠商完全用戶使用指南