—Cadence 云業(yè)務開發(fā)VP (DAC 2019)
去年9月在DAC(Design Automation Conference)大會之后,我們制作了一個全球半導體行業(yè)上云格局一覽圖,然后得出了兩個結(jié)論:
1. 整個半導體產(chǎn)業(yè)鏈核心角色:EDA廠商/ Foundry/Fabless無一缺席,都已經(jīng)開始上云的步伐;
2. 全球各大云廠商不僅積極擁抱半導體產(chǎn)業(yè),甚至自己主導設計開發(fā)芯片,在產(chǎn)業(yè)鏈中扮演雙重角色。
如果說去年我們的判斷是全球半導體行業(yè)對云的接受度已經(jīng)在跨越鴻溝的邊緣,那上周ICCAD中國集成電路設計業(yè)2020年會結(jié)束后,我們認為國內(nèi)半導體企業(yè)也已經(jīng)跟上了節(jié)奏。
跟2019年相比:
今年有了幾家云廠商的身影出現(xiàn),關(guān)于芯片設計EDA上云趨勢和落地實踐給出了各自的答卷;
也有像恩智浦這樣的公司分享了仿真上云經(jīng)驗,并且在今年全球疫情的現(xiàn)狀下,正在考慮純云模式來滿足遠程協(xié)同需求。
我們?nèi)ツ旮鶕?jù)DAC會議Design on Cloud圓桌討論整理了十個上云實踐問題的過來人解答,有興趣可以去回顧一下:
1. 上云的模式是什么?
2. 最開始,為什么選擇上云?
3. 上云的挑戰(zhàn)主要有哪些?
4. 你覺得EDA供應商準備好上云了嗎?
5. 上云的缺點是什么?
6. 對于芯片設計,云廠商已經(jīng)準備好了嗎?
7. 在云上,一切都需要付錢。怎么控制云上的成本?
8. 你覺得在云上設計安全嗎?
9. 目前為止,上云的成果是什么?
10. 對后來的上云實踐者有什么建議?
今年我們升個級,來個——
1. EDA云平臺能夠解決什么問題?
適配EDA工具使用需求。
大規(guī)模算力自動化智能調(diào)度。
海量多云資源提供彈性算力支持。
總之,讓研發(fā)人員更專心做設計,幫助IT人員更好地管理資源滿足復雜企業(yè)場景需求,最終縮短項目周期,提高公司競爭力。
2. 云上虛擬機的性能可以嗎?
相當,并可以更好。
兩方面原因:
1、云上的硬件更新快;
2、云上虛擬化性能逐步接近裸機。
3. 各個云之間的虛擬機性能有差異嗎?
有。我們可以為用戶提供專業(yè)建議。
4. 支持哪些云?
國內(nèi)外主流云廠商我們都支持。
5. 多云有什么好處?
不會被某一家云廠商鎖定,資源可用性更高。
多云可以最大限度利用不同云廠商的不同優(yōu)勢,比如資源類型,比如產(chǎn)品價格,比如地域選擇。
6. GPU資源也有嗎?
云廠商上有的資源我們都可以支持。
7. 云上用的機型是超線程的?還是物理核的?
大多數(shù)云廠商支持開啟關(guān)閉超線程。
8. 你們和超算有什么區(qū)別?云和超算有什么區(qū)別?
看這篇國內(nèi)超算發(fā)展近40年,終于遇到了一個像樣的對手
9. 你們和云廠商有什么區(qū)別?
我們是從應用出發(fā),為應用定義的云平臺。
而云廠商主要在IaaS層,距離用戶的實際應用還有非常長的距離。
在云的基礎架構(gòu)和應用之間,需要借助應用優(yōu)化、多云環(huán)境支持等方式來滿足用戶需求。
10. 我直接和云廠商合作是不是就行了?
參考答案9。
我們已經(jīng)對接了眾多主流云廠商的API,可以用統(tǒng)一的方式方法完成自動化部署,簡化用戶使用云資源的方式,降低學習成本,幫助用戶高效地用好云。
11. 你們跟云管理平臺有什么不同?
我們更貼近應用,在云管平臺之上。
具體可查看靈魂畫師,在線科普多云平臺/CMP云管平臺/中間件/虛擬化/容器是個啥
12. 支持哪些EDA工具?
支持主流EDA廠商工具,比如Innovus、Spectre、HSPICE、OPC Proteus、Calibre、VCS、Xcelium、Redhawk、PT 、StarRC 、Tmax2 、Skipper、ALPS等等。
13. EDA應用優(yōu)化指的是什么?
根據(jù)特定用戶需求自定義EDA Flow,規(guī)范化EDA作業(yè)流程,加速EDA多任務的調(diào)度。
用戶在云端可選擇的機型有幾百種,配置、價格差異極大,我們能根據(jù)用戶的EDA應用需求推薦最適配的資源。
14. EDA應用在云上能正常跑嗎?
能。
15. License在云上能正常用嗎?
能。
EDA云實證Vol.1:從30天到17小時,如何讓HSPICE仿真效率提升42倍?
EDA云實證Vol.4: 5000核大規(guī)模OPC上云,效率提升53倍
16. 云上的EDA應用怎么部署?是不是每個軟件CAD都要去配置?
我們協(xié)助用戶完成云上EDA應用自動化配置,一次配置,以后自動啟用。
17. 腳本每日都有變動,云上要增加工作量?工作腳本如何更新?
可以延續(xù)之前的使用方式,也可以使用我們提供的方式自動化完成腳本更新。
18. 云上EDA無縫銜接怎么做到的?
云上用戶體驗無差異。
19. 你們的自動化部署有什么好處?
關(guān)于我們在云端部署自動化模式VS傳統(tǒng)手動模式間的巨大差異可查看:從30天到17小時,如何讓HSPICE仿真效率提升42倍?
20. 支持哪些調(diào)度器?
我們支持Slurm/LSF/SGE/PBS。
億萬打工人的夢:16萬個CPU隨你用里,我們基于這四家主流調(diào)度器:LSF/SGE/Slurm/PBS以及它們的9個演化版本進行了梳理和盤點。
21. 開源的調(diào)度器你們怎么提供商業(yè)支持?
我們是開源Slurm調(diào)度器的代碼貢獻者,特別是跟云相關(guān)的功能點。
我們提供Slurm配置/優(yōu)化/調(diào)試/應用對接的最佳實踐。
22. 你們就是個調(diào)度器嗎?
調(diào)度器是我們平臺的一個重要組件。
23. 你們說的智能調(diào)度是什么?
我們是基于用戶策略的雙層智能調(diào)度。
上層調(diào)度程序支持靈活的用戶策略:
-基于位置
-基于性能
-基于成本
-基于團隊/組織目標……
下層調(diào)度程序滿足應用要求:
-基于Slurm/LSF/SGE/PBS的工作任務
-基于容器的K8S工作任務…
智能調(diào)度用戶策略詳情看這個:生信云實證Vol.3:提速2920倍!用AutoDockVina對接2800萬個分子
24. 為什么要Auto-Scale自動伸縮?
省錢,省心。
我們的Auto-Scale功能自動監(jiān)控用戶提交的任務數(shù)量和資源的需求,動態(tài)按需地開啟和關(guān)閉所需算力資源,在不夠的時候,還能根據(jù)不同的用戶策略,自動化調(diào)度本區(qū)域及其他區(qū)域的目標類型或相似類型實例資源。
所有操作都是自動化完成,無需用戶干預。
劃個重點,這里的關(guān)機對于成本的節(jié)約極其有幫助。
25. 數(shù)據(jù)怎么做到云上、線下同步?
我們有專門的數(shù)據(jù)傳輸工具,提高傳輸效率。支持全自動化數(shù)據(jù)上傳,可充分利用帶寬,幫助用戶快速上傳、下載海量數(shù)據(jù)。同時,利用fastone自主研發(fā)的分段上傳、高并發(fā)、斷點續(xù)傳等數(shù)據(jù)傳輸技術(shù),優(yōu)化海量數(shù)據(jù)的傳輸效率。
也支持VPN/專線接入。
26. 很多PDK,就有幾十T,怎么到云上,而且需要持續(xù)更新?
離線傳輸方式可以初始化傳輸大量數(shù)據(jù)。
很多PDK廠商也提供了在云上的訪問方式。
27. 改變我們現(xiàn)在研發(fā)人員的使用習慣和體驗嗎?
基本沒有改變。
我們支持桌面接入和SSH接入。
28. 任務和集群的區(qū)別是什么?
任務更適用于流程固定并且經(jīng)常有運行需求的任務,全程圖形化界面。
集群相對于任務,屬于更高級的用法,用戶可以直接SSH到云上的集群使用,可以直接進行應用的開發(fā)和調(diào)試。使用方式和本地無差別。
29. 我能直接創(chuàng)建云上HPC集群嗎?
可以。
我們支持普通用戶模式和高級用戶模式。
高級用戶,比如本身對應用工作流的理解和編程能力超強,可以不用走普通用戶通過應用向?qū)教峤坏穆窂剑梢灾苯痈鶕?jù)自己寫的腳本,通過Web瀏覽器選擇新建集群,然后按需動態(tài)地在云端創(chuàng)建HPC集群,包括權(quán)限,計算資源,存儲資源等。
30. 怎么監(jiān)控、管理任務與集群的運行情況?
提交任務后,可以在監(jiān)控界面中查看任務和集群運行情況。
31. 支持混合云模式嗎?
支持。
我們支持本地資源不足的時候,自動溢出到云上。
下圖是一個混合云模式架構(gòu)圖。
32. 增加一套云環(huán)境,對于IT管理會不會帶來額外的負擔?
通過我們可以在不增加負擔的情況下對接多云,減少IT管理壓力。
我們易用的自動化管理平臺對IT人員來說很容易上手,對提升工作效率和資源利用率都有很大幫助。
33. 如何云上保護我們的IP資產(chǎn)?
可以延續(xù)公司原有的安全流程、工具,結(jié)合云上完整的審計、監(jiān)控和權(quán)限管理功能。
我們有豐富的安全實踐。
34. 云上云下的安全?
安全是一個立體的概念,包括系統(tǒng)安全、應用安全、流程安全、數(shù)據(jù)安全等很多方面。
云的基礎架構(gòu)和傳統(tǒng)IT架構(gòu)在安全方面并沒有本質(zhì)上的區(qū)別,依然是利用計算節(jié)點和存儲資源。很多人覺得這兩者之間存在差異,我們認為這取決于個人的認知。
35. 支持純云模式嗎?
支持,文末可以直接注冊免費試用。
36. 關(guān)于選擇哪種上云模式你們有什么建議?
從我們接觸的企業(yè)看來,既有老牌企業(yè)從純本地逐漸過渡到本地+云的混合云模式的,也有初創(chuàng)公司直接從云端起步,逐漸添加本地機器,最后形成混合云模式的。
對于國內(nèi)企業(yè)來說,混合云應該是各種企業(yè)類型最終能接受的完成形態(tài),既保留有本地的私密性,也時刻享有云端的靈活性。
37. 用云是不是很貴/便宜?
企業(yè)上云是否便宜取決于具體應用場景,云的成本結(jié)構(gòu)高度依賴于自動化和智能化的運營能力,效率的提升帶來TCO的降低才是計算云成本的正確思路。
幫助CXO解惑上云成本的迷思,看這篇就夠了
38. 你們有優(yōu)化成本的方案嗎?
三個層面:
從應用適配層面,我們會在多云里選擇最適合用戶應用場景的最具性價比資源;
從IT部署方面,通過自動化按需部署和資源實時監(jiān)控管理進行成本優(yōu)化;
從任務運行層面,我們根據(jù)用戶不同策略進行智能調(diào)度。當以成本優(yōu)先策略為第一優(yōu)先策略時,資源選擇以SPOT實例為主,并在滿足用戶成本要求的前提下使用OD按需實例來優(yōu)化時間效率,相比時間優(yōu)先策略,成本降幅最多可達67%-90%。
39. 跨國團隊研發(fā)協(xié)同你們有解決方案嗎?
跨國協(xié)同面臨的IT挑戰(zhàn),一個是數(shù)據(jù)傳輸,一個是網(wǎng)絡質(zhì)量。
我們有支持多本地的IT一體化落地案例。
再來幾個具體點兒的:
40. HSPICE任務能否在云端運行?
41. 云端資源是否能適配HSPICE任務需求?
42. fastone平臺能否有效解決目前業(yè)務問題?
43. 相比傳統(tǒng)手動模式,云端計算集群的自動化部署,有哪些好處?
44. OPC任務能否在云端有效運行?
45. fastone平臺能否滿足業(yè)務彈性資源需求,有效減少OPC運行時間?
46. License Server配置在本地和云端對計算性能/一致性/穩(wěn)定性是否有影響?
47. fastone能否支持不同調(diào)度器SGE/Slurm?
48. 使用不同調(diào)度器對計算性能/一致性/穩(wěn)定性是否有影響?
49. fastone平臺的云端輸出計算結(jié)果是否與本地完全一致?
- END -
我們有個【在線體驗版】
平臺集成多種應用,大量任務多節(jié)點并行
應對短時間爆發(fā)性需求,連網(wǎng)即用
跑任務快,原來幾個月甚至幾年,現(xiàn)在只需幾小時
5分鐘快速上手,拖拉點選可視化界面,無需代碼
支持高級用戶直接在云端創(chuàng)建集群
點擊下圖免費試用,送200元體驗金,入股不虧~
你也許想了解具體的落地場景:
怎么把需要45天的突發(fā)性Fluent仿真計算縮短到4天之內(nèi)?
5000核大規(guī)模OPC上云,效率提升53倍
提速2920倍!用AutoDock Vina對接2800萬個分子
從4天到1.75小時,如何讓Bladed仿真效率提升55倍?
從30天到17小時,如何讓HSPICE仿真效率提升42倍?
關(guān)于云端高性能計算平臺:
國內(nèi)超算發(fā)展近40年,終于遇到了一個像樣的對手
幫助CXO解惑上云成本的迷思,看這篇就夠了
靈魂畫師,在線科普多云平臺/CMP云管平臺/中間件/虛擬化/容器是個啥
花費4小時5500美元,速石科技躋身全球超算TOP500
IT資源~~得不到的永遠在騷動~~要么花更長時間,要么降低對質(zhì)量的追求,這種無奈的取舍是半導體行業(yè)一直以來的痛。
如果說EDA工具的出現(xiàn)是半導體行業(yè)的第一次革命,幫助芯片設計人員用更簡單的方法從事設計工作,以縮短研發(fā)周期,降低設計成本。
那么,云計算可能是第二次產(chǎn)業(yè)革命的開端。雖然云計算本身已經(jīng)出現(xiàn)十年之久,但直到現(xiàn)在,也許才能看出一些端倪。 我們看一下現(xiàn)在的全球半導體行業(yè)上云格局一覽圖(基于最新公開資料整理):
1、 整個半導體產(chǎn)業(yè)鏈核心角色:EDA供應商/ Foundry/Fabless無一缺席,都已經(jīng)開始上云的步伐。
2、 全球各大云廠商不僅積極擁抱半導體產(chǎn)業(yè),甚至自己主導設計開發(fā)云端AI芯片,在產(chǎn)業(yè)鏈中扮演雙重角色。
3、 圖上只是根據(jù)公開資料整理出來的半導體云玩家,更多公司還在冰山之下。這意味著,不光是上云企業(yè)與本地企業(yè)之間,云上企業(yè)之間的競爭也已經(jīng)暗流涌動。
如果下面這張圖代表整個半導體行業(yè)對云的接受度,也許我們已經(jīng)站在跨越鴻溝的邊緣:
云有一個奇妙的特性:花同樣的錢,你可以讓100臺機器跑1個小時,也可以讓1臺機器跑100個小時,但是不同時間消耗帶來的結(jié)果完全不一樣,可能事關(guān)生死。
半導體企業(yè)上云并不是直接把本地數(shù)據(jù)中心生態(tài)系統(tǒng)搬到另一個地方,是一個涉及資產(chǎn)與成本,當下與未來的綜合決策。
而在這場生死之戰(zhàn)中,在半導體企業(yè)到一朵云或者多云服務之間,速石的角色是什么?
我們辛總給我打了個樸實的比方:假如你要打掃家里,以前你買的是N把掃把,現(xiàn)在你買的是一個智能掃地機器人。地是云服務商掃的,我們主要是智能機器那部分。嗯,話說得有點糙,而且簡化得有點過分,大家意會~~
拒絕意會的,歡迎文末掃碼聯(lián)系小F,我們用五個詳細案例告訴你我們是怎么解決半導體行業(yè)三種模式(純云SaaS/混合云+多區(qū)域/EDA云平臺)下不同企業(yè)用云需求的。
DAC是集成電路設計界的大聚會,是全球EDA、Foundry、IP提供商的盛會,今年是第35屆了。從去年開始,DAC有了專門的“design on cloud” 部分。
如果說去年是云廠商(AWS/Azure/Googlecloud,包括阿里云)和眾多IT服務商張開懷抱對芯片公司說:我可以。
過去一年,有了明顯變化。
今年6月,我們看到了不少芯片設計公司的身影,他們作為過來人出來現(xiàn)身說法,講自己上云的那點事兒。
1家Foundry,1家EDA,4家Fabless。
上云的模式是什么?
最開始,為什么選擇上云?
上云的挑戰(zhàn)主要有哪些?
你覺得EDA供應商準備好上云了嗎?
上云的缺點是什么?
對于芯片設計,云廠商已經(jīng)準備好了嗎?
在云上,一切都需要付錢。怎么控制云上的成本?
你覺得在云上設計安全嗎?
目前為止,上云的成果是什么?
對后來的上云實踐者有什么建議?
上云的模式是什么?
QST:純公有云模式+AWS為主
AFRL:純公有云模式+AWS為主
TSMC:OIP VDE虛擬設計環(huán)境+ AWS+ Google Cloud+Azure
Cadence:Cadence Cloud Portfolio+AWS+ Google Cloud+Azure
eSilicon:混合云模式逐漸過渡到純公有云模式+Google Cloud
Astera Labs:純公有云模式+AWS
最開始,為什么選擇上云?
QST:
我們公司是2018年8月成立的,主要做基于MEMS傳感器的解決方案。剛成立的時候接到一個客戶需求,只有6個月的時間就要Tapeout,根本沒有給我們時間搭本地基礎架構(gòu),所以直接選擇了上云。當然,結(jié)果非常好,我們成功在規(guī)定期限前完成了任務。
AFRL:
不要覺得AFRL是一個大公司,其實我們就是一個獨立的小組,更像一個小公司。我在做的這個項目其實是個DOD(國防部)的項目,我們空軍這塊只是整個芯片項目的PoC。
我們選擇云的原因主要原因是完全搭一套本地設計環(huán)境周期太長,流程又長又復雜;另一個原因是我們的人員包括了海軍、軍隊、空軍研究員和小組,分散各地,搭建一套本地的IT合作環(huán)境讓所有外部人員遠程登錄非常麻煩,最好可以有一套無視大家地理位置的解決方案,讓所有人盡管分散在各地也能在一起順利完成任務。
TSMC:
我們2018年宣布OIP云端聯(lián)盟成立。一方面是受AI/5G等大環(huán)境驅(qū)動,另一方面,我們不可能永遠有足夠的本地計算資源,內(nèi)部我們開始用云端方案來協(xié)助芯片設計,既然我們用了,我們就覺得也應該開放給我們的用戶用,讓他們能受益,不用受資源所限,能更快完成他們的設計。
聯(lián)系小F(ID:imfastone),獲取某Foundry EDA設計云平臺模式解決方案
Cadence:
2018年發(fā)布Cadence Cloud Portfolio,臺積電、亞馬遜、微軟和谷歌都是合作伙伴。2019年4月,我們發(fā)布了CloudBurst平臺,6月又發(fā)布了Cloud Passport合作伙伴項目。
以前跟我的用戶們聊云,基本上一聊到安全就聊不下去了。但現(xiàn)在這個行業(yè)的新公司大量涌現(xiàn),都在認真考慮云這件事,因為的確幫他們省了一大堆麻煩和注意力,不用考慮搭建一套工作流,也不用考慮搭建設計環(huán)境等等。
所以現(xiàn)在我感覺趨勢是:小公司正在考慮把整個基本架構(gòu)都換成云,而大一些的公司,正在評估接下來到底怎么走。是做一個單獨項目,還是把某項功能放在云上運行,平衡本地和云的資源,這是一個謹慎的決策。
我聊的每一個人都表示對云感興趣,所以我覺得現(xiàn)在的問題在于什么時候上云,而不在于上不上云這件事。
eSilicon:
2000年成立,在用傳統(tǒng)方法做了20年ASIC芯片后,eSilicon決定放棄本地,把整個芯片設計都搬到云上。
我們的轉(zhuǎn)變開始于2014年,當CEO Jack Harding問了一個問題:計算硬件設施到底給我們帶來了什么?那時候我們是租的數(shù)據(jù)中心的機器,設計一枚芯片的過程中,我們至少需要把租用的機器數(shù)量翻一倍,這我們實在有點沒法接受。那時候,我們的團隊才真正開始研究到底要怎樣才可以有效使用云資源。
我們現(xiàn)在的目標是:到2020年前,全面上云,我們將成為一個Serverless的公司,不擁有任何硬件。
Astera Labs:
我們公司2017年成立的。關(guān)于上不上云,做決定前,我們有三個決策原則:
1、我們想把所有的資源放在創(chuàng)造價值上;
2、本地沒有專門的IT團隊,這也不是我們的強項;
3、隨著公司的成長,我們需要快速迭代。
所以對我們來說,其實選擇很簡單:
本地+云混合模式:第一時間否決,既要管本地,還要管云,雙重頭疼
完全本地模式:專業(yè)的IT團隊,大量的前期投入,只能不斷擴張(不能減少),同樣否決
Synopsys/Cadence平臺:EDA供應商限制了我的工具使用范圍,有限的計算架構(gòu)
純公有云模式:同時具備規(guī)模擴張性和彈性,外包支持服務最后,我們選了AWS,外包IT團隊,免去所有頭疼的事情。
聯(lián)系小F(ID:imfastone),獲取芯片設計公司混合云+SaaS模式上云解決方案
上云的挑戰(zhàn)主要有哪些?
QST:
6個月的時間就要Tapeout,時間非常緊。
AFRL:
希望可以有一套不用考慮大家地理位置的解決方案,讓分散在各地的小組成員能在一個環(huán)境下共同順利完成工作。
TSMC:
安全是一切的基礎。我們花了兩年多時間專心于安全問題,和我們公司的IT部門一起研究怎么和云廠商合作,檢測所有細節(jié)?,F(xiàn)在我們有了云安全資質(zhì)計劃,還有一些安全方面的合作伙伴在我們的云聯(lián)盟里。
Cadence:
云一種全新的架構(gòu)。我們在努力朝這個方向前進。
eSilicon:
1、對本地芯片設計工作流最小影響,最好不影響
2、降低IP開發(fā)工作負載的成本
3、運行更多的IP仿真
4、云上的集成和運維問題
5、IP安全:公有云上的IP存儲
Astera Labs:
1、本地沒有IT團隊,不想把重心放在核心業(yè)務之外的工作任務上
2、最頭疼的是在云上管理排隊任務。
3、大量并行工作任務意味著大量數(shù)據(jù)管理,技術(shù)資源成為最大的瓶頸
聯(lián)系小F(ID:imfastone),了解我們怎么幫你智能調(diào)度本地及云上資源
你覺得EDA供應商準備好上云了嗎?
TSMC:
我們既和各大云廠商合作,也跟EDA供應商合作.當我們嘗試在云上做一些互動式的任務,因為我們在臺灣,最近的數(shù)據(jù)中心可能在新加坡,距離有3000公里,不管你怎么優(yōu)化路由,都會有50-60分鐘延遲,這會給EDA工具帶來一些壓力。但積極的一面在于在過去的9個月時間,EDA合作伙伴都非常配合,找出問題在哪,怎么優(yōu)化。
我覺得,以前并沒有所謂的云使用范式或者標準,所以EDA廠商現(xiàn)在沒必要針對云端使用做全面優(yōu)化。直到有一天大家都在用了,自然就會做了。整體來說,現(xiàn)在使用上沒什么問題。這將是我們接下來幾年的共同未來目標。
Astera Labs:
EDA工具在云上使用很順利,當然,也有一些改進的空間。比如,基于云上架構(gòu)做優(yōu)化,能夠更好地利用云上的各種計算資源,存儲服務等。重點提醒:出錯容忍度低的應用可以使用云端可被搶占實例。
上云的缺點是什么?
QST:
因為安全的原因,所有的東西必須經(jīng)過cadence,一切問題都必須提交一個工單,不能直接打個電話或者走到辦公室的另一頭找IT部門,這會增加一些時間成本。但另一方面這又非常有用,因為一切事情都可以量化,雖然花了一點時間,但問題總是會及時得到解決。這花了我們團隊幾個月時間來適應,但現(xiàn)在一切都很好。
第二個問題在于,如果你試圖評估到底在云上需要多少資源,多少用戶,怎么彈性擴張的,這是一個嘗試和學習的過程。
你需要增加你的運維團隊,你需要在不同的國家做擴張。我們有團隊在臺灣,有團隊在上海,還有外包團隊在印度,硅谷也有員工,一直在加人。怎么讓這些人在線,你有多少個接口登陸,開了多少個服務器,這中間有很多要權(quán)衡的東西。
當你有一大堆驗證要做,你能用多少個license,你能有多少計算資源,你是全部都本地擁有,還是考慮成本的原因,減少本地資源,在云上做彈性擴張。這些都需要花時間。
哪怕你有一個好的IT部門和通過VPN連接的彈性計算資源,也會遇到同樣的問題。
AFRL:
整體來說,上云是一個積極的體驗。如果你的IT部門不熟悉云架構(gòu),不了解云的運行方式,這個跨越可能會有點痛苦。它跟在本地完全不一樣。云的運行方式不一樣,計費模式不一樣,存儲模式不一樣。所以你可能可以在云上運行起來,但如果你只是在云上復制在本地的一切,你可能沒辦法最大化利用云的價值。
我建議你最好確保有一個不錯的懂云的團隊。
聯(lián)系小F(ID:imfastone),了解為什么我們能幫你最大化利用云的價值
對于芯片設計,云廠商已經(jīng)準備好了嗎?
TSMC:
所有的云廠商都針對EDA工作任務推出了新的VM類型,我們不說CPU有多快,我們還要考慮內(nèi)存有多大,存儲IO有多快多有效,我們看的是整個服務包。我們已經(jīng)對外公布了要在云上做5nm芯片,這給我們云合作伙伴帶來了很大的壓力,包括EDA合作伙伴。我們和產(chǎn)業(yè)內(nèi)其他伙伴都在一個生態(tài)系統(tǒng)里,大家明白我們都需要對方,所以我們的合作從理解各自的需求,在哪里可以增加價值開始?,F(xiàn)在我們半導體行業(yè)已經(jīng)吸引了云廠商的關(guān)注,我們開始試圖與對方合作,提供一些解決方案讓芯片設計從業(yè)者能夠從中受益。
在云上,一切都需要付錢。怎么控制成本?
Cadence:
我們內(nèi)部也有這樣的經(jīng)歷,因為我們也在云上做一些開發(fā)工作。我曾經(jīng)和IT部門的同事討論過,他們通常低估了跟蹤誰在什么時候用了什么服務這件事,而當賬單來臨的時候,一個工程師可能跑了上千個任務,他們可能也記不清自己用了些什么。這是個值得注意的問題。
關(guān)于這個問題,如果只從成本支出的角度來考慮這個問題,很可能會得出這個結(jié)論,最具性價比的方式是在本地擁有你的服務器并且100%地使用他們。而我們應該要考慮的是成本和收益的平衡問題。通常,我們都從云上獲得了一些商業(yè)好處,更快占領市場,獲取更多客戶等等。這不是一個完全的替換關(guān)系,你看看靜態(tài)的歷史數(shù)據(jù),就能比較出結(jié)果。
eSilicon:
在ASIC芯片的商業(yè)世界里,成本就是一切。過去,當你的工程師要用大量的資源,都是按照過去預計未來用量。現(xiàn)在用了云,很簡單,我們就直接規(guī)定某個人這次只能用一定量的資源。
聯(lián)系小F(ID:imfastone),了解我們怎么幫你優(yōu)化及控制云上成本
你覺得在云上設計安全嗎?
QST:
作為一家創(chuàng)業(yè)公司,我對安全的定義有些不一樣。我們大部分時間是和AWS合作。作為一家做創(chuàng)意設計和IP的公司,你希望保障自己的全部。但現(xiàn)實情況是,你不可能確保擁有最優(yōu)秀的IT和最好的安全人員。
如果你在本地搭建你的整個設計系統(tǒng)和環(huán)境,服務器都在本地,我可以跟你保證你的安全措施肯定是很差的,很容易被外部破解。如果你的IP在云上開發(fā)和存儲,比如AWS,比如cadence,你知道AWS在云上遵循的安全準則,肯定比在本地要安全多了。
目前階段,我們完全不擔心安全這個問題,但這不意味著如果有一天我們成長壯大之后我們不會改變。
AFRL:
盡管我們是云懷疑論者。但大的云廠商在云安全上的控制是對外公開的,每個人都知道你能得到什么,你能夠?qū)徲嬕磺邪踩募?/strong>
像我們這個項目,不同的研究人員分散在不同的地方,還有外包商等等,鬼知道他們的IT情況怎么樣,我們把大家拉到一起,能確保大家在同一個系統(tǒng)里,遵守了同一套準則。而不是制定一套準則,寄希望于他們能按這個標準實施。誰知道結(jié)果會怎么樣?
目前為止,上云的成果是什么?
TSMC:
臺積電的OIP 云端聯(lián)盟現(xiàn)在已經(jīng)跟三大EDA供應商:Synopsys/Cadence/Mentor,以及云廠商AWS/Azure/GoogleCloud正式合作,運用云端技術(shù)輔助芯片開發(fā)。
已經(jīng)擁有臺積電云端平臺使用經(jīng)驗的SiFive位于美國硅谷與印度Bangalore的團隊,通過云端進行設計,在不到三個月時間就完成了整套前后端設計,創(chuàng)下速度上的新高記錄。
eSilicon:
1、經(jīng)過測試,云上的資源比原來本地硬件設備表現(xiàn)提升了15%,同時能跑的任務比原來多了一倍。
2、云運維成本跟原來相比大大降低,我們估計了一下如果有一個類似的本地解決方案達到現(xiàn)在的效果,大概要花公司幾百萬美元。
3、沒有閑置資源,可以使用更多彈性資源,無限檔案存儲
4、加速芯片設計完成周期,能完成更多客戶需求
5、不受本地資源限制,避免硬件投資
6、縮短推出市場的時間,提升設計結(jié)果質(zhì)量
7、云上有天然自帶監(jiān)控系統(tǒng)的架構(gòu),更容易追蹤記錄,進行用戶管理和監(jiān)控
8、未來發(fā)展機器學習的可能性
Astera Labs:
1、過去存儲怎么使用都不夠,現(xiàn)在可以無限擴展
2、工作安排可以排得比以前更多
3、我們充分利用了云資源的可擴展性和最新型的實例類型
4、可以根據(jù)不同任務使用獨立的云資源
5、我們可以做出更高質(zhì)量的芯片
聯(lián)系小F(ID:imfastone),了解我們用戶案例的上云表現(xiàn)
對后來的上云實踐者有什么建議?
eSilicon:
1、把PDK、EDA工具和管理服務在云端做備份,減少本地和云端數(shù)據(jù)傳輸
2、只選取數(shù)據(jù)結(jié)果的一小部分在云端和本地同步
3、為了安全,云上的數(shù)據(jù)暫存區(qū)需要更高頻的清理
4、多云/多區(qū)域的資源整合和調(diào)度,對使用云上的可被搶占實例很重要,能降低成本
5、在云上必須使用SSD和高速存儲,提供足夠的擴展性和性能
6、不同的任務有獨占的分布式文件系統(tǒng),提供必要的性能和服務質(zhì)量
7、擁抱云上的彈性資源,不要用原來使用本地數(shù)據(jù)中心的方式來用云
8、根據(jù)不同的任務類型選擇更優(yōu)化的云上資源
9、如果本地就有l(wèi)icense不夠,任務排隊的問題,這會在云上花更多的錢(排隊也花錢)
10、善于使用可被搶占實例等折扣
11、對數(shù)據(jù)分層,選擇不同存儲方式:SSD、HD和云上存儲
12、注意:不同賬戶在云上使用資源是有限額的
Astera Labs:
1、一定要用可被搶占實例
2、使用成本是一定會被低估的,所以在快/好/便宜三個標準之間,按自己的情況,選擇兩個就夠了
《六家云廠商價格比較:AWS、阿里云、Azure、Google Cloud、華為云、騰訊云》的下篇就講六大云廠商的可被搶占實例,建議關(guān)注一下我們,大約下期發(fā)~~
Cadence:
1、花足夠的時間理清楚,公司用云的優(yōu)先級是什么,這些討論/分析/研究接下來會節(jié)約你很多時間。因為不同人對云的期待可能不一樣,如果沒有達成一致,會浪費很多時間。
2、確定你的使用模式是什么,是一個完整的項目,還是一個功能,還是為了合作。明確這一點,你能用正確的架構(gòu)來解決你的問題。
3、不只是在你的公司內(nèi)部,包括Foundry,包括工具提供商,第三方IP供應商,會涉及到大量協(xié)作。
作為半導體行業(yè)從業(yè)者你對云的接受度在哪個區(qū)域呢?
- END -
關(guān)于我們:
速石科技專為有高算力需求的企業(yè)級用戶提供一站式算力運營解決方案,幫助用戶提升10-20倍業(yè)務運算效率,降低成本達到75%以上,加快市場響應速度。目前主要應用領域包括藥物研發(fā)、基因測序分析、半導體行業(yè)的EDA仿真及電路設計、汽車行業(yè)的自動駕駛開發(fā)、虛擬碰撞試驗以及AI人工智能。
想了解更多,可添加小F微信(ID:imfastone)
文章推薦:
The post 全球半導體行業(yè)上云格局一覽和十個上云實踐問題的過來人解答 appeared first on 速石科技BLOG.]]>