2017年9月19日,英特爾在京召開了PSG IFTD媒體見面會(huì)。英特爾可編程解決方案事業(yè)部副總裁兼客戶體驗(yàn)事業(yè)部總經(jīng)理Rina Raman女士做了“英特爾FPGA:加速建設(shè)智能互聯(lián)世界”的演講,介紹了FPGA技術(shù)、FPGA技術(shù)的主要應(yīng)用、英特爾FPGA技術(shù)特色等事項(xiàng)。Raman女士的演講內(nèi)容豐富詳盡,形式也很正式,這里就全文登出演講實(shí)錄,請(qǐng)讀者就自己感興趣的內(nèi)容選擇瀏覽。 Rina Raman:謝謝大家!我是來自英特爾公司的可編程解決方案事業(yè)部。我工作的地址在圣何塞。今天主要內(nèi)容給大家介紹一下FPGA,F(xiàn)PGA怎么樣幫助我們加速實(shí)現(xiàn)一個(gè)智慧的互聯(lián)的世界。 可以看到,在互聯(lián)的世界,數(shù)據(jù)的需求呈現(xiàn)出一個(gè)指數(shù)型的增長,預(yù)測估計(jì)在2020年一個(gè)平均的互聯(lián)網(wǎng)用戶每天會(huì)產(chǎn)生1.5GB的數(shù)據(jù),無人駕駛車輛每天會(huì)產(chǎn)生4TB,聯(lián)網(wǎng)的飛機(jī)每天會(huì)產(chǎn)生5TB的數(shù)據(jù)量,智慧工廠每天是1PB的數(shù)據(jù)量,云視頻的提供商會(huì)產(chǎn)生750PB的數(shù)據(jù)量。可以看到在一個(gè)聯(lián)網(wǎng)的世界,我們數(shù)據(jù)量的需求會(huì)急劇增長。 根據(jù)預(yù)測,到2020年,將會(huì)有500億個(gè)終端聯(lián)網(wǎng),現(xiàn)在我們聯(lián)網(wǎng)的終端數(shù)量是80億個(gè),未來聯(lián)網(wǎng)的這些終端數(shù)量比現(xiàn)在所需要的帶寬每一個(gè)都要高。思科預(yù)測到2020年IP的流量會(huì)達(dá)到2300EB量級(jí)每年,數(shù)據(jù)中心會(huì)和這些終端連接起來,這些終端又會(huì)和數(shù)據(jù)中心實(shí)現(xiàn)連接,這樣我們就稱為一個(gè)良性的循環(huán),這個(gè)循環(huán)開始隨著物聯(lián)網(wǎng)的發(fā)展會(huì)加速,意味著網(wǎng)絡(luò)就必須要在更高的速度上處理更多的數(shù)據(jù),數(shù)據(jù)中心也必須要做更復(fù)雜的計(jì)算,處理更大的數(shù)據(jù)集,即使嵌入式的終端和設(shè)備也要做很多本地的計(jì)算。 除此之外,數(shù)據(jù)中心還會(huì)應(yīng)對(duì)一些更加具有挑戰(zhàn)性的工作負(fù)載。比如說要進(jìn)行大數(shù)據(jù)的分析,還有機(jī)器學(xué)習(xí),最后可以看到在整個(gè)循環(huán)當(dāng)中我們會(huì)出現(xiàn)一些瓶頸和計(jì)算的熱點(diǎn),這個(gè)是CPU單獨(dú)無法應(yīng)對(duì)的,所以說這個(gè)時(shí)候就需要FPGA。 我們可以看到這個(gè)幻燈片上列出來了我們FPGA針對(duì)現(xiàn)在應(yīng)用最早、轉(zhuǎn)型最厲害的六個(gè)全球的市場,一個(gè)是5G無線通訊,另外一個(gè)是雷達(dá)和航天,還有網(wǎng)絡(luò)的轉(zhuǎn)型、云計(jì)算、智慧城市和無人駕駛車輛。無論是哪個(gè)市場,實(shí)際上它們都面臨著同樣的挑戰(zhàn),就是連接的數(shù)量在急劇增長,計(jì)算的復(fù)雜度也在不斷地增長,這就會(huì)帶來瓶頸和熱點(diǎn)。這個(gè)時(shí)候,F(xiàn)PGA就可以幫助我們很好地應(yīng)對(duì)這些挑戰(zhàn)。它利用FPGA,你的系統(tǒng)的設(shè)計(jì)不會(huì)被鎖定,開發(fā)時(shí)間沒有那么長,而且相比這些專用的硬件來說,它更具有靈活性。 現(xiàn)在我們都知道我們?cè)诔?G無線通訊的時(shí)代在邁進(jìn),我們可以看到5G未來需要更大的帶寬,需要更復(fù)雜的數(shù)字信號(hào)處理能力,但是現(xiàn)在5G的標(biāo)準(zhǔn)沒有最終確定,所以我們不知道5G把消費(fèi)者和物聯(lián)網(wǎng)的這些終端連接到云以后會(huì)出現(xiàn)什么樣的用力。現(xiàn)在英特爾處在一個(gè)非常獨(dú)特的位置上,能夠幫助我們應(yīng)對(duì)5G所帶來的挑戰(zhàn),比如說像固定功能和軟件、硬件、可編程的終端,還有端到端的解決方案,在整個(gè)良性循環(huán)中的每一個(gè)點(diǎn),我們都能提供我們的解決方案。 特別是在5G網(wǎng)絡(luò)上面,我們的FPGA可以有以下一些能力,比如說加速M(fèi)IMO天線的計(jì)算和基帶的信號(hào)的處理,安全,還有其他一些可能會(huì)制約發(fā)展的網(wǎng)絡(luò)的功能。 另外在航空領(lǐng)域,特別是像雷達(dá)處理到安全的通訊,的確也面臨著一系列的挑戰(zhàn)。包括像波速形成和過濾和更多的像機(jī)器學(xué)習(xí)的算法等等方面的挑戰(zhàn),傳統(tǒng)的方法是我們要使用更快的CPU和DSP芯片陣列或者是ASIC專用的集成電路來應(yīng)對(duì),但是,通過使用FPGA,我們可以加速數(shù)字的處理,加速處理機(jī)器學(xué)習(xí)的一些任務(wù),這樣的話讓我們整個(gè)架構(gòu)會(huì)更加簡單,而且開發(fā)的環(huán)境也更加統(tǒng)一。 在網(wǎng)絡(luò)方面,我們可以看到加速的良性循環(huán)和物聯(lián)網(wǎng)的不斷發(fā)展,要求我們網(wǎng)絡(luò)要進(jìn)行根本性的轉(zhuǎn)型,無論是在本地網(wǎng)還是在城域網(wǎng),還是在互聯(lián)網(wǎng)骨干,甚至在數(shù)據(jù)中心,都要進(jìn)行轉(zhuǎn)型。可以看到其中轉(zhuǎn)型的一個(gè)最關(guān)鍵的核心就是網(wǎng)絡(luò)功能虛擬化NFV,就是把我們一些關(guān)鍵的功能,像切換、交換、安全和流量、成型,從我們專用的硬件轉(zhuǎn)移到數(shù)據(jù)中心中的一些軟件硬件上面來處理。 另外,這個(gè)轉(zhuǎn)型可能也會(huì)帶來流量方面的一些瓶頸和計(jì)算的熱點(diǎn),所以,在這樣一個(gè)充滿了不確定性和快速變化的環(huán)境當(dāng)中,F(xiàn)PGA就給我們提供了一個(gè)很好的解決辦法,因?yàn)樗軌蚣铀僖恍╆P(guān)鍵數(shù)據(jù)包的交換、數(shù)據(jù)包的檢測以及安全任務(wù)的處理。 在無人駕駛汽車領(lǐng)域,我們可以看到大家都在這方面有很多的投入,這也很好地說明了FPGA能夠加速我們剛才所談到的良性的循環(huán)。可以看到,隨著無人駕駛汽車的發(fā)展,對(duì)性能將會(huì)有一個(gè)極大的要求,再加上對(duì)算法和用力方面有很大的不確定性,所以,我們看到可能會(huì)出現(xiàn)計(jì)算的孤島,每個(gè)孤島都可能有自己本身的硬件和開發(fā)環(huán)境,這對(duì)制造商來說可能是不可持續(xù)的。FPGA實(shí)際上在以下兩個(gè)領(lǐng)域能夠發(fā)揮非常關(guān)鍵的作用,一個(gè)是本地計(jì)算,比如說傳感器、融合,還有深度學(xué)習(xí)的推算方面,實(shí)際上這些都是要在汽車上本地實(shí)時(shí)的進(jìn)行的。 另外,還有安全可靠的5G連接,把汽車和另外其他的車輛和高速公路的基礎(chǔ)設(shè)施和云實(shí)現(xiàn)連接。 另外,看到在智慧城市的領(lǐng)域,現(xiàn)代化的當(dāng)中有很多的計(jì)算孤島正在出現(xiàn),包括像我們的交通管理系統(tǒng)和照明管理系統(tǒng),泊車管理系統(tǒng)和安全的攝像頭,實(shí)際上他們都是各自為政,這些眾多不同的系統(tǒng)由眾多不同的廠家來生產(chǎn),有不同的架構(gòu),有不同的開發(fā)環(huán)境,更重要的是這些不同的系統(tǒng)之間沒有辦法實(shí)現(xiàn)數(shù)據(jù)的共享,所以,作為城市管理者來說,很難獲得一個(gè)對(duì)城市正在發(fā)生的情況的全面的了解。 英特爾的CPU加上FPGA就能取代這些專有的架構(gòu),可以提供一些像本地計(jì)算、連接和分析的能力,只需要通過加速幾個(gè)關(guān)鍵的功能就能實(shí)現(xiàn)。 另外,我們也可以把這些眾多的孤島放到一個(gè)單一的英特爾架構(gòu)上面,再加上FPGA的環(huán)境,再加上5G的網(wǎng)絡(luò),實(shí)際上可以讓我們整個(gè)開發(fā)的成本實(shí)現(xiàn)很好的降低,降低錯(cuò)誤率,另外還可以讓我們具備數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的能力,這樣的話,我們就可以了解網(wǎng)絡(luò)產(chǎn)生數(shù)據(jù)到底能給我們帶來什么,這樣的話,我們可以做出更明智的決定。 另外,最后一個(gè)應(yīng)用領(lǐng)域就是云計(jì)算。在云的環(huán)境中,工作負(fù)載會(huì)出現(xiàn)動(dòng)態(tài)的變化,甚至這些工作負(fù)載的構(gòu)成也會(huì)出現(xiàn)快速的變化。有一些工作負(fù)載可能所需要的性能即使CPU在合理的功耗水平之下也是難以實(shí)現(xiàn)的,所以可能這個(gè)服務(wù)器卡上需要一些特別的芯片或者是配上一個(gè)GPU,專門處理并行的運(yùn)算,或者是裝上網(wǎng)絡(luò)加速器,處理協(xié)議和安全的流量分流。 另外,還有視頻的解碼器,或者是配上ASIC專用的集成電路,用于搜索的加速和深度學(xué)習(xí)。但是,事實(shí)上在服務(wù)器上面并沒有空間,也沒有足夠的功率里支持所有這些芯片都放進(jìn)去,所以,有一些云的服務(wù)提供商和數(shù)據(jù)中心的架構(gòu)師就開始轉(zhuǎn)向使用英特爾最先進(jìn)的FPGA的產(chǎn)品,就是和英特爾Xeon的CPU能夠?qū)崿F(xiàn)很好地連接,提供搜索、計(jì)算、加密、分組處理和機(jī)器學(xué)習(xí)的硬件的加速。 隨著這種變化的變化和工作負(fù)載的變化,你也可以對(duì)FPGA進(jìn)行重新的配置,以滿足這些新的需求。 另外,從這三個(gè)例子上大家可以看到我們面臨著三方面的挑戰(zhàn),一個(gè)是處理大量數(shù)據(jù)的增長,另外我們還要應(yīng)對(duì)快速變化的新技術(shù)帶來的計(jì)算環(huán)境的變化,另外就是CPU的功耗是非常重要的。你僅僅靠計(jì)算平臺(tái)同質(zhì)的擴(kuò)展,可能沒有辦法滿足所有這些需求,所以就意味著我們需要異構(gòu)的計(jì)算,今天我們可以看到硬件平臺(tái)包括CPU,包括FPGA,還包括專用的加速器,CPU仍然是我們處理能力的一個(gè)核心引擎,再加上一些專用的加速器,比如說加上ASSP和ASIC,就可以實(shí)施一些專用的功能,實(shí)現(xiàn)最好的計(jì)算的效率。 現(xiàn)在我們可以看到FPGA也越來越發(fā)揮著重要的作用,特別是在需要靈活加速的時(shí)候,因?yàn)樗惴ㄒ苍诓粩嗟匕l(fā)展,而且我們所處的環(huán)境當(dāng)中加速的工作負(fù)載也在動(dòng)態(tài)地變化,所以FPGA有以下的好處,相當(dāng)于一個(gè)軟件定義的硬件,可以滿足性能和計(jì)算方面的要求。另外,還有一定的靈活性,能夠支持未來的計(jì)算和商業(yè)需求不斷地變化。 這張幻燈片給大家介紹了FPGA實(shí)際上對(duì)異構(gòu)計(jì)算或者是異構(gòu)的架構(gòu)是至關(guān)重要的。如果你們對(duì)FPGA不熟悉,大家可以把FPGA想象成一種先進(jìn)的多功能的加速器,一方面能夠帶來最大的編程的靈活性,支持高度差異化的產(chǎn)品,你還可以在現(xiàn)場進(jìn)行重新配置,虛擬加速任何數(shù)字的算法。另外,他們也是支持并行運(yùn)算的,所以,他們特別適合未來計(jì)算的世界,更重要的是他們的性能從吞吐量,從實(shí)施的速度和能耗的角度來說,比CPU或者是GPU要優(yōu)上十倍。 另外可以看到它可以以更低的時(shí)延處理更大的數(shù)據(jù),比傳統(tǒng)的在硬件產(chǎn)品上跑的基于軟件的產(chǎn)品更快。就是因?yàn)镕PGA有以上這些好處,F(xiàn)PGA相當(dāng)于具有硬件的性能,又具有軟件的可編程的能力,所以說對(duì)異構(gòu)計(jì)算的環(huán)境或者是架構(gòu)來說變得尤為重要。 我們這張幻燈片上舉了一些FPGA是怎么樣使用的例子,它可以支持我們稱為LookAside和inline的加速,旁路加速可以讓我們把一些重度計(jì)算的數(shù)據(jù)功能轉(zhuǎn)移到FPGA上面,這樣可以釋放處理器去處理其他一些功能。如果時(shí)延比較重要,我們就可以進(jìn)行內(nèi)聯(lián)加速。LookAside旁路加速就可以讓我們把一些重度計(jì)算的數(shù)據(jù)功能轉(zhuǎn)移到FPGA上面,這樣可以釋放處理器去處理其他一些功能。如果時(shí)延比較重要,我們就可以進(jìn)行內(nèi)聯(lián)Inline加速。這樣通過FPGA的多功能性,可以帶來更好的網(wǎng)絡(luò)的存儲(chǔ)和計(jì)算的加速。 下面我會(huì)給大家介紹一些FPGA在現(xiàn)實(shí)生活當(dāng)中實(shí)際的案例。 這張幻燈片給大家展示了我們FPGA帶數(shù)據(jù)庫加速當(dāng)中的應(yīng)用。數(shù)據(jù)中心的加速和混合云是非常重要的,但是我們來看一下我們PGA是怎么應(yīng)對(duì)現(xiàn)實(shí)生活中一些挑戰(zhàn)的? 第一個(gè)就是數(shù)據(jù)庫的加速。現(xiàn)在關(guān)系數(shù)據(jù)庫實(shí)際上是無處不在的,數(shù)據(jù)分析就變得至關(guān)重要了,無論是對(duì)電子商務(wù)還是廣告,對(duì)所有人來說數(shù)據(jù)分析就是最重要的事情。Swarm64是我們英特爾的一個(gè)合作伙伴,它就使用了我們最新的FPGA大量處理一些并行的數(shù)據(jù),實(shí)現(xiàn)了很好的吞吐量,也有比較好的能耗和更高的性能。 Swarm64這個(gè)可擴(kuò)展的數(shù)據(jù)加速器是一個(gè)無縫的插件,能夠讓我們常用的一些數(shù)據(jù)庫可以處理一些高速的大數(shù)據(jù),無論是在云里面,還是在現(xiàn)場,它都可以支持任何的配置。另外,這也是一個(gè)很好的內(nèi)聯(lián)加速的例子,我們可以把數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫之前先進(jìn)行壓縮和處理。可以看到分析的能力是以前的5倍,數(shù)據(jù)倉庫的能力是以前的2倍,存儲(chǔ)壓縮的能力是以前的3倍。 另外,這個(gè)例子是基因測序,可以看到這個(gè)數(shù)據(jù)量非常大,也非常復(fù)雜,基本上是分析能力跟不上,所以說很多的研究項(xiàng)目被迫推遲,可能會(huì)影響整個(gè)醫(yī)療界在這方面取得大家都非常需要的醫(yī)療的突破。英特爾和Broad Institute合作,希望能夠在基因測序這方面取得一些突破。我們共同開發(fā)出了一個(gè)叫基因分析的工具,GATK,這是一個(gè)用于基因分析的軟件工具包,Broad Institute開發(fā)出來,主要是用于分析大吞吐量測序的數(shù)據(jù)。 在數(shù)據(jù)處理的三個(gè)階段當(dāng)中,F(xiàn)PGA對(duì)變體分析的階段進(jìn)行了加速,這個(gè)階段也是最影響性能的一個(gè)階段。我們可以看到這種旁路加速可以把計(jì)算密集性的任務(wù)分流到FPGA,F(xiàn)PGA直接給CPU提供結(jié)果。我們可以看到這個(gè)工具包的軟件和參考設(shè)計(jì)使用了OpenCL,可以說加速整個(gè)改變了基因測序和分析的行業(yè)。研究人員現(xiàn)在可以在過去三分之一的時(shí)間能夠獲得5倍的數(shù)據(jù)量,相當(dāng)于15倍的提升。所以,通過這樣的合作關(guān)系,英特爾也幫助了Broad Institute加速了它的Pair-HMM提高了50倍,整個(gè)通道能力提高了2.2倍,所以說幫助實(shí)現(xiàn)了DNA測序方面取得了很大的突破。 這張幻燈片給大家展示了Attala的系統(tǒng)公司。這家公司想要重造云基礎(chǔ)設(shè)施,主要是希望能夠利用英特爾的FPGA重新設(shè)計(jì)和開發(fā)出來新一代的儲(chǔ)存和網(wǎng)絡(luò)的基礎(chǔ)設(shè)施。 NVMe代表的是非易失性儲(chǔ)存器的規(guī)范。它是針對(duì)NVND的閃存和下一代固態(tài)的儲(chǔ)存技術(shù),這也是一個(gè)內(nèi)件加速的例子,不是在軟件里面進(jìn)行處理,數(shù)據(jù)是在硬件里面通過FPGA來進(jìn)行處理和加速的,然后再進(jìn)入到Ethernet Fabric,這個(gè)基于FPGA的解決方案相比我們之前的解決方案,可以在讀寫速度的時(shí)延方面降低57-72%。所以,可以看到Attala的解決方案節(jié)省了所有軟件的開支,這種很好的硬件和軟件的解決方案有很強(qiáng)的適應(yīng)能力,提高了性能,也為云的服務(wù)提供商降低了運(yùn)行成本。而且,還包括企業(yè)級(jí)的端到端的數(shù)據(jù)的保護(hù),無論上行還是下行數(shù)據(jù)的交換,有雙重的冗余保護(hù)。 這張幻燈片給大家展示了我們幾個(gè)客戶對(duì)我們的評(píng)價(jià)。我就援引中興和阿里巴巴的評(píng)價(jià)。中興說通過利用它制定的拓?fù)浣Y(jié)構(gòu),中興取得了一項(xiàng)新的記錄,它的面部識(shí)別功能每秒能夠識(shí)別1000張圖片,實(shí)現(xiàn)了以前理論上最過的準(zhǔn)確性,所以,英特爾 Arria 10的FPGA將原始的設(shè)計(jì)性能提高了10倍,同時(shí)又保證了高準(zhǔn)確性。這是中興對(duì)我們FPGA的評(píng)價(jià)。 另外一個(gè)是阿里云,主要是幫助云中的客戶訪問大量的服務(wù),基于FPGA全新的加速服務(wù),意味著客戶能夠訪問云中豐富的資源,而且無需構(gòu)建自己的基礎(chǔ)設(shè)施。 還有京東的評(píng)價(jià),我就不讀出來了。 這個(gè)是我們英特爾提供的一系列的產(chǎn)品,像Stratix 10最新的產(chǎn)品有樣片了。另外像Arria 10的終端系列產(chǎn)品已經(jīng)在全面生產(chǎn)了。像Cyclone 10和Max 10已經(jīng)大量出貨。 剛才跟大家介紹了我們現(xiàn)在已經(jīng)發(fā)貨的產(chǎn)品,下面給大家介紹一下我們下一代的FPGA的產(chǎn)品,英文名字叫做Falcon Mesa,這是我們下一代基于10納米制程的新的Falcon Mesa的產(chǎn)品。可以看到它是使用了英特爾10納米的制程技術(shù),基于世界上最先進(jìn)的一個(gè)FinFET制程的技術(shù),這是我們第二代使用HyperFlex架構(gòu)產(chǎn)品,也是第二代基于EMIB的異構(gòu)的SIP。EMIB實(shí)際上是英特爾接口的規(guī)范。 還有我們新的產(chǎn)品也會(huì)支持下一代的HBM,現(xiàn)在Stratix 10也支持HBM,可以看到它的轉(zhuǎn)換速率可以達(dá)到112G。另外我們還支持PC/IE兼4×16的支持,就意味著支持的帶寬能夠達(dá)到16TB。 剛才我也說了,這實(shí)際上是我們?cè)诓⑷胗⑻貭栆院箝_發(fā)出來的第一代使用了英特爾10納米制程技術(shù)開發(fā)出來的產(chǎn)品,我們希望能夠繼續(xù)推動(dòng)摩爾定律的實(shí)現(xiàn),希望能夠給大家?guī)順I(yè)界領(lǐng)先的性能和能效。 另外可以看到和英特爾整合之后實(shí)際上給我們公司帶來了很多的更強(qiáng)的能力,在Stratix 10上面大家也可以看到,我們作為它的企業(yè),也獲得了英特爾領(lǐng)先業(yè)界3年的制程技術(shù),意味著給我們帶來了更大的容量和更快的速度,大家都知道英特爾的制程技術(shù)是全球最創(chuàng)新的、最領(lǐng)先的技術(shù),我們也是把它的制程技術(shù)用于我們Falcon Mesa的生產(chǎn)和制造。晶體管的數(shù)量每兩年會(huì)增加一倍,那就意味著單位面積的成本會(huì)增加,但是,晶體管數(shù)量翻一倍意味著性能的改善,從而使每個(gè)晶體管的成本降下來了。 我們英特爾也是遵循了這樣一個(gè)模式,兩年一個(gè)節(jié)奏,從14納米到10納米,再通過像(51:26)的一些改善,我們可以看到die的面積可以實(shí)現(xiàn)0.46到0.43倍的擴(kuò)展,晶體管的密度會(huì)有2.7倍的提升,在10納米的時(shí)候,這就意味著更好的性能和更低的功耗,在這種我們稱之為自排列的雙重圖( self-aligned double pattern),在這個(gè)制程方面,英特爾一直都是領(lǐng)先的。通常在生產(chǎn)硅的過程中,一般都是一層會(huì)鋪一層研磨,但是,鋪兩層研磨就意味著這個(gè)晶體管有更緊密的封裝,那就意味著我們的排列必須更加準(zhǔn)確,這種可能會(huì)帶來的好處是我們制程的控制會(huì)更加嚴(yán)格,從而帶來密度方面的提升。 另外,剛才給大家介紹了EMIB這個(gè)技術(shù),EMIB是英特爾一個(gè)橋接、連通的技術(shù),過去你可以通過硅通孔和轉(zhuǎn)接板的技術(shù)來實(shí)現(xiàn)連接,EMIB實(shí)際上提供了一個(gè)很好的帶與帶之間和帶橋之間的很好的連接,這個(gè)相比于過去的技術(shù),給我們提供了一個(gè)更好的解決辦法。 這個(gè)地方提供的加速堆棧實(shí)際上是更多地幫助我們開發(fā)者的。之前介紹了很多硬件方面的內(nèi)容。在軟件方面,實(shí)際上英特爾給我們帶來了更好的新的資源,能夠讓我們的FPGA讓更多的軟件開發(fā)者能獲得。包括我們提供的FPGA的加速數(shù)據(jù)庫,針對(duì)至強(qiáng)處理器的,另外還可以為人工智能、數(shù)據(jù)分析數(shù)據(jù)壓縮提供硬件的加速。 可以看到這張幻燈片是我們展示了一個(gè)機(jī)器學(xué)習(xí)的解決方案的堆棧,大家可以看到,這是一個(gè)相當(dāng)于針對(duì)FPGA優(yōu)化的數(shù)據(jù)庫,它實(shí)際上可以在一些最通用的常見的網(wǎng)絡(luò)拓?fù)渖希热缯fAlexNet和GoogleNet上面進(jìn)行實(shí)施,高級(jí)用戶可能會(huì)想利用這個(gè)堆棧,使用預(yù)先定義好的數(shù)據(jù)庫的內(nèi)核,直接在API的層面進(jìn)行編程,或者也可以使用英特爾深度學(xué)習(xí)部署的工具包。 通常一個(gè)用戶可能會(huì)想要利用最常用的深度學(xué)習(xí)的框架,比如說TensorFow、Caffe來開發(fā)出自己機(jī)器學(xué)習(xí)的應(yīng)用,這個(gè)也是支持的。 大家可以看到實(shí)際上英特爾給我們帶來的這些能力包括強(qiáng)大的封裝能力,制程的技術(shù)和光學(xué)方面的技術(shù),包括我們可以獲得它開發(fā)的工具、處理器和它的合作伙伴的生態(tài)系統(tǒng),這個(gè)實(shí)際上我們也可以幫助實(shí)現(xiàn)硬件和軟件編程的統(tǒng)一。 可以看到,如果再挖深一點(diǎn),我覺得我們面臨著三個(gè)方面的轉(zhuǎn)型,一個(gè)就是我們可以連接到網(wǎng)絡(luò)處理器和存儲(chǔ)器方面能帶來最高的性能,以及最高的FPGA的Fabric的性能。另外,我們可以通過一些先進(jìn)的制程技術(shù)、先進(jìn)的冷卻技術(shù)和異構(gòu)的整合,帶來很好的功耗方面的降低。另外,我們也使傳統(tǒng)的FPGA設(shè)計(jì)工具的生產(chǎn)力有很大的提高,讓更多的軟件開發(fā)者可以獲得,了解我們相關(guān)的一些框架和內(nèi)容。 總結(jié)一下,今天介紹的主要內(nèi)容包括我們都知道現(xiàn)在的數(shù)據(jù)像洪水一般的涌來,它就會(huì)推動(dòng)計(jì)算網(wǎng)絡(luò)和存儲(chǔ)需求不斷增長。第二,我們看到異構(gòu)計(jì)算的平臺(tái)還有混合云基礎(chǔ)設(shè)施的發(fā)展對(duì)于FPGA來說,F(xiàn)PGA未來能夠在這些領(lǐng)域發(fā)揮更重要的作用。第三,我們看到FPGA是可以滿足以下工作負(fù)載不斷增加的需求,在這個(gè)過程當(dāng)中,F(xiàn)PGA能夠幫助很多行業(yè)解決他們面臨的一些問題和挑戰(zhàn)。最后,可以看到英特爾有一個(gè)良好的記錄,不斷地創(chuàng)造著行業(yè)的標(biāo)準(zhǔn)和標(biāo)桿,他們也致力于讓我們的FPGA對(duì)開發(fā)者更易于使用。 最后我想說的是,我們面臨的挑戰(zhàn)是非常復(fù)雜的,面對(duì)這樣的復(fù)雜性,可能需要不同的解決方案來應(yīng)對(duì)挑戰(zhàn)。英特爾認(rèn)為FPGA實(shí)際上能夠幫助我們加速計(jì)算,幫助我們更好地應(yīng)對(duì)今天以及未來數(shù)據(jù)的需求。 |