您的位置: 首頁 >科技 >

谷歌用自己的本土芯片替換數(shù)百萬英特爾的CPU

2022-08-08 21:59:31 編輯:柳毅善 來源:
導(dǎo)讀 Google 設(shè)計(jì)了自己的新處理器Argos 視頻(轉(zhuǎn))編碼單元 (VCU),其目的只有一個(gè):處理視頻。根據(jù)最近的一份報(bào)告,高效的新芯片使這家技術(shù)巨...

Google 設(shè)計(jì)了自己的新處理器Argos 視頻(轉(zhuǎn))編碼單元 (VCU),其目的只有一個(gè):處理視頻。根據(jù)最近的一份報(bào)告,高效的新芯片使這家技術(shù)巨頭能夠用自己的芯片替換多達(dá)數(shù)千萬個(gè)英特爾 CPU。

多年來,英特爾內(nèi)置于其 CPU 中的視頻解碼/編碼引擎一直主導(dǎo)著市場,因?yàn)樗鼈兲峁┝祟I(lǐng)先的性能和功能,而且易于使用。但是定制的專用集成電路 (ASIC) 的性能往往優(yōu)于通用硬件,因?yàn)樗鼈儍H針對一種工作負(fù)載而設(shè)計(jì)。因此,谷歌轉(zhuǎn)而為 YouTube 的視頻處理任務(wù)開發(fā)自己的專用硬件,并取得了很好的效果。

然而,英特爾可能會(huì)利用其最新技術(shù)來贏回谷歌的專業(yè)視頻處理業(yè)務(wù)。

大量視頻需要新硬件

用戶每分鐘向 YouTube 上傳超過 500 小時(shí)的各種格式的視頻內(nèi)容。Google 需要將該內(nèi)容快速轉(zhuǎn)碼為多種分辨率(包括 144p、240p、360p、480p、720p、1080p、1440p、2160p 和 4320p)和數(shù)據(jù)高效格式(例如,H.264、VP9 或 AV1),這需要強(qiáng)大的編碼能力。

從歷史上看,谷歌有兩種轉(zhuǎn)碼/編碼內(nèi)容的選擇。第一個(gè)選項(xiàng)是英特爾的視覺計(jì)算加速器(VCA),它包含三個(gè) Xeon E3 CPU,內(nèi)置 Iris Pro P6300/P580 GT4e 集成圖形內(nèi)核和先進(jìn)的硬件編碼器。第二種選擇是使用軟件編碼和通用英特爾至強(qiáng)處理器。

谷歌認(rèn)為,對于新興的 YouTube 工作負(fù)載來說,這兩種選擇都不夠節(jié)能——Visual Computing Accelerator 本身就相當(dāng)耗電,而擴(kuò)展至強(qiáng) CPU 的數(shù)量本質(zhì)上意味著增加服務(wù)器的數(shù)量,這意味著額外的功率和數(shù)據(jù)中心占用空間。因此,谷歌決定采用定制的內(nèi)部硬件。

谷歌的第一代 Argos VCU 并沒有完全取代英特爾的處理器,因?yàn)榉?wù)器仍然需要運(yùn)行操作系統(tǒng)并管理存儲(chǔ)驅(qū)動(dòng)器和網(wǎng)絡(luò)連接。在很大程度上,谷歌的 Argos VCU 就像一個(gè)總是需要一個(gè) CPU 的 GPU。

與我們在 GPU 中看到的流處理器不同,Google 的 VCU 集成了十個(gè) H.264/VP9 編碼器引擎、幾個(gè)解碼器內(nèi)核、四個(gè) LPDDR4-3200 內(nèi)存通道(具有 4x32 位接口)、一個(gè) PCIe 接口、一個(gè) DMA 引擎和一個(gè)用于調(diào)度目的的小型通用內(nèi)核。除了內(nèi)部設(shè)計(jì)的編碼器/轉(zhuǎn)碼器外,大多數(shù) IP 都從第三方獲得許可,以降低開發(fā)成本。每個(gè) VCU 還配備了 8GB 的??可用 ECC LPDDR4 內(nèi)存。

Google 的 VCU 背后的主要思想是將盡可能多的高性能編碼器/轉(zhuǎn)碼器放入單個(gè)芯片中(同時(shí)保持節(jié)能),然后將 VCU 的數(shù)量與所需的服務(wù)器數(shù)量分開擴(kuò)展。谷歌在一塊板上放置兩個(gè) VCU,然后在每個(gè)雙插槽英特爾至強(qiáng)服務(wù)器上安裝 10 個(gè)卡,大大提高了公司每個(gè)機(jī)架的解碼/轉(zhuǎn)碼性能。

谷歌表示,與英特爾 Skylake 驅(qū)動(dòng)的服務(wù)器系統(tǒng)相比,其基于 VCU 的機(jī)器在性能/TCO 計(jì)算效率方面的提升高達(dá) 7 倍(H.264)和高達(dá) 33 倍(VP9)。這一改進(jìn)將 VCU 的成本(與英特爾的 CPU 相比)和三年的運(yùn)營費(fèi)用考慮在內(nèi),這使得 VCU 成為視頻巨頭 YouTube 的輕松選擇。

從 Google 分享的性能數(shù)據(jù)來看,很明顯單個(gè) Argos VCU 僅比 H.264 中的 2 路 Intel Skylake 服務(wù)器快。但是,由于可以在這樣的服務(wù)器中安裝 20 個(gè) VCU,從效率的角度來看,VCU 勝出。但是當(dāng)談到要求更高的 VP9 編解碼器時(shí),谷歌的 VCU 似乎比英特爾的雙路至強(qiáng)快五倍,因此提供了令人印象深刻的效率優(yōu)勢。

由于谷歌多年來一直在使用其 Argos VCU,它顯然用運(yùn)行自己芯片的機(jī)器取代了許多基于 Xeon 的 YouTube 服務(wù)器。很難估計(jì)谷歌實(shí)際更換了多少至強(qiáng)系統(tǒng),但一些分析師認(rèn)為,這家科技巨頭本可以將4 到 3300 萬個(gè)英特爾 CPU換成 自己的 VC。即使第二個(gè)數(shù)字被高估了,我們?nèi)匀辉谡務(wù)摂?shù)百萬個(gè)單位。

由于谷歌的其他服務(wù)需要大量處理器,因此該公司從 AMD 或英特爾購買的 CPU 數(shù)量可能仍然非常高,并且不會(huì)很快減少,因?yàn)楣雀枳约旱臄?shù)據(jù)中心需要數(shù)年時(shí)間—— 級系統(tǒng)級芯片 (SoC) 將準(zhǔn)備就緒。

還值得注意的是,目前谷歌為了嘗試使用創(chuàng)新的編碼技術(shù)(例如,AV1),即使是 YouTube 也需要使用通用 CPU,因?yàn)?Argos 不支持編解碼器。此外,隨著更高效的編解碼器的出現(xiàn)(這些對計(jì)算能力的要求往往更高),谷歌將不得不繼續(xù)使用 CPU 進(jìn)行初始部署。具有諷刺意味的是,專用硬件的優(yōu)勢在未來只會(huì)越來越大。

谷歌已經(jīng)在開發(fā)支持 AV1、H.264 和 VP9 編解碼器的第二代 VCU,因?yàn)樗枰M(jìn)一步提高其編碼技術(shù)的效率。目前尚不清楚何時(shí)部署新的 VCU,但很明顯該公司希望盡可能使用自己的 SoC 而不是通用處理器。

不過,英特爾并沒有停滯不前。該公司 基于DG1 Xe-LP的 四芯片 SG1 服務(wù)器卡可以解碼多達(dá) 28 個(gè) 4Kp60 流以及轉(zhuǎn)碼多達(dá) 12 個(gè)同時(shí)流。從本質(zhì)上講,英特爾的 SG1 與谷歌的 Argos VCU 所做的完全一樣:將視頻解碼和轉(zhuǎn)碼性能與服務(wù)器數(shù)量分開,從而減少用于視頻應(yīng)用的數(shù)據(jù)中心所需的通用處理器數(shù)量。

憑借即將推出的單塊 Xe-HP GPU,英特爾將同時(shí)提供 10 個(gè)高質(zhì)量 4Kp60 流的轉(zhuǎn)碼。請記住,某些 Xe-HP GPU 將擴(kuò)展到四個(gè)區(qū)塊,并且每個(gè)系統(tǒng)可以安裝一個(gè)以上的 GPU,英特爾市場領(lǐng)先的媒體解碼和編碼能力只會(huì)變得更加穩(wěn)固。

概括

Google 已成功構(gòu)建了出色的 H.264 和支持 VP9 的視頻(轉(zhuǎn))編碼單元 (VCU),與英特爾現(xiàn)有的 CPU 相比,它可以在視頻編碼/轉(zhuǎn)碼工作負(fù)載方面提供顯著更高的效率。此外,VCU 使 Google 能夠獨(dú)立于服務(wù)器數(shù)量擴(kuò)展其視頻編碼/轉(zhuǎn)碼性能。

然而,英特爾已經(jīng)擁有其 Xe-LP GPU 和 SG1 卡,它們也提供了一些重要的視頻解碼和編碼功能,因此英特爾仍將在具有繁重視頻流工作負(fù)載的數(shù)據(jù)中心取得成功。此外,隨著英特爾 Xe-HP GPU 的出現(xiàn),該公司有望鞏固其在該市場的地位。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。