手機AI晶元決鬥倒計時!蘋果華爲高通戰備解密
就在未來短短一個月之內,我們即將迎來2018年業內最重磅的兩大AI手機晶元發布——華為麒麟980、蘋果A12。
近一年來,商業化落地已成為AI發展的一大熱門主題,而智能手機領域無疑是最貼近人們生活且單一出貨量最大的AI落地市場之一。自去年華為蘋果先後發布AI晶元,移動AI晶元的戰火已經點燃。如今,全球前幾大智能手機都已具備自產手機晶元的能力,紛紛基於AI晶元構建更全面的AI應用生態,高通作為老牌造芯工廠在手機AI晶元也表現強勁。
據華為消費者業務CEO余承東透露,華為將在8月底召開的德國IFA消費者展上發布新一代旗艦晶元麒麟980,會「遙遙領先」對手,他表示先把牛皮吹出去,再看能不能做到(華為余承東放話:手機今年出貨2億 明年沖世界第一)。隨著下個月蘋果A12和今年年底到明年年初高通驍龍855的問世,下一代AI旗艦版晶元的戰火將再度重燃,巔峰之戰即將打響,而新的王者很有可能將在華為的麒麟980、蘋果的A12和高通的驍龍855之間誕生!
AI性能大比拼
去年秋天,華為推出的麒麟970拔得了手機AI晶元落地的頭籌,搭載這款AI晶元的華為Mate 10和Mate 10 Pro開始進入人們的口袋。麒麟970之所以敢稱之為「AI晶元」,正是基於其全新HiAI人工智慧移動計算架構中集成的專用AI處理單元——NPU(Neural-Network Processing Unit,嵌入式神經網路處理器)。這款NPU的計算速度比CPU快25倍,能將能耗效率提高50倍,中科院計算所孵化出的AI晶元屆獨角獸——寒武紀科技(Cambricon)正是該NPU的技術合作方。
據傳,即將推出的麒麟980將繼續沿用寒武紀IP核,新一代NPU很可能就是寒武紀在今年5月推出的第三代終端IP產品Cambricon 1M。這款NPU使用台積電7nm工藝生產,提供2Tops、4Tops、8Tops三種規模的處理器核,並支持多核互聯,其8位運算效能比達5 Tops/W(每瓦5萬億次運算),性能比前任麒麟970採用的寒武紀1A高10倍,為視覺、自然語言處理及各類經典學習任務提供更加靈活高效的計算平台。
此外,華為配合NPU推出面向開發者的HiAI移動計算平台,向開發者提供其AI計算庫、API等開發所需的全套工具,也支持開發者通過TensorFlow和Caffe這些第三方框架接入。
去年,在麒麟970發布兩周后,蘋果公布自研AI晶元A11。A11晶元上也搭載了一個專用於神經網路計算的硬體模塊——「神經網路引擎(Neural engine)」,該模塊採用雙核設計,能以每秒最高6000億次速度處理機器學習任務,為FaceID的人臉識別、AR物體偵測、Animoji臉部追蹤、Siri語音助手等功能提供驅動。
而今年蘋果的A12晶元暫時未被曝出大的升級處理,除了可能會繼續沿用去年A11使用的神經網路引擎。基於AI晶元,蘋果已經初步構建起圍繞AI的應用生態,包括FaceID、AR增強現實技術、Siri語音助手等應用以及Core ML、Create ML等面向開發者的機器學習工具。作為下一代iPhone的「心臟」,A12的服務範圍將有望擴展到更多的蘋果生態之中,為用戶開闢更廣闊的移動端AI應用和開發的世界。
全球第二大手機廠商蘋果和第三大手機廠商華為都在去年陸續推出搭載專用AI處理模塊的移動AI晶元,作為安卓陣營手機晶元第一大提供商,高通自然也不會無動於衷。早在去年7月,高通就開放了驍龍神經處理引擎(NPE,Neural Processing Engine)的軟體開發包SDK,開發者可以用它在驍龍600和800系列上優化AI應用。
今年2月,高通再度重磅出擊,推出包含軟硬體兩部分的AI引擎(AI Engine),在驍龍核心架構上搭載了神經處理引擎(Neural Processing Engine,NPE)、Android NN API、Hexagon神經網路庫等軟體,是AI在智能手機等終端上的應用更快速、高效。
在和高通幾位高管的交流中,智東西被告知,儘管出於保密需要,高通方不方便透露驍龍855的具體信息。不過,負責AI業務的高通產品管理總監Gary Brotman告訴智東西,目前高通晶元自研DSP不僅能非常高效地完成各種AI任務,而且非常靈活。
但從上一代驍龍845系列來看,高通已在其晶元中配置支持TensorFlow和Halide框架的六核移動DSP(數字信號處理器),並在幾代之前就將其使用到異構計算和神經網路開發。
和華為、蘋果的架構方案不同,下一代驍龍855很可能還是不會搭載獨立NPU。上個月,Gary Brotman還告訴智東西,雖然高通內部有關於專用AI處理模塊的研究進展,但AI演演算法發展飛快,晶元硬體設計往往一年半前就固定下來,一年半前的AI演演算法與今天完全不同,新演演算法出現后可能不適配於固定硬體,他認為暫時看不到搭載專用AI處理模塊的手機晶元的意義。因此驍龍855很可能跟上一代驍龍晶元一樣,具備更彈性的機器學習架構,分佈在CPU、GPU、DPS等每個單元上,能適配市面上多種機型。
在智東西和高通Imagination、聯發科以及華為海思等行業專家的採訪過程中,我們得到一個普遍的結論,AI晶元確實是目前的行業趨勢之一,隨著手機差異化的減少,最終NPU將會變成「大家都得有」的東西。
CPU提升不明顯,GPU參數飆高
據悉,麒麟980在配置上依然採用的是ARM架構,主頻最高可達2.8GHz,CPU方面並沒有太多的亮點,而其飽受詬病的GPU則有了較大升級。
就在上周的華為旗下手機品牌榮耀Note 10新品發布會上,榮耀總裁趙明公布了來自華為2012實驗室的兩項新技術:THE NINE液冷散熱技術和和雙Turbo技術(CPU Turbo+GPU Turbo)。
先於今年6月問世的GPU Turbo已經打通EMUI操作系統和GPU、CPU之間的處理瓶頸,使得圖像處理驍龍提升60%,能耗降低30%,一掃之前在GPU表現上的頹勢,縮短了和驍龍GPU的差距。
而此次首發的CPU Turbo得益於THE NINE液冷散熱技術,把晶元產生的熱量快速均勻分佈到機身其他部位並迅速散發出去,整體散熱性能提升41%,在激發CPU的極限性能的同時使CPU最高可降低10℃。
據傳,麒麟980將首用華為自研GPU晶元,性能將是高通Adreno 630的1.5倍左右,在GPU Turbo加持下性能增長將達到50%-60%。如果麒麟980還配置上述THE NINE和CPU Turbo,AI計算效能可能持平甚至超越高通。
目前,蘋果的A12處理器的核心數和架構信息還沒有明確的消息。和華為一樣,蘋果AI晶元的主要短板之一也是GPU。根據前段時間曝光的跑分來看,A12在自研GPU方面做出了較大程度上的升級。A12在GPU跑分提升至21619,比上一代A11的16000提高約三分之一,同時提高手機流暢度和散熱能力。不過A12在CPU方面的提升似乎並不明顯。
高通的Adreno GPU一直都是業界標桿,下一代高通晶元驍龍855的GPU傳聞就更加恐怖了,據說「虐殺」一眾競爭對手的Adreno 630還只是高通Adreno家族的中端低功耗產品,真正殺手級別的GPU是強化版的Adreno 640和堪比PC顯卡的Adreno 680。按照高通發布新品的一貫節奏,驍龍855究竟採用哪款GPU可能到年底才會正式揭曉。
7nm製程與功耗問題
目前,蘋果和華為的移動AI晶元都基於ASIC的深度學習,不僅能實現更高準確率,還比GPU、FPGA等傳統通用晶元方案有更低的功耗。ASIC是全定製晶元,可基於AI演演算法進行定製,是未來AI晶元發展的主流方向。
與它們不同的是,驍龍AI晶元並不是直接疊加專用AI計算單元,而是在驍龍平台集成AI引擎,通過多核異構計算架構,讓CPU、GPU、DSP等不同模塊相互配合,根據不同應用場景安排工作負載。
三款晶元都將採用7nm工藝製程,其中麒麟980和蘋果A12的代工訂單都交給了台積電,而高通的製作公司暫時不確定是三星還是台積電。按照慣例,華為和蘋果的發布會將發布新旗艦版手機,而台積電的處理器生產工作顯得至關重要。
然而,近日據台媒報道,台積電工廠因病毒感染,導致數條生產線被迫中斷,此次事件被波及的包括負責28nm、16nm和7nm製程的生產基地。目前,台積電官方做出簡單回應,表示各大產線已恢復正常,停產時間不超過1天。對於晶圓廠而言,每次生產投入成本極高,一旦中斷很可能造成嚴重損失。台積電此次停工是否會對蘋果AI12晶元和麒麟980晶元的供應造成影響,目前尚不得而知。
根據此前台積電在股東會議上宣布的數據,2018年是7nm製程晶元大量投入生產的一年,跟之前的10nm FinFET工藝對比,7nm製程能夠在相同晶體管數量下縮減70%的晶元DIE封裝尺寸,將性能約提速20%,再加上升級之後可以減少功耗在40%左右。
日前,一顆疑似蘋果A12處理器的跑分數據現身GeekBench 資料庫,新機型號為iPhone11,2,預裝iOS 12系統,處理器為六核設計,主頻為2.49GHz。
從上圖可以看到,蘋果A12的單核性能4673分,相較上一代A11的4100分有所提升,其多核性能為10912分,和A11的10500左右得分持平,不過考慮到距離蘋果發布會還有一段時間,這份跑分成績並不會是A12的最終成績單。
雖然麒麟980和驍龍855的具體跑分還不得而知,但從A12的跑分信息和上圖中的一些信息來看,和A12平起平坐還很困難。根據GeekBench 4數據猜想,麒麟980的單線程和多線程跑分分別約在3000分和7000分,而驍龍855的單線程和多線程得分分別約在3500分和9500分,相比之下,A12的性能表現已經相當出色。
功耗問題是手機晶元的核心問題之一,一塊手機晶元無論有多強的算力,如果沒有低功耗,依然面臨市場的淘汰危機。在功耗方面高通仍然處於絕對優勢。儘管7nm進程的工藝雖然在性能方面十分的強悍,但這可能會導致存在較為嚴重的發熱問題,有網友爆料稱A12的功耗比預期的還要高出23%,其高功耗問題還在解決中。
基帶晶元:belong 765 vs 5G
在基帶方面,麒麟980有可能升級為華為今年2月在MWC發布的首款8天線4.5G基帶balong 765。Balong 765是全球首個支持LTE Cat.19的晶元,最快下載速度可達1.6Gbps,是全球首款TD-LTE G比特方案,也是業界唯一支持8×8 MIMO(8天線多入多出)技術的調製解調晶元,頻譜效率相對4×4MIMO提升80%,能有效降低時延。
此前,全球最快的商用4G基帶是高通的驍龍X24,下行速度達到了Cat.20(2Gbps),但僅支持4×4 MIMO。不過此前Balong 765偏嚮應用於車聯網、無人機和智能工廠,是否會被麒麟980採用仍存疑。
高通更是默默藏了一個大招。據消息稱,軟銀集團在3月發布的財報中不慎透露了高通的下一代旗艦晶元的部分信息,包括驍龍855將搭載5G基帶驍龍X50。驍龍X50基帶是全球首款5G數據機,能實現5Gbps的數據傳輸速度以及低至1/2ms的延時,同時還向下兼容4G的頻段,有利於用戶過渡。
在與高通曠日持久的專利訴訟案后,掛靠英特爾基帶的蘋果在基帶性能上可能無法和上述兩者相提並論,雖然A12處理器的基帶尚未曝光,不過就之前蘋果A11用的Intel XMM 7480基帶來看,其速度僅450Mbps,和其他二者相去甚遠。
雖然華為在基帶專利方面的進展日新月異,但通訊基帶晶元基本被高通壟斷,華為還將繼續從高通買晶元。晶元領域差距仍然不小,從零研究時間久且未必成效顯著,為保證華為手機的競爭力,暫時不會再麒麟晶元一棵樹上吊死。今年四月份,在華為分析師大會上,輪值董事長徐直軍明確表示,華為智能手機將堅持採取高通、MTK、麒麟多晶元供應戰略,確保三個晶元是相互競爭狀態。
如果關於驍龍855基帶的爆料屬實,這與此前高通宣布的5G商用節奏基本符合,很可能到明年上半年我們就能看到5G投入商用。
當然,一切還未成定局。眾所周知,近兩年來,華為和高通在5G方面一直拼得最狠。去年MWC上,高通發布全球首款5G數據機——驍龍X50 5G數據機,並於去年10月份在香港宣布了基於驍龍X50 5G數據機晶元組,實現了全球首個5G數據連接(data call)。
而在不久之前落幕的MWC2018上,華為正式發布了首款3GPP標準的5G商用晶元巴龍5G01(Balng 5G01)和基於該晶元的首款3GPP標準5G商用終端華為5G CPE。 這意味著華為同時突破了網路和終端這兩大5G商用的基礎條件,成為全球首家可以為客戶提供端到端5G解決方案的公司。
爭分奪秒,華為將再奪頭籌
華為第一次「杠過」蘋果,要從去年華為發布會說起。去年9月2日,華為搞了個大新聞——發布世界首款移動AI晶元麒麟970,比去年9月12日的蘋果發布會足足提前了10天。
而就今年各家新品發布會時間來看,華為將再度打響第二代旗艦手機AI晶元的頭炮。根據余承東透露的消息,華為將在本月31日召開的德國IFA消費者展上推出麒麟980,目前華為發布會的海報已經在網上曝光。
按照慣例,蘋果下個月將舉辦一年一度的秋季新品發布會,蘋果的A12晶元也將攜新款iPhone登場。此外,根據此前消息,高通驍龍855自6月以來已經投產,它將攜手聯想發布全球第一個5G手機,而該款手機有望在今年年末到明年年初問世。
雖然去年華為率先推出AI晶元,不過從手機晶元CPU、GPU等的整體把控來說,還是稍弱於蘋果。不過既然去年麒麟970已經進入AI晶元第一梯隊,今年說不定麒麟980能再接再厲,在性能方面縮短和其他競品的差距,未來幾年實現真正意義上的趕超也不是沒有可能。
結語:AI——智能手機的下一個風口
在這個用AI講故事的時代,AI、AR、VR等新興技術正成為拉開智能手機之間體驗差距的關鍵法寶。作為連接移動網際網路和物聯網的核心平台,智能手機也已成為AI技術落地的重要載體。從人臉識別到語音助手,從圖像美化到智慧生活,手機上的AI應用正在逐漸滲透我們的生活。
為什麼要給智能手機專門配置一枚AI晶元呢?原因很簡單。術業有專攻,CPU、GPU有它們特定的功能,但它們都不是為機器學習任務而設計。而蘋果、華為所使用的專用AI處理單元專用於大規模計算,為百家爭鳴的AI應用提供更高效的運算處理能力和更低的功耗,實現軟硬結合,讓手機變得更加「聰明」。此外,目前市面上大多數手機上的AI應用需要通過將數據傳至雲端以實現訓練任務,這會引發數據泄露的風險。蘋果、華為、谷歌等少數公司已經能做到直接在移動終端本地運行AI任務,這不僅使得為AI應用開發者開拓更豐富的想象空間,而且有助於保護用戶隱私。
在AI發展的初級階段,各家手機廠商對AI技術落地的方式或許各不相同,但如若想要構建基於AI的應用生態,AI晶元將是不可或缺的入場券。隨著AI晶元的普及,自主研發能力能讓手機廠商將更多的創新技術和供應鏈牢牢把控在自己手中,擺脫受制於人的困局。大勢當前,無論是移動AI晶元的領跑者還是追趕者,都不應有絲毫的怠慢。