蘋(píng)果的 M1 芯片是蘋(píng)果在 Mac 上搭載的單核 CPU 基準測試成績(jì)最快的芯片,在多核性能方面,也擊敗了許多高端英特爾 競品。開(kāi)發(fā)者 Erik Engheim 近日分享了對 M1 芯片的深入研究,探討了蘋(píng)果新處理器為何比它所取代的英特爾芯片快了那么多。

首先,M1 并不是一個(gè)簡(jiǎn)單的 CPU。正如蘋(píng)果所解釋的那樣,它是一個(gè)系統級芯片,即一系列芯片都被安置在一個(gè)硅片封裝中。M1 容納了 8 核 CPU、8 核 GPU(部分 MacBook Air 機型為 7 核)、統一內存、SSD 控制器、圖像信號處理器、Secure Enclave 等大量模塊。
英特爾和 AMD 也在單一封裝中內置多個(gè)微處理器,但正如 Engheim 所描述的那樣,蘋(píng)果之所以有優(yōu)勢,是因為蘋(píng)果沒(méi)有像競爭對手那樣專(zhuān)注于通用 CPU 核心,而是專(zhuān)注于處理專(zhuān)門(mén)任務(wù)的專(zhuān)用芯片。
除了 CPU(擁有高性能和高效率的內核)和 GPU,M1 還有一個(gè)神經(jīng)引擎,用于處理語(yǔ)音識別和攝像頭處理等機器學(xué)習任務(wù),內置視頻解碼器 / 編碼器,用于視頻文件的高能效轉換,安全加密器用于處理加密,數字信號處理器用于處理解壓音樂(lè )文件等數學(xué)密集型功能,圖像處理單元則加快了圖像處理應用所做的任務(wù)。
值得一提的是,還有一個(gè)新的統一內存架構,讓 CPU、GPU 和其他核心之間相互交換信息,通過(guò)統一內存,CPU 和 GPU 可以同時(shí)訪(fǎng)問(wèn)內存,而不是在一個(gè)區域和另一個(gè)區域之間復制數據。訪(fǎng)問(wèn)同一個(gè)內存池,而不需要復制,加快了信息交換的速度,從而提高整體性能。
所有這些具有特定用途的芯片都能加快特定任務(wù)的速度,從而帶來(lái)人們看到的改進(jìn)。
這也是為什么很多使用 M1 Mac 進(jìn)行圖像和視頻編輯的人看到這樣的速度提升的部分原因。他們所做的很多任務(wù),都可以直接在專(zhuān)門(mén)的硬件上運行。這就是為什么便宜的 M1 Mac Mini 可以不用費很大力氣就能對一個(gè)大的視頻文件輕松進(jìn)行編碼,而昂貴的 iMac 的風(fēng)扇都開(kāi)足馬力,仍然跟不上。
專(zhuān)用芯片已經(jīng)使用了多年,但蘋(píng)果正像 Engheim 所描述的那樣,“朝著(zhù)這個(gè)方向更徹底地轉變”。其他 Arm 芯片制造商如 AMD 也在采取類(lèi)似的做法,但英特爾和 AMD 依靠銷(xiāo)售通用 CPU,出于授權原因,戴爾和惠普等 PC 制造商很可能無(wú)法像蘋(píng)果那樣在內部設計出完整的 SoC。
蘋(píng)果能夠將硬件和軟件整合在一起,這是大多數其他公司無(wú)法復制的,這也是 iPhone 和 iPad 比其他智能手機和平板電腦更具優(yōu)勢的地方。
除了自主設計的系統級芯片的好處,蘋(píng)果還在 M1 中使用了 Firestorm CPU 內核,這些內核 “真正的快”,能夠通過(guò) Out-of-Order 執行、RISC 架構以及蘋(píng)果實(shí)現的一些特定優(yōu)化來(lái)并行執行更多指令,Engheim 對此有深入的解釋。
Engheim 認為,英特爾和 AMD 由于 CISC 指令集的限制,以及他們的商業(yè)模式,不容易為 PC 廠(chǎng)商打造端到端的芯片解決方案,因此處境艱難。 |