精品人妻在线无码,GOGO少妇无码肉肉视频,wwwww无码内射啊

英偉達(dá)被“碾壓”？

2024-02-22 16:20:51來源：上海證券報微信公眾號

分享到：

近日，“史上最快大模型”爆火。一家海外AI芯片初創(chuàng)公司Groq使用其自研LPU（語言處理單元）作為推理芯片，使大模型每秒生成速度接近每秒500 token（文本中的一個最小單位），碾壓GPT-3.5的每秒40 token。

這意味著大模型從處理請求到獲得響應(yīng)所需的時間大幅縮短，有網(wǎng)友直呼“它回復(fù)的速度比我眨眼還快”；有人認(rèn)為Groq的LPU可能成為英偉達(dá)GPU芯片的有力替代品；更有自媒體聲稱英偉達(dá)被Groq的LPU“碾壓”。

但隨后陸續(xù)有業(yè)界專家對于Groq LPU性價比和競爭力提出質(zhì)疑，并否認(rèn)其可能沖擊英偉達(dá)。有計算顯示Groq LPU的硬件成本約是英偉達(dá)H100 GPU的40倍，能耗成本約是其10倍。

專家質(zhì)疑Groq LPU性價比和競爭力

清華大學(xué)集成電路學(xué)院副教授何虎接受記者采訪表示，LPU屬于推理芯片，和目前供不應(yīng)求、主要用于大模型訓(xùn)練的GPU芯片不能算同一個賽道。從推理芯片賽道來看，LPU目前可能達(dá)到了較高性能，但是運行成本并不低。高性能低成本的推理芯片可以降低推理成本、拓寬AI大模型應(yīng)用范圍。其市場前景主要取決于推理需求的市場選擇，不太涉及科技競爭。

顧名思義，訓(xùn)練芯片主要用于訓(xùn)練大模型，推理芯片則主要用于AI應(yīng)用中。業(yè)內(nèi)認(rèn)為，隨著各行各業(yè)迎來垂類大模型，AI大模型應(yīng)用逐步落地，用于推理的算力將和訓(xùn)練算力一樣受到關(guān)注。

然而，即便是用于推理，有專家根據(jù)LPU、GPU的內(nèi)存容量和大模型運行吞吐量計算，無論在性價比和能效比上，LPU都無法和英偉達(dá)的GPU競爭。

臉書原AI科學(xué)家、阿里原技術(shù)副總裁賈揚清在海外社交媒體平臺發(fā)文分析，Groq LPU的內(nèi)存容量非常小（230MB）。簡單計算得出，運行700億參數(shù)模型時，需要305張Groq卡，相當(dāng)于使用8張英偉達(dá)H100。從目前的價格來看，這意味著在同等吞吐量下，Groq LPU的硬件成本約是H100的40倍，能耗成本約是其10倍。

記者采訪的某國內(nèi)頭部AI芯片公司負(fù)責(zé)人也認(rèn)同上述計算結(jié)果。他認(rèn)為，與GPU使用HBM（高帶寬存儲器）不同，LPU使用了SRAM（靜態(tài)隨機(jī)存儲器）作為存儲，就意味著要堆很多卡才能跑一個大模型。

騰訊科技芯片專家姚金鑫更是直言：“英偉達(dá)在本次AI浪潮中的絕對領(lǐng)先地位，使得全球都翹首以盼挑戰(zhàn)者。每次吸引眼球的文章，總會在最初被人相信，除了這個原因之外，還是因為在做對比時的‘套路’，故意忽略其他因素，用單一維度來做比較。”

Groq多年致力于顛覆GPU和CPU等傳統(tǒng)架構(gòu)

Groq官網(wǎng)介紹說，LPU代表語言處理單元，是一種新型的端到端處理單元系統(tǒng)，可為具有順序組件的計算密集型應(yīng)用程序（如大語言模型LLM）提供最快的推理。

Groq官網(wǎng)展示的簡化LPU架構(gòu)

對于為什么LPU用于LLM和生成式AI時比GPU快得多，Groq官網(wǎng)解釋說，LPU旨在克服LLM的兩個瓶頸：計算密度和內(nèi)存帶寬。對于LLM來說，LPU的計算能力要大于GPU和CPU，減少了計算每個單詞所需的時間后，可以更快生成文本序列。此外，通過消除外部內(nèi)存瓶頸使LPU推理引擎能在LLM上提供比GPU高幾個數(shù)量級的性能。

Groq成立于2016年。早在2021年，外界就曾將Groq稱為“英偉達(dá)最強(qiáng)挑戰(zhàn)者”。2021年，Groq獲得了由知名投資機(jī)構(gòu)老虎環(huán)球管理基金、D1 Capital領(lǐng)投的3億美元，總?cè)谫Y額達(dá)3.67億美元。

2023年8月，Groq就推出了Groq LPU，可以以每秒超過100 token的創(chuàng)紀(jì)錄速度運行700億參數(shù)的企業(yè)級語言模型。Groq估計，與其他系統(tǒng)相比，它具有10倍到100倍的速度優(yōu)勢。

Groq創(chuàng)始人兼首席執(zhí)行官喬納森·羅斯（Jonathan Ross）曾表示：“人工智能受到現(xiàn)有系統(tǒng)的限制，其中許多系統(tǒng)正在被新進(jìn)入者追隨或逐步改進(jìn)。無論你在這個問題上投入多少錢，GPU和CPU等傳統(tǒng)架構(gòu)都難以滿足人工智能和機(jī)器學(xué)習(xí)不斷增長的需求……我們的使命更具顛覆性：Groq尋求通過將計算成本降至零來釋放人工智能的潛力?！?/p>

更多資訊關(guān)注
中方信富公眾號

推薦內(nèi)容