DEEP SEEK成為最近很大的話題,他們用Llama10分之一的成本做出跟Llama接近的效能。
一,DEEP SEEK確實很優秀,也帶給AI的發展道路很多的思考。但DEEP SEEK的低成本是建立在Llama開源的基礎上,DEEK SEEK借鑑了Llama很多,沒有其他開源的大模型,就不會有DEEP SEEK。而DEEP SEEK本身也是開源的,也會給很多其他的後繼者帶來借鑑。DEEP SEEK發布後很多人都說META一定後悔了投了那麼多冤枉錢做AI基礎建設。但META最近又提高了他們的AI資本支出到一年650億美元,這是僅次於微軟投入的800億美元的第二大金額。但我們要知道META的市值只有微軟的一半,很顯然META是比微軟還要激進的。
二,很多人也說DEEP SEEK的出現會讓CSP對算力投資卻步,所以輝達股價就要崩了,我們要知道CSP要對算力投入這麼大是為了實現AGI,沒有繼續加大投入AI基礎建設,AGI是不可能實現的。DEEP SEEK很顯然不能證明要實現AGI可以只用原來10分之1的成本。我打個比喻OPENAI考試90分,而DEEP SEEK不用補習也考了85分,而實現AGI要考99分,請問OPENAI就看了DEEP SEEK不用補習也考了85分,然後就不繼續補習了嗎?我們要肯定DEEP SEEK不用補習也考了85分,真的很優秀,但DEEP SEEK也確實沒有考超過90分,不能證明補習沒用!DEEP SEEK其實也很想補習,看能不能比OPENAI先考到99分,但現實不允許。就像華為沒有EUV也做出了7奈米晶片,這很厲害,但你以為華為不想跟蘋果一樣用三奈米晶片嗎?
三,DEEP SEEK的出現讓邊緣運算的小模型跟實現個人的AI AGENT都更加的可行,這是我覺得DEEP SEEK最大的意義所在。