我先聲明,我跟Yoyo 侯宗佑從來沒有討論過對DeepSeek的看法。看到Yoyo稍早發文,跟我想法幾乎一樣,他某些觀點,也呼應我這幾天發文重點,真是太有默契。😎
我前幾天發文寫到,「跳得高不如長得高⋯演算法可以在後天優化AI效能,DeepSeek一時領先,但很容易被追上,而晶片算力是很難超越的先天優勢。」
本來還想針對DeepSeek寫些想法,就偷懶一下,整理一下Yoyo最新發文重點:
(先介紹一下Yoyo的學術專業,他去年才剛拿到康乃爾的博士,論文就是研究「AI與人機介面」)
1.
DeepSeek 能用更少的資源做一樣的運算,背後算法的想法當然很聰明,也是重要的技術突破。但其實 AI 領域的歷史裡一直都有世界各國的研究突破在裡面(而且一直都包括中國),所以這次某些人嗨到翻天,與其說他們真的了解技術,不如說是受到這一波中國大外宣的影響—中國AI一直都不弱。
(補充:中國軟體發展一向不弱,尤其比起他們在硬體上的落後)
2.
這些人嗨的原因是,覺得中國 AI 要迎頭趕上,彎道超車了——我也只能說,中國這幾十年來不就是一直在用「更少的資源、更便宜的價格,做跟別人一樣的事」?他們在工業上的大量複製、便宜生產,有讓他們彎道超車嗎?沒有。
只要他們的思維還在「做一樣的事」,那最多就是逼車,無法超車。超車需要跟山寨完全不同的思維,而我目前看不出來他們的內捲文化有什麼改變。(當然,這次技術內容完全公開是滿值得鼓勵的,希望能給矽谷大頭們一點刺激。)
3、
AI 主要就是兩件事:算力與DATA。中國的算力被美國封印,而他們的專制制度對Data則是兩面刃:有些資料,像是臉部辨識,他們有絕對的優勢,但是言論與思想管制也造成他們的 Data 天生就會缺一大塊。這就像是一個發展不平均的大腦,而且這大腦還有一大塊被活生生挖掉——也許在某些功能上可以超英趕美,但終究會是有缺陷的。
4、
能用更便宜的資源做到 ChatGPT 能做到的事,就表示 Nvidia 跟台積電要完蛋了嗎?
剛好相反,現在 AI 的應用,離真正完全發揮 AI 的潛力大概 1% 不到吧。
這就像是電力發明之初,只用在非常寶貴的用途——而當電力普及,成本下降之後,才更深入人生活的各個層面。AI也是一樣,我們現在,才剛在開始的階段呢,怎麼會覺得能做到現在 ChatGPT 能做的事就是終點呢?
5、
覺得DeepSeek 這樣優化演算法的做法,就可以取代「算力至上」的現況?這是沒有讀過計算機發展史的人才會有的想法吧!
三四十年前桌上型電腦就曾經有這樣的爭論了,之後手機又來一次,現在 AI 這一波我也看不出會有什麼不同
對於算力的需求,永遠不會停止,當然同時對於算法的優化,也會一直存在,端看當下那一方突破的阻力比較小,技術就會暫時朝向那一方發展。
但長久而言,對算力的需求真的只會越來越大。
6、
所以,短期內我還看不到 Nvidia 跟台積電會被威脅——至少不是被 DeepSeek 已公開的演算法威脅。
(˶‾᷄ ⁻̫ ‾᷅˵)