大模型領(lǐng)域,開源與閉源之爭一直是技術(shù)和產(chǎn)業(yè)界關(guān)注的焦點。阿里云通義千問最新發(fā)布的Qwen2系列模型,為這場爭論提供了最新的答案。
6月7日,通義千問推出開源模型系列Qwen2,包括5款模型:0.5B、1.5B、7B、72B、MoE,其中,Qwen2-72B整體性能相比Qwen1.5-110B大幅提升!一舉超越了美國最強的開源模型Llama3-70B,更是將文心4.0等中國眾多閉源模型甩在身后,登上最強開源大模型的寶座。
此前存在一種觀點認(rèn)為在大模型的開發(fā)上,閉源模型因為其龐大的投資和資源積累,相較開源模型具有不可比擬的優(yōu)勢,導(dǎo)致了一種看似共識的觀念:開源模型難以追趕閉源模型的步伐。
單一的公司的閉源模型,如果有大量資金和資源投入,的確可以在短期內(nèi)推動技術(shù)的發(fā)展,這一點在OpenAI上已經(jīng)得到了驗證。而且不可否認(rèn),選擇閉源的OpenAI在性能上仍然是業(yè)界最強。
而這次阿里云Qwen2的發(fā)布,表明開源模型同樣能夠達到甚至超越閉源模型的高性能。這不僅讓開源模型落后閉源模型的論調(diào)不攻自破,也再次證明了開源大模型不僅不會越來越落后,在技術(shù)上更是有著無限的可能。開源大模型能夠做到足夠強,并且會越來越強。
同時這也是對開源價值的再一次闡釋,Qwen系列的開源模型除了為技術(shù)社區(qū)貢獻了一項重要的資源,也鼓勵了全球性的創(chuàng)新合作,進一步強化了開源大模型生態(tài)系統(tǒng)的活力和包容性。
值得一提的是,阿里云在1個月前剛剛發(fā)布中文場景性能超過GPT-4的閉源模型——通義千問2.5,從這個角度來看開閉源的路線選擇,阿里云實際上是兩條腿走路。既利用開源的優(yōu)勢進行廣泛的技術(shù)傳播和創(chuàng)新,又通過閉源的方式保障關(guān)鍵技術(shù)的領(lǐng)先和商業(yè)應(yīng)用的穩(wěn)定。這種類似于雙軌制的策略,使得阿里云能夠在技術(shù)創(chuàng)新和商業(yè)化應(yīng)用中取得平衡,實現(xiàn)技術(shù)價值的最大化。
所以,開源與閉源并不矛盾,而是在不同的場景和需求下扮演著各自獨特的角色,這并不是一道非此即彼的選擇題,也是時候為兩者的路線之爭畫下休止符了。
事實上,過去10個月里,這樣的場景并不是阿里云開源大模型僅有的高光時刻。據(jù)了解,Qwen系列模型總下載量已突破1600萬次。在全球開源社區(qū)出現(xiàn)了超過1500款基于Qwen二次開發(fā)的模型,Qwen系列的72B、110B模型多次登頂HuggingFace 的Open LLM Leaderboard開源模型榜單,其國際社會認(rèn)可度及開發(fā)者好感度可見一斑。
大洋彼岸的Meta試圖用Llama系列一統(tǒng)開源天下,而阿里的通義千問的出現(xiàn)為全球開發(fā)者提供了另一項選擇,也讓我們看到了“國外一開源,國內(nèi)就自主”說法的偏頗。市場會用腳投票,以Qwen為代表的國內(nèi)開源模型所作出的貢獻被長期忽視的現(xiàn)狀,一定會隨著更多全球企業(yè)和開發(fā)者的認(rèn)可,逐漸扭轉(zhuǎn)過來。
開源的Qwen,開放的阿里云
開源與互聯(lián)網(wǎng)的發(fā)展緊密相連,自1970年代Unix和互聯(lián)網(wǎng)問世之初,開源就隨之出現(xiàn)。如果不是開源運動的推進,許多技術(shù)仍可能被少數(shù)巨頭企業(yè)所壟斷,阻礙科技普惠程度,我們所見證的科技創(chuàng)新浪潮也將不復(fù)存在。
對于大模型行業(yè)來說,有了更好的開源模型,才能夠吸引更多人才參與到相關(guān)技術(shù)創(chuàng)新研究中。有了更好的開源模型,更多中小企業(yè)才能真正用上大模型,才會有更多對大模型產(chǎn)品應(yīng)用的探索。
阿里云對開源的堅持,本質(zhì)上是相信開放的力量,也就是阿里云CTO周靖人所說,“堅持開源開放是阿里云的重要策略,我們希望打造一朵AI時代最開放的云,讓算力更普惠、讓AI更普及。”這種堅定的開源策略,不僅為技術(shù)創(chuàng)新提供了土壤,也為全球開發(fā)者提供了平臺。
開放是為了服務(wù)好客戶,阿里云百煉集成了國內(nèi)外主流優(yōu)質(zhì)大模型,提供模型選型、微調(diào)訓(xùn)練、安全套件、模型部署等服務(wù)和全鏈路的應(yīng)用開發(fā)工具。
開放也是為了生態(tài)的繁榮,把餅做大,才能更好的分餅。在阿里云魔搭社區(qū)上,匯聚了大量開源模型,成為國內(nèi)開發(fā)者最活躍的AI社區(qū)。
選擇開源還是閉源,不僅是企業(yè)的戰(zhàn)略決策,更會影響商業(yè)模式。不可否認(rèn)的是大模型的開源存在商業(yè)模式不明朗的問題,比如扎克伯格也一直在評估自身能否從云服務(wù)廠商使用Llama相關(guān)收入中進行分成,畢竟Meta不太可能為了Llama去開辟云計算業(yè)務(wù)。
而對阿里云這樣一家提供基礎(chǔ)設(shè)施的云廠商來說,商業(yè)邏輯就十分清晰了。在大模型技術(shù)帶動云計算增量需求,幾乎是一個確定性趨勢的背景下,Qwen的開源不需要帶來直接的商業(yè)化收益,而是吸引更多的廠商和開發(fā)者,來使用阿里云打造的基礎(chǔ)設(shè)施,以及包括閉源模型在內(nèi)的相關(guān)服務(wù),從底層的算力基座,到大模型應(yīng)用的構(gòu)建,再到開放的AI生態(tài),從而形成完整的商業(yè)模式。
通過親自下場打造并開源Qwen系列模型,同時為大模型的落地提供完善的工具和平臺,阿里云走出一條與Meta、微軟、AWS等頂級玩家不同的道路,這種云+AI的示范效應(yīng),已成為一種行業(yè)標(biāo)準(zhǔn),對客戶選擇阿里云來探索大模型提供了一種天然的說服力。
這在全球大模型廠商中也是獨一份。
Qwen是阿里AGI愿景的重要拼圖
在AGI成為科技巨頭們新戰(zhàn)場的當(dāng)下,阿里巴巴清晰地表明了其在這一領(lǐng)域的堅定信心和戰(zhàn)略布局。在阿里發(fā)布的2024財年致股東信中,明確提出電商和云計算是阿里的兩大核心業(yè)務(wù),并將通過持續(xù)投資保持基礎(chǔ)技術(shù)的領(lǐng)先地位,包括人工智能在內(nèi)的創(chuàng)新。
從技術(shù)發(fā)展的角度來看,AI的進步經(jīng)歷了數(shù)次重要的飛躍,已經(jīng)深刻改變了各個行業(yè)的面貌。云計算的普及進一步加速了AI的發(fā)展,使得大規(guī)模數(shù)據(jù)處理和復(fù)雜模型訓(xùn)練成為可能。在這一歷史背景下,阿里云通過其云計算基礎(chǔ)設(shè)施和持續(xù)的技術(shù)創(chuàng)新,推動了AI技術(shù)的前沿探索,Qwen的領(lǐng)先以及在全球范圍獲得了認(rèn)可,正是阿里云計算與AI結(jié)合戰(zhàn)略的產(chǎn)物。
從商業(yè)發(fā)展的角度,技術(shù)創(chuàng)新一直是企業(yè)競爭力的核心驅(qū)動力。阿里云通過將AI與云計算的深度融合,不僅開辟了在AI時代的商業(yè)模式,也獲得了持續(xù)增長的路徑。
在近期與摩根大通的對話中,阿里巴巴副主席蔡崇信再次表示AI和云計算的結(jié)合至關(guān)重要,并強調(diào)了阿里對AGI愿景的堅定信念?,F(xiàn)在來看,阿里云已然為這一愿景打造了一塊關(guān)鍵拼圖