百度近十年累計(jì)研發(fā)投入超1800億元
近日,2025世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會人工智能技術(shù)創(chuàng)新與治理論壇順利召開,百度技術(shù)委員會理事長、中國軟件行業(yè)協(xié)會副理事長陳尚義出席活動并發(fā)表主題演講,分享了百度在人工智能領(lǐng)域近年來的技術(shù)進(jìn)展。他談到,百度AI創(chuàng)新的核心理念是“縱向優(yōu)化,橫向賦能”,在四層架構(gòu)上堅(jiān)持不懈地進(jìn)行縱向技術(shù)棧優(yōu)化,并通過百度自身的業(yè)務(wù)、產(chǎn)品和開源開放的手段橫向進(jìn)一步向全社會賦能,讓廣大開發(fā)者都能夠使用百度最先進(jìn)的技術(shù)成果。

陳尚義現(xiàn)場分享百度AI創(chuàng)新的核心理念
IT時(shí)代,軟件開發(fā)的技術(shù)棧分為三層:底層是芯片,中間是操作系統(tǒng),最上層是應(yīng)用。陳尚義表示,人工智能的發(fā)展使得技術(shù)棧發(fā)生了變化:底層是以CPU、GPU為代表的芯片,其次是深度學(xué)習(xí)訓(xùn)練框架,再上層是基礎(chǔ)大模型,最頂層則是豐富的應(yīng)用。百度在四層架構(gòu)上都有領(lǐng)先布局。
芯片層面,百度昆侖芯經(jīng)過14年的精心打磨、三次技術(shù)迭代,目前已在互聯(lián)網(wǎng)、運(yùn)營商、國家算力樞紐等行業(yè)實(shí)現(xiàn)了落地。如今已經(jīng)順利實(shí)現(xiàn)了與主流框架和大模型的充分適配。公開資料顯示,昆侖芯已成功點(diǎn)亮三代萬卡集群,超大規(guī)模并行計(jì)算能力可實(shí)現(xiàn)訓(xùn)練效率躍升,將千億參數(shù)模型的訓(xùn)練周期大幅降低。
框架層面,百度飛槳深度學(xué)習(xí)框架支持模型開發(fā)、訓(xùn)練及推理,并提供了豐富的基礎(chǔ)模型庫、端到端開發(fā)套件、工具和組件,大幅降低使用門檻。截至目前,飛槳文心生態(tài)開發(fā)者達(dá)到2333萬,服務(wù)企業(yè)達(dá)到76萬家,創(chuàng)建模型110萬個(gè)。
模型層面,百度文心大模型有三大技術(shù)優(yōu)勢:知識增強(qiáng)、搜索增強(qiáng)和對話增強(qiáng)。得益于百度長期從事搜索業(yè)務(wù)的技術(shù)積累,文心大模型有效降低模型幻覺,提高了模型的事實(shí)性;在指令遵循方面,對用戶意圖的理解、邊界約束條件的準(zhǔn)確使用,都達(dá)到理想的生成效果。
應(yīng)用層面,文心大模型已通過飛槳的生態(tài)支撐,結(jié)合開源的技術(shù)工具,在AI搜索、文庫等場景落地應(yīng)用,在技術(shù)棧的各層都有領(lǐng)先業(yè)界的關(guān)鍵自研技術(shù),實(shí)現(xiàn)了層與層反饋,端到端優(yōu)化,大幅提升效率。
活動現(xiàn)場,陳尚義分享道,百度非常重視在研發(fā)上的投入,十年累計(jì)投入超1800億元。在專利方面,百度AI專利授權(quán)量和申請量連續(xù)7年國內(nèi)第一,在生成式人工智能興起后,百度AI專利依舊連續(xù)三年第一。
值得一提的是,百度已持續(xù)推進(jìn)技術(shù)開源開放,今年6月30日實(shí)現(xiàn)了飛槳框架與大模型雙層開源。其中,文心推理模型ERNIE Thinking在huggingface全球總趨勢榜及文本趨勢榜均位列第一,PaddleOCR-VL模型也在該平臺相關(guān)榜單中取得世界冠軍成績,為開發(fā)者提供了可直接應(yīng)用的技術(shù)工具與模型支持。(百度供稿)







