中文字幕精品一区二区精品_久久一二三区_亚洲韩日在线_日韩中文字幕视频

擁抱通用人工智能新時代

日期:2024-02-09 15:55

導讀:20231020-21日,以“智能涌現 生成未來”為主題的第二十五屆中國科協年會通用人工智能產業創新發展論壇在安徽省合肥市成功召開。科大訊飛股份有限公司副總裁、研究院院長劉聰受邀出席并作題為擁抱通用人工智能新時代”的主題報告。報告闡釋了認知智能大模型技術階躍對行業的變革式影響,剖析認知智能大模型技術原理,提煉其智能涌現的技術啟示以及未來仍需繼續攻克的難題。分享了科大訊飛通過星火認知大模型在各業落地應用的創新產品及價值體現,總結經驗與方法論,為進一步加快通用人工智能產業發展建言獻策

以下為報告全文。

 

以ChatGPT為代表的大模型的出現人工智能帶來了重大變革,然而,需要明確的是,大語言模型本身并不等同于通用人工智能。在這個過程中,中國始終以OpenAI等國際領先公司為標桿,不斷尋求技術的進步。然而,隨著技術的不斷發展,模型應用于實際產業中也帶來了一些新的挑戰。

一、通用認知大模型的技術解讀與分析

認知大模型的出現推動通用人工智能的技術發展邁出了重要一步,促使我們朝著通用人工智能的目標邁進,為未來科技的發展帶來了新的希望。此外,從國家層面來看,國家高度注通用人工智能領域,眾多省市區相繼出臺了相關政策,由此表明通用人工智能受到了廣泛的關注和支持。

在大模型產業競爭中,企業除了技術發展之外,十分注重產業實際應用,國際大模型產業競爭目前呈現“激烈迅猛”之勢,如圖1所示。OpenAIGPT-3.5GPT-4的不斷改進,在多個領域的應用表現令人矚目。

 

1 國際大模型激烈競爭

   ChatGPT建立在深度神經網絡的大模型之上,實現了認知智能的重大技術突破。系統能夠通過交互式對話統一處理文本生成語言理解邏輯推理等各種任務,因此我們將其稱為對話式人工智能系統。語言一直是人類認知發展的重要階段,從發明語言開始,人類就通過學習文本、課本和多媒體材料來獲取各種領域的知識。大語言模型的終極目標是讓機器也能夠通過學習語言的方式掌握各種知識,通過訓練龐大的參數模型,將機器的語言理解能力與人類的語言概念空間更加契合,實現更加類人的機器智能。

從GPT-3.5GPT-4,其語言理解能力得到了顯著提升GPT-4進一步解決了GPT-3.5面臨的長文本輸入、多模態輸入、外部實時知識運用等諸多挑戰,在復雜認知任務(跨學科語言理解、跨行業知識運用)、復雜推理任務、多模態任務等方面繼續進步,進一步抬高了智能涌現的上限,如圖2所示。基礎上,需要明確多模態和語處理之間的關系。語言仍然是通用人工智能的核心,它代表了人工智能在感知和理解方面的高級階段。無論涉及圖像、視頻、語音,無論是理解、感知還是生成,都可以通過空間映射的方式與這一核心語言模型相結合,從而推動通用人工智能的綜合發展。

 


2 GPT-4的高階能力

OpenAI從早期就開始涉足多模態領域,如圖3所示。早期DALL-E的嘗試在質量和效果上可能不夠理想,但隨后在20229月推出的DALL-E 2取得了顯著進展。此外,GPT-4 4V已逐步開放。這些通用大模型已經邁向了全能型,不再局限于特定領域,而是能夠執行各種任務。它們能夠生成藝術字體解析論文框圖,理解文中的各個步驟和架構,甚至能夠解讀各種符號,這種多模態任務在過去是難以想象的。

 

3 OpenAI多模態技術演進路線

通用大模型是當前邁向通用人工智能最有希望的路徑,但仍需攻克三大難題:一是大模型的知識幻想問題;二是大模型自進化和個性化問題;三是多模態及具身智能訓練問題。總的來說,大型深度神經網絡模型如GPT系列已經實現了技術上的重大突破,為通用人工智能的實現鋪可能的平了道路。這些模型的巨大成功表明,通過更多高質量的數據和更大的模型,我們可以讓機器執行人類智能可以完成的任務。此外,文字作為信息載體在數據量和傳遞信息方面具有巨大優勢,但同時也展示了多模態數據可以推動感知智能發展,從而拓展了人工智能的應用潛力。這些發展為未來通用人工智能的實現提供了巨大的潛力和想象空間。

二、通用認知大模型的技術解讀與分析

認知大模型的“智能涌現”將帶來解決人類剛需的全新機遇。它將改變信息分發獲取方式,使傳統搜索和視頻流等領域變得更加高效;它將進一步改變內容的生產模式,包括文本、圖像和視頻的生成;它將進一步推動全自然交互任務的完成,實現專家級的虛擬助手,顛覆傳統手工的編程方式,成為科研工作的加速器。從技術和產業分析的角度來看,大模型在當今人工智能領域具有歷史性的重要意義

在過去的十多年中,科大訊飛在人工智能技術和各行業產業應用方面積累了豐富的經驗。2022年1215日,科大訊飛啟動了大模型關計劃,確定了1+N策略。自202356訊飛星火認知大模型正式發布以來,我們為大模型制定了明確的年內升級里程碑202369按計劃,我們實現了開放式對話突破,以及多輪對話能力數學能力提升推出了星火APP,獲得了廣泛關注。2023815星火大版本的更新,包括代碼能力的提升、多模態能力的更新和通用能力的不斷提升,發展歷程如圖4所示1024日,科大訊飛再次發布訊飛星火V3.0宣布整體超越ChatGPT

 


4 訊飛星火認知大模型升級的關鍵里程碑

815日,訊飛星火V2.0代碼能力提升發布了應用產品iFlyCode1.0其功能將在許多實際場景中顯著提高工作效率,特別是對于程序員

    同時,多模態能力也進行了展示包含圖像描述、圖像問答、識圖創作、文圖生成、虛擬人合成等方面。

5展示了星火認知大模型在教育不同領域的應用。從虛擬人、學習機、教育辦公到醫療、汽車、工業,大模型在各種場景中都發揮了重要作用例如幫助學生批改中英文作文、提高教師備課效率、個性化制定病人康復計劃、提供高效辦公工具、支持汽車座艙產品的開發,在工業領域利用大模型的擴展能力和企業內部數據知識來實現構建企業知識大腦

 

5 星火認知大模型助力教育

1024發布的星火認知大模型V3.0版本將從七個維度全面提升代碼能力,實現中文超越英文對標ChatGPT。重磅發布醫療大模型通過-訊飛曉醫APP為每個家庭提供健康助手;首次發布科技文獻大模型,為每個科研工作者提供星火助力;全新發布AI答疑輔學和AI心理咨詢,為每個孩子提供成長伙伴;進一步升級智能編程助手iFlyCode2.0與行業龍頭共同發布12個行業大模型,提供生產力工具。

三、通用認知大模型的技術解讀與分析

    未來通用人工智能的發展將遵循三大趨勢。首先,通用人工智能將朝著多模態和多語言的方向發展,實現更廣泛的應用和更全面的理解。其次,可解釋性和可信性將成為發展的重要關鍵,確保人工智能系統的決策和行為可以被理解和信任。最后,算法的可控性將變得至關重要,通用人工智能技術和產業必須建立在軟硬件的全面自主可控基礎之上,以確保數據和模型的安全性。這些方向將推動通用人工智能向更高層次的感知和語義理解邁進,實現更廣泛和深入的應用。

文本生成的能力不斷演進,現在不僅可以輸入文本生成請求,還可以通過輸入Prompt來增強模型的性能,甚至采用類似于大模型中的人類反饋強化學習技術,如圖6所示星火大模型結合圖像理解能力,并通過其他調節器的輸入,也可以生成詳細的內容描述。這種底層認知大模型的支持使得能夠實現更深入的理解和更精確的描述。

 


6星火文圖生成能力

   在大模型的應用中,應對虛假信息傳播問題至關重要,特別是隨著模型尺寸的增加,這一挑戰變得尤為緊迫。我們需要采用有針對性的策略,考慮多語言和信息數據的復雜性,以確保安全和可控性。此外,大型模型只是整個復雜系統的一部分,因此需要明確何時調用插件或其他組件來生成指令,同時重新整理信息以生成目標答案,如圖7所示。

 

7 大模型與插件的交互使用

隨著大模型的不斷發展,算力成為不斷增長的需求。除了硬件,還需要在并行優化、算子庫等方面進行復雜的工作。在此領域,訊飛在過去與國內的合作伙伴如華為、寒武紀、曙光合作,在提供更高效的硬件解決方案方面積累了豐富的經驗。最近訊飛和華為聯手在815發布了星火一體機,如圖8所示1024日,訊飛聯合昇騰生態共同發布“飛星一號”大模型算力平臺,并啟動對標GPT4的更大參數規模的星火大模型訓練

 

8 私有化場景的星火一體機

    OpenAI一直處于領先地位,而自315推出GPT-4以來,語言能力已經達到了新的高度。長期來看,我們需要建立產業生態圈和科研生態圈,同時還要持續進行原始創新,并將這一理念與應用結合,研究2B(面向企業)和2C(面向消費者)市場,不僅要推出新產品,還要考慮是否能夠改進傳統解決方案,是否能夠帶來真正的價值。最終,強調實際效果至關重要,而不只是依賴宣傳。

在人工智能時代,即使在某一領域處于領先地位,與其他公司相比,技術的細微差距也可能對某些場景的性能產生巨大影響。因此,需要進行系統性創新,這種創新包括語音圖像自然語言理解等各種技術領域,以將每個技術推向巔峰,并將其整合創新。在大模型時代,那些深入場景的企業可能會取得更遠的發展。訊飛星火認知大模型采取了1+N+X的策略,如圖9所示,其中1代表了通用底座能力的不斷提升,N代表了相關的重點應用行業領域X則代表了生態相關細分行業產品相信未來的人工智能生態將涵蓋多個領域,圍繞大模型形成全新的生態體系。

 

9 “1+N+X”大模型產業發展生態體系

未來,相信在國內眾多科研人員的不懈努力下,中國通用人工智能的火種將繼續燎原。

(本文根據作者論壇報告速記整理而成,經作者授權發布)