【ZiDongHua 之自動化學院派收錄關鍵詞:人工智能 通用大模型  】
  
  論壇回顧 | 聚焦通用大模型“主戰(zhàn)場”,強化頂層設計——中國人工智能產業(yè)年會大模型與通用人工智能論壇圓滿落幕
  
  4月14日上午,以“創(chuàng)新驅動•數智強國”為主題的第十三屆吳文俊人工智能科學技術獎頒獎典禮暨2023中國人工智能產業(yè)年會——大模型與通用人工智能專題論壇在蘇州工業(yè)園區(qū)希爾頓酒店圓滿落幕。來自國內知名高校的專家學者匯聚一堂,觀點碰撞,探究具身智能、多模態(tài)多任務學習、語義空間對齊等重要的AI技術的理論發(fā)展和智能人機交互、OCR、內容生成等AI技術落地應用等關鍵議題,共同探討、分享人工智能的關鍵技術、創(chuàng)新難點及發(fā)展趨勢。
 
  
  眾抒己見
  
  擁抱人工智能大時代
  
  中國圖象圖形學學會青工委副主任、北京航空航天大學徐邁教授與中國電信人工智能研究院青年科學家趙健研究員共同擔任論壇主席,上海交通大學電子信息與電氣工程學院特聘教授熊紅凱,華南理工大學二級教授金連文,中國科學院大學特聘教授葉齊祥,CAAI教育工委會主任、浙江大學人工智能研究所所長吳飛,阿里巴巴通義實驗室人物AIGC負責人孫佰貴,北京航空航天大學電子信息工程學院教授李勝曦,深信服科技股份有限公司安全GPT業(yè)務主管訾然,西北工業(yè)大學副教授、上海人工智能實驗室青年科學家趙斌等學術界與產業(yè)界的專家出席并在論壇上發(fā)表專題報告。中國電信人工智能研究院青年科學家趙健研究員擔任論壇主持人。
 
  
  趙健研究員
  
  中國圖象圖形學學會青工委副主任、北京航空航天大學徐邁教授為本次論壇致歡迎詞。致辭中提到:“隨著人工智能技術的飛速發(fā)展,大模型已經成為推動社會進步,促進產業(yè)升級的重要力量,它們以強大的數字處理能力和深度學習能力,正在改變著我們的生活方式、工作模式乃至思想習慣。”
  
  他表示:“本次論壇匯聚了眾多大模型領域的佼佼者,我們共同探討大模型的最新研究成果、應用案例和未來趨勢,我相信通過我們的交流合作,我們能夠更好的理解大模型的潛力和挑戰(zhàn),更有效的推動大模型技術的發(fā)展和應用。”當下而言,大模型的發(fā)展并非一帆風順,對計算資源的巨大需求,對數據質量的嚴格要求,以及可能帶來的倫理和隱私問題,亟待領域學者、開發(fā)者、使用者共同努力,探索和創(chuàng)新,以確保大模型技術的健康發(fā)展和廣泛應用。每一個人都要以更積極的態(tài)度,擁抱全新的趨勢,面對新時代背景下技術邏輯、需求邏輯和場景方面的挑戰(zhàn)。
 
  
  徐邁教授
  
  共赴AI大模型熱潮
  
  聚焦時代機遇與挑戰(zhàn)
  
  上海交通大學電子信息與電氣工程學院特聘教授熊紅凱作題為《面向通用視覺大模型的稀疏優(yōu)化和泛化設計》的主題報告,他針對構建大模型的基本架構Transformer設計,與參會嘉賓共同討論不同場景和幾何結構數據的高效可泛化方法。他討論了模態(tài)混合適配信息遺忘的問題,根據可逆歸一化流進行信息無損的適應性調整,構建多任務的動態(tài)模型拓撲。拓展Transformer結構,形成可學習的各向異性濾波,實現(xiàn)多尺度幾何頻率分析。對于一般化的流形上信號,進行動態(tài)路由可學習構圖,設計規(guī)范等變網絡,提升在不同局部坐標系、不同三維網格結構及分辨率下的泛化性能。
  
  熊紅凱教授
  
  華南理工大學二級教授金連文作題為《視覺基礎模型與OCR垂直大模型的一些思考》的主題報告。隨著大語言模型(LLMs)的興起,面向自然語言處理領域的通用人工智能(AGI)取得了重大突破,近年來視覺基礎模型、多模態(tài)大模型也引起了廣泛的研究關注并取得了快速發(fā)展,但針對光學文字識別(OCR)垂直領域的大模型研究工作報道還不多。他在分享中簡要回顧了近年來多模態(tài)大模型、視覺基礎模型和OCR垂直領域基礎模型等相關代表性技術進展,并向大眾介紹了他所在團隊的最新研究,也就是面向OCR的文檔圖像像素級底層處理基礎大模型構建方法和技術路線。隨后與參會嘉賓共同對大模型時代OCR等垂直領域的發(fā)展趨勢與未來研究方向進行討論和展望,為大家?guī)砹朔浅P路f的見解。
  
  金連文教授
  
  國科學院大學特聘教授葉齊祥作題為《視覺表征模型的結構設計與物理啟發(fā)》的主題報告,他首先分析了局部卷積運算與全局注意力運算的互補性及辯證關系,將局部特征與全局特征耦合形成Conformer網絡結構,顯著增強視覺表征能力,提升表征模型的性能下限。接著探討了局部卷積運算造成的Mask Image Modeling (MIM)自監(jiān)督學習信息泄露問題,提出了Token Merging操作,突破卷積或局部運算的局部約束,形成高效分層Transformer 表征(HiViT)與全預訓練的Transformer 金字塔網絡(iTPN)。這一系列研究,從模型結構設計角度將視覺目標檢測、分割等任務性能提升到了一個新高度。
  
  葉齊祥教授
  
  探索大模型創(chuàng)新發(fā)展
  
  打通技術與典型場景應用壁壘
  
  深信服科技股份有限公司的安全GPT業(yè)務主管訾然作題為《大語言模型在網絡安全領域的落地實踐和研究》的主題報告。他在報告中首先介紹了國內外網絡安全領域落地大語言模型的最新進展和落地實踐,包括攻擊檢測、威脅研判、數據安全等。并探討在RAG、超長上下文、AI agent等大語言模型新技術快速發(fā)展的當下,安全領域的大語言模型會如何發(fā)展。從更貼近實際產品的角度向大家介紹了安全領域大模型落地到底會給客戶展現(xiàn)哪些更為直觀的場景。
  
  訾然博士
  
  阿里巴巴通義實驗室人物AIGC負責人孫佰貴結合自身豐富的研究經驗分享了題為《AIGC FaceChain的應用與創(chuàng)新》的主題報告。他認為在AIGC技術浪潮推動下,圖像內容生成已經在C端和B端展現(xiàn)出了廣闊的應用潛力。結合實際應用,他向大家分享了facechain在人物寫真、虛擬試衣、人物視頻等熱門應用場景的攻關成果。相關技術場景已在飛豬數字旅拍、通義萬相寫真館等多個應用中成功落地,其開放API具有開箱即用、自定義模板、靈活配置風格以及免訓練技術路徑等優(yōu)勢。目前facechain團隊積極推進開源社區(qū)建設,在GitHub上收獲超過8.1K Star,已榮獲6項國內外開源項目和個人獎項。他希望通過此次分享, facechain能被更多人了解,也更關注這方面的發(fā)展與未來應用。
  
  孫佰貴研究員
  
  北京航空航天大學電子信息工程學院教授李勝曦作題為《面向視覺語義重構的表征與壓縮方法》的主題報告,他表示:大數據、大模型時代下,智能算法的不斷進步常伴隨其表征能力的穩(wěn)步提升,而概率生成模型以無監(jiān)督方式對信號進行概率表征,以其概率釋義等優(yōu)勢在人工智能中扮演著極為關鍵的角色。報告圍繞面向視覺語義重構的生成對抗網絡表征與可逆化方法,分析生成對抗網絡的表征性能,以特征函數為統(tǒng)計度量,進而介紹面向語義重構的生成對抗網絡,其理論完備性可確保語義表征的完備性。
  
  李勝曦教授
  
  CAAI教育工委會主任、浙江大學人工智能研究所所長吳飛作題為《從文本合成到視頻合成的技術鏈路與瓶頸挑戰(zhàn)》的主題報告。他在報告中介紹了谷歌公司2016年提出能夠捕獲文本單詞之間局部/全局關聯(lián)的自注意力神經網絡transformer、谷歌公司2021年將transformer從文本領域拓展到圖像領域的Vision transformer、Stability AI 公司2022年提出的以文生圖Stable Diffusion、加州大學伯克利分校和紐約大學2023年提出圖像合成技術Diffusion Transformers (DiTs)等核心算法發(fā)展脈絡,以及在這些核心算法的發(fā)展中,揭示了對合成內容中的最小單元進行有意義的關聯(lián)組合的機理與天花板。
  
  在垂直領域的大模型或者通用大模型方面,他也提出了未來展望的研究熱點。包括語言大模型躍升為跨媒體大模型;如何讓大語言模型訓練和賦能過程,實現(xiàn)數據和知識的雙輪驅動;如何讓大語言模型和環(huán)境進行交互,對智能體的動作行為進行指導或者是評估;如何設計更好的大語言模型工具,完成基礎科學研究或者工程技術領域挑戰(zhàn)的問題;以及如何通過端云協(xié)同鏈條化技術打通垂直領域大模型和端側輕量級推理之間的障礙,形成大小模型端云協(xié)同的研究等。這些挑戰(zhàn),為大模型領域的發(fā)展提出了更具體的科研要求。
  
  吳飛教授
  
  西北工業(yè)大學副教授、上海人工智能實驗室青年科學家趙斌為大家?guī)砹祟}為《人工智能軟硬件一體化》的主題報告。他提到,生命起源以來,生物智能的進化過程不僅體現(xiàn)在思維方式的演進,還包括體型和四肢等身體結構的轉變。人工智能是參考生物智能所形成的系列技術,其理論發(fā)展和技術落地需要軟硬件的協(xié)同。在這一思想的驅使下,有必要關注人工智能軟硬件一體化研究,推動人工智能應用落地。
  
  他的分享內容主要凝練了生物智能“思維計算-實體控制-環(huán)境感知”的三元交互模式,重點介紹大模型驅動具身智能體的相關研究,包括高層語義理解、自身技能認知與復雜任務執(zhí)行等技術,為大模型時代的人工智能軟硬件發(fā)展提供新思路。他表示:“現(xiàn)在大模型的方案能力比較差,和真正環(huán)境交互的時候,還有很多長尾問題沒有解決,這也引導了接下來做如何的研究。希望未來人工智能能夠觸及一切,讓世界都變得好玩起來,涌現(xiàn)更多新的概念。”
  
  趙斌副教授
  
  圍繞問題與挑戰(zhàn)
  
  縱論大模型未來發(fā)展
  
  圓桌對話環(huán)節(jié)由部分報告嘉賓及特別邀請的中科院計算所山世光研究員共同參與,就“大模型對于視覺研究的影響”、“大模型會不會主導一切”、“通用人工智能的實現(xiàn)方式?專用人工智能與通用人工智能如何結合”這三個話題進行探討。
  
  嘉賓們各抒己見,分別就上述話題發(fā)表了極具啟發(fā)性的深刻見解,帶領參會觀眾們更為清晰的認識了大模型的發(fā)展與通用人工智能的未來。嘉賓們表示:大模型不能主導一切,而未來人工智能學習肯定會回歸到人類的學習上面。大模型將來能不能在自我創(chuàng)造、自我發(fā)明方面能夠有所突破,這是一個長期且困難的事情。
  
  隨著大模型推廣,如何形成批量性、規(guī)模性的效益,是行業(yè)的共性話題。隨著應用價值的體現(xiàn),大模型在金融業(yè)的推廣力度才會更大。大模型無疑會帶來一個全新的時代,需要政、產、學、研、用深度合作、協(xié)同創(chuàng)新。
  
  激勵創(chuàng)新,智能擔當。本次論壇通過研討大模型與通用人工智能技術與應用趨勢,為數智產業(yè)發(fā)展提供新的思路和建議,同時促進了行業(yè)的交流與合作,推動AI創(chuàng)新技術普及和推廣。未來,大會將持續(xù)分享人工智能領域的新科技、新政策和新趨勢,搭建行業(yè)溝通橋梁,共同推動中國人工智能行業(yè)的高質量發(fā)展
  
  為期兩天的第十三屆吳文俊人工智能科學技術獎頒獎典禮暨2023中國人工智能產業(yè)年會已圓滿落幕。本屆大會大模型與通用人工智能專題論壇由中國人工智能學會主辦,蘇州工業(yè)園區(qū)管委會協(xié)辦,中國人工智能學會吳文俊人工智能科學技術獎評選基地(蘇州)、智博天宮(蘇州)人工智能產業(yè)研究院、北京航空航天大學、西北工業(yè)大學、深信服科技承辦。
  
  吳文俊人工智能科學技術獎
  
  “吳文俊人工智能科學技術獎”由中國人工智能學會發(fā)起主辦,是我國智能科學技術領域唯一以人民科學家、人工智能開拓先驅、我國智能科學研究的開拓者和領軍人、首屆國家最高科學技術獎獲得者、中國科學院院士、中國人工智能學會名譽理事長吳文俊先生命名,依托社會力量設立的科學技術獎(國科獎社證字第0218號),具備提名推薦國家科學技術獎資格,被譽為“中國智能科學技術最高獎”、“人工智能領域皇冠上的明珠”。旨在獎勵在智能科學研究中取得重要發(fā)現(xiàn),著力實現(xiàn)原始創(chuàng)新與突破,或在人工智能領域攻克關鍵核心技術,推動科學技術進步取得重大進展,創(chuàng)造巨大經濟社會效益或者生態(tài)環(huán)境效益的單位或個人。迄今,“吳文俊人工智能科學技術獎”已成功召開十三屆評審及表彰活動,為大力弘揚科學家精神,激勵創(chuàng)新人才涌現(xiàn),增強科技創(chuàng)新的內生動力,促進人工智能與傳統(tǒng)產業(yè)轉型融合,推動經濟社會高質量發(fā)展提供了有力支撐,在我國智能科學技術領域享有盛譽。