国产萌白酱福利喷水视频在线观看_中國工程院院士潘云鶴：開(kāi)拓人工智能視覺(jué)知識的“北大荒”--深i科普

微信咨詢(xún)

微信咨詢(xún)

咨詢(xún)電話(huà)

首頁(yè) > 資訊 > 科普新聞

中國工程院院士潘云鶴：開(kāi)拓人工智能視覺(jué)知識的“北大荒”-

來(lái)源：中國科學(xué)報

作者：韓揚眉

發(fā)布時(shí)間：2021-06-08

瀏覽次數：1163

中國工程院院士潘云鶴：開(kāi)拓人工智能視覺(jué)知識的“北大荒”-

?

潘云鶴

■本報記者韓揚眉

近年來(lái)，圖像識別水平的快速提升推動(dòng)了人工智能熱潮。圖像識別技術(shù)的突破不僅提高了計算機對人臉、文字、指紋及生物特征、醫學(xué)圖片等識別的準確率，而且進(jìn)一步推動(dòng)了安全監控、智能交通、無(wú)人機、智能制造等多領(lǐng)域的發(fā)展，但其進(jìn)一步發(fā)展也遇到了諸如可解釋、可分析綜合、可設計仿真等方面的挑戰。

對此，在《信息與電子工程前沿》上，中國工程院院士、浙江大學(xué)教授潘云鶴提出了“視覺(jué)知識”概念。他認為，實(shí)現視覺(jué)知識表達、推理、學(xué)習和應用技術(shù)將是人工智能2.0取得突破的關(guān)鍵所在。近日，潘云鶴在接受《中國科學(xué)報》專(zhuān)訪(fǎng)時(shí)，詳細闡述了視覺(jué)知識發(fā)展面臨的5個(gè)基本問(wèn)題。

“認知心理學(xué)早已指出，心象是人類(lèi)知識記憶的重要部分，被用來(lái)進(jìn)行形象思維。視覺(jué)知識就是計算機對心象的模擬?！迸嗽弃Q指出。

潘云鶴認為，視覺(jué)知識表達是第一大問(wèn)題。與當今人工智能所用的知識表達方式不同，視覺(jué)知識概念具有典型與范疇結構、層次結構與動(dòng)作結構等要素。視覺(jué)概念能構成視覺(jué)命題，包括場(chǎng)景結構與動(dòng)態(tài)結構；視覺(jué)命題能構成視覺(jué)敘事，例如無(wú)聲電影就是視覺(jué)敘事的顯示形式。

不同于言語(yǔ)知識，視覺(jué)知識的特征是能表達對象的大小、色彩、紋理、空間形狀及關(guān)系；能表達對象的動(dòng)作、速度及時(shí)間關(guān)系；能進(jìn)行對象的時(shí)空變換、操作與推理等。事實(shí)上，人類(lèi)記憶中儲存的視覺(jué)知識遠多于言語(yǔ)知識。

視覺(jué)識別是第二個(gè)問(wèn)題?！皬娜斯ぶ悄茉缙陂_(kāi)始，模式識別便是最重要的研究領(lǐng)域，其中圖象和視頻識別是發(fā)展最快的方向?！迸嗽弃Q表示，近年來(lái)，深度學(xué)習提供的方法是，用大量標識的圖像訓練出深度神經(jīng)網(wǎng)絡(luò )模型用于圖像識別，顯著(zhù)提高了正確率，已獲廣泛應用。

但與深度神經(jīng)網(wǎng)絡(luò )模型方法不盡相同，人類(lèi)在工作記憶中進(jìn)行視覺(jué)識別時(shí)，不僅分析視網(wǎng)膜即時(shí)感知后傳入短期記憶中的數據，而且激活了長(cháng)期記憶中過(guò)去學(xué)到的并記住的相關(guān)心象，即視覺(jué)知識。因此，人類(lèi)在完成視覺(jué)識別任務(wù)時(shí)往往只需少量數據，而且可解釋也可推理。

潘云鶴說(shuō)，在視覺(jué)識別中，協(xié)同使用數據和視覺(jué)知識，形成數據驅動(dòng)和視覺(jué)知識指導的協(xié)同計算范式是視覺(jué)識別的重要研究方向。

第三、四個(gè)問(wèn)題分別是視覺(jué)形象思維模擬、視覺(jué)知識學(xué)習。潘云鶴指出，視覺(jué)形象思維模擬在計算機輔助設計和仿真、計算機動(dòng)畫(huà)、游戲、兒童教育和數字媒體創(chuàng )意等領(lǐng)域應用十分廣泛，計算機圖形學(xué)已儲備很多基礎技術(shù)，但有待與人工智能打通。

“視覺(jué)知識學(xué)習則要將目標從三維（3D）形狀的重建提升到視覺(jué)知識概念和命題的重建?！迸嗽弃Q指出，這就需要對現有計算機視覺(jué)技術(shù)做進(jìn)一步研究——不僅要重建3D形狀，而且要重構3D形狀的概念結構與層次結構。在此基礎上，有望發(fā)展出視覺(jué)知識的自動(dòng)學(xué)習手段?！爱斍暗膱?chǎng)景圖研究是向視覺(jué)知識自動(dòng)學(xué)習前進(jìn)的一個(gè)合適的中間方法。當今，特別需要人工智能、計算機圖形學(xué)和計算機視覺(jué)3個(gè)領(lǐng)域的研究者聯(lián)手研究?！?/p>

多重知識表達是第五大問(wèn)題。潘云鶴認為，人腦中的知識往往通過(guò)多重表達來(lái)描述，因此，人工智能2.0的知識應有多種表達方式，包括知識的言語(yǔ)表達、深度神經(jīng)網(wǎng)絡(luò )表達、形象表達等，多重知識表達將形成跨媒體智能和大數據智能新的技術(shù)理論和模型。

“視覺(jué)知識和多重知識表達的研究是發(fā)展新的視覺(jué)智能的關(guān)鍵，也是促進(jìn)人工智能2.0取得重要突破的關(guān)鍵理論與技術(shù)?！迸嗽弃Q表示，視覺(jué)知識的獨特優(yōu)點(diǎn)是具有形象的綜合生成能力、時(shí)空演化能力和形象顯示能力。人工智能與計算機視覺(jué)、計算機輔助設計、計算機圖形學(xué)技術(shù)聯(lián)合，將為人工智能在創(chuàng )造、預測和人機融合等方面的新發(fā)展提供重要的新基礎、新動(dòng)力。

“視覺(jué)知識是一塊寒濕而肥沃的人工智能的‘北大荒’，也是一塊充滿(mǎn)希望、值得多學(xué)科合作勇探的‘無(wú)人區’?！迸嗽弃Q呼吁道。

《中國科學(xué)報》 (2021-06-08 第1版要聞)

關(guān)注【深圳科普】微信公眾號，在對話(huà)框：
回復【最新活動(dòng)】，了解近期科普活動(dòng)
回復【科普行】，了解最新深圳科普行活動(dòng)
回復【研學(xué)營(yíng)】，了解最新科普研學(xué)營(yíng)
回復【科普課堂】，了解最新科普課堂
回復【科普書(shū)籍】，了解最新科普書(shū)籍
回復【團體定制】，了解最新團體定制活動(dòng)
回復【科普基地】，了解深圳科普基地詳情
回復【觀(guān)鳥(niǎo)知識】，學(xué)習觀(guān)鳥(niǎo)相關(guān)科普知識
回復【博物學(xué)院】，了解更多博物學(xué)院活動(dòng)詳情

近期活動(dòng)

探索大灣區科普世界：880家場(chǎng)館地圖免費領(lǐng)取，開(kāi)啟知識之旅

2024-07-16 00:00 開(kāi)始

密碼破譯王：從摩斯密碼到AI大腦——人工智能系列先導課

2025-05-23 00:00 開(kāi)始

深圳市福田區深南大道4005號

夏令營(yíng)研學(xué)專(zhuān)列 | 14天跨越4省5城5000公里，穿越中國上下五千年！

2025-07-15 00:00 開(kāi)始

關(guān)注我們

加入科普活動(dòng)群

參加最新科普活動(dòng)
認識科普小朋友
成為科學(xué)小記者

深i科普

掃描關(guān)注深i科普公眾號

推薦文章

2025龍華區科協(xié)委員進(jìn)校園第九場(chǎng)走進(jìn)龍華區鷺湖外國語(yǔ)小學(xué)——彭國慶《揭秘醫療器械》

“科普課堂”進(jìn)黨群服務(wù)中心活動(dòng)在深圳市黨群服務(wù)中心啟幕

2025龍華區科協(xié)委員進(jìn)校園第八場(chǎng)走進(jìn)龍華區書(shū)香小學(xué)——彭國慶《揭開(kāi)醫療器械的神秘面紗》

2025龍華區科協(xié)委員進(jìn)校園第七場(chǎng)走進(jìn)龍華區行知實(shí)驗小學(xué)——錢(qián)超博士《電池的歷史》

2025龍華區科協(xié)委員進(jìn)校園第6場(chǎng)活動(dòng)走進(jìn)龍華區龍為小學(xué)——赫家燁《微觀(guān)世界-我們身邊的宇宙》

上一篇：圖片新聞-

下一篇：被指論文有錯，86歲的他這樣做 ——孫昌璞憶彭桓武二三事-

色依依国内精品中文字幕|国产精品嫩草影院免费观看|亚洲ⅤA制服丝袜一区二区|久久精品无码一级毛片温泉|无码专区亚洲综合另类