华为天才少年谢凌曦:关于视觉识别领域发展的个人观点
華為天才少年謝凌曦:關(guān)于視覺識別領(lǐng)域發(fā)展的個人觀點
作者 :謝凌曦
編輯:桃子
【新智元導(dǎo)讀】計算機視覺識別領(lǐng)域的發(fā)展如何 ?華為天才少年謝凌曦分享了萬字長文,闡述了個人對其的看法。
最近 ,我參加了幾個高強度的學(xué)術(shù)活動,包括CCF計算機視覺專委會的閉門研討會和VALSE線下大會 。經(jīng)過與其他學(xué)者的交流 ,我產(chǎn)生了許多想法 ,千頭萬緒,便希望把它們整理下來,供自己和同行們參考。當(dāng)然,受限于個人的水平和研究范圍 ,文章中一定會存在許多不準(zhǔn)確甚至錯誤的地方 ,當(dāng)然也不可能覆蓋所有重要的研究方向。我期待與有興趣的學(xué)者們進行交流 ,以充實這些觀點,更好地探討未來發(fā)展方向 。
在這篇文章中,我將會著重分析計算機視覺領(lǐng)域,特別是視覺感知(即識別)方向所面臨的困難和潛在的研究方向。
相較于針對具體算法的細(xì)節(jié)改進,我更希望探討當(dāng)前算法(尤其是基于深度學(xué)習(xí)的預(yù)訓(xùn)練+微調(diào)范式)的局限性和瓶頸,并且由此得出初步的發(fā)展性結(jié)論,包括哪些問題是重要的、哪些問題是不重要的 、哪些方向值得推進、哪些方向的性價比較低等。
在開始之前 ,我先畫出如下思維導(dǎo)圖。為了尋找合適的切入點 ,我將從計算機視覺和自然語言處理(人工智能中兩個最受關(guān)注的研究方向)的區(qū)別開始談起,引出圖像信號的三個根本性質(zhì):信息稀疏性、域間差異性、無限粒度性 ,并將它們與幾個重要的研究方向相對應(yīng)。這樣 ,我們就能更好地了解每個研究方向所處的狀態(tài) :它已經(jīng)解決了哪些問題、還有哪些重要的問題沒有解決