你是否還記得,兒童時代是如何學會認路的?比如說去朋友家里,或者是去學校上學?可能你并沒有地圖作參考,但是只需要記住街道外觀,就可以沿著道路和轉彎到達,這個過程你可能會迷路,但最終可以通過路標走到正確位置。那么你有沒有想過,AI能否也像人類或動物那樣,不通過地圖就學會導航呢?
谷歌最新研究顯示,AI可以在不訪問環境地圖情況下,在外觀多樣化的環境中進行導航。在這項研究中,技術人員使用了來自谷歌街景的第一人稱視角照片,將AI變成了真正的城市人——它可以利用視覺信息,來學習如何在多個城市中進行導航(需強調的是,研究是關于廣義導航而非駕駛的;并未使用交通信息,也沒有嘗試制作車輛模型)。
AI不借助地圖和GPS也能導航
據DeepMind科學家Piotr Mirowski表示,“解決導航任務時需要回答兩個問題,你在哪兒?以及如何到想去的地方?這可以是沒有智能手機的孩子在某地區行走,小鳥學習飛回巢穴,或是機器人等等情形。因此該研究要從現實生活獲取靈感。”
與傳統方法(依賴于顯式映射和探索)不同,谷歌嘗試了學習人類過去常使用的那種方法進行導航(沒有地圖、GPS定位或其它輔助手段,只使用視覺觀察),通過記住周邊環境,以及試錯來完成導航記憶的構建。谷歌創建了一個神經網絡代理(agent),能輸入從環境中觀察到的圖像,并預測在該環境中它該采取的下一步行動,研究中主要通過深度學習來進行端到端訓練,并利用了城市規模的真實世界數據,包括復雜的十字路口、人行道、隧道,以及橫跨倫敦、巴黎和紐約的各種拓撲結構等。
可轉移到新城市的模塊化神經網絡架構
該人工代理的神經網絡由三部分構成:能夠處理圖像并提取視覺特征的卷積網絡、特定于地區的循環神經網絡,蘊含著記憶環境以及學習“這里”(當前位置)和“那里”(目標位置)表征的任務、以及制定代理行動導航規則的,不因地區改變的循環網絡。
其中,特定于地區的模塊被設計成可互換的,而且該模塊對代理(agent)導航的城市來說是獨一無二的,但視覺模塊和策略模塊可以不因地區改變。舉例來講,上圖a為城市導航架構示例,b為多城市導航架構(每個城市都有其特定區域路徑)示例,c則為代理(agent)調整到新城市時的訓練和遷移過程。
簡單來說,就像人類一樣,當代理(agent)訪問新城市時,它必須學習一套新的路標,但不需要重新學習視覺表征或行為(比如沿著道路向前,十字路轉彎等)。因此通過多城市架構,可以現在一系列城市中進行訓練,然后凍結策略網絡和視覺卷積網絡,只保留用于新城市的新特定區域路徑。總的來說,這種方法能讓代理(agent)學會新知識,而且不會忘記已學過知識,就像人類到了新城市(地區)要通過記住各類建筑和環境方便出行,卻又不會忘記以前曾待過的城市(或區域)那樣。
寫在最后
谷歌團隊認為,“研究導航是研究和發展AI的基礎,嘗試在人工代理(agent)中復制導航也能幫助科學家了解其生物學基礎。” 雖然該技術在現實的應用目前尚未就緒,但未來或可用于自動駕駛(無人機或其它智能設備)在沒有可靠地圖數據區域的導航。