在過(guò)去的十年左右的時(shí)間里,機器學(xué)習的進(jìn)步推動(dòng)了自動(dòng)駕駛系統,虛擬助手和移動(dòng)機器人等系統的發(fā)展,這些系統越來(lái)越具有自主性。除其他事項外,開(kāi)發(fā)自主系統的研究人員需要找出方法來(lái)集成旨在解決不同但又互補的子任務(wù)的組件。

例如,在人類(lèi)用戶(hù)家中完成手動(dòng)任務(wù)的機器人應該能夠感知其環(huán)境中的對象,同時(shí)還可以獲取有關(guān)這些對象的信息,這些信息隨后可用于計劃其動(dòng)作和動(dòng)作。這個(gè)過(guò)程也被稱(chēng)為“感知-認知-行動(dòng)”范例,具有至關(guān)重要的意義,因為它最終使機器人能夠提出有用的策略并有效地完成任務(wù)。
到目前為止,大多數在機器人中實(shí)現這種感知-認知-行動(dòng)范例的方法都將這三個(gè)任務(wù)視為幾乎完全獨立的模塊,彼此之間互為黑匣子。但是,不來(lái)梅大學(xué)和德國慕尼黑大學(xué)的一組研究人員認為,將機器人的“感知”系統與其認知(即“推理”或檢索周?chē)h(huán)境中物體信息的能力)聯(lián)系起來(lái)可以大大改善其整體性能。

考慮到這一點(diǎn),研究人員最近開(kāi)發(fā)了一種認知感知系統,可以增強移動(dòng)機器人在日常操縱任務(wù)中的性能。這個(gè)被稱(chēng)為ROBOSHERLOCK的系統通過(guò)內容分析(CA)獲得感知,該策略需要使用統計方法來(lái)分析大量數據。
ROBOSHERLOCK分析的數據是“非結構化”的,因為其結構不能像在數據庫或電子表格中那樣反映與之關(guān)聯(lián)的語(yǔ)義。因此,該系統使用一種稱(chēng)為非結構化信息管理(UIM)的策略,這實(shí)質(zhì)上意味著(zhù)它可以使用一組信息提取算法來(lái)處理大量非結構化數據(例如,文本文檔,音頻文件,圖像等)。這些算法中的每一種都根據其“專(zhuān)業(yè)知識”提取不同類(lèi)型的知識,隨后對其進(jìn)行評級和組合以得出一個(gè)一致的決策。
研究人員在論文中寫(xiě)道:“在ROBOSHERLOCK中,對現實(shí)場(chǎng)景的感知和解釋被制定為非結構化信息管理(UIM)問(wèn)題。” “ UIM原理的應用支持感知系統的實(shí)施,該感知系統可以回答與場(chǎng)景中對象有關(guān)的任務(wù)相關(guān)查詢(xún),通過(guò)結合多種感知算法的優(yōu)勢來(lái)提高對象識別性能,支持基于知識的對象推理,并實(shí)現自動(dòng)和知識驅動(dòng)的處理管道生成。”

研究人員通過(guò)一系列測試評估了他們的框架,并將其應用于現實(shí)世界場(chǎng)景感知的不同系統。他們發(fā)現,“推理”有關(guān)(即處理)通過(guò)其算法檢索到的背景知識可以使ROBOSHERLOCK回答各種各樣的問(wèn)題,而在周?chē)h(huán)境中則是可以直接感知到的。
研究人員在最近的研究中介紹的ROBOSHERLOCK組件可被視為其核心功能。隨后,研究人員還開(kāi)發(fā)了一些擴展,以增強系統的認知能力。例如,他們創(chuàng )建了一個(gè)擴展,該擴展允許系統同時(shí)檢測人類(lèi)和物體,從而推斷人類(lèi)正在執行的動(dòng)作以及這些動(dòng)作的意圖。
研究人員在論文中寫(xiě)道:“最近,我們已經(jīng)研究了ROBOSHERLOCK框架如何使代理能夠'夢(mèng)想',并使用最先進(jìn)的游戲引擎生成任務(wù)的變體并學(xué)習新的感知模型。” “所有這些擴展都是從機器人執行任務(wù)的角度著(zhù)眼于機器人感知,如果沒(méi)有此處介紹的核心框架,這是不可能的。”
