

孟慶虎,香港中文大學(xué)電子工程系教授;峰會(huì)主旨報(bào)告《真的要機(jī)器換人嗎?》。

各位尊敬的院士,專家,和機(jī)器人圈的朋友。今天特別感興機(jī)器人峰會(huì)主委會(huì)讓我有機(jī)會(huì)把我工作和科研的工作跟大家稍微分享一下。
我今天講的題目是《真的要機(jī)器換人嗎?》。這里有兩想法,一個(gè)是機(jī)器人換人是20年以前的概念,那么現(xiàn)在的機(jī)器人發(fā)展到今天這一步的時(shí)候,機(jī)器人換人這個(gè)事是不是在每個(gè)場(chǎng)合都合適,第二現(xiàn)在真的可以機(jī)器人換人嗎?機(jī)器人能夠替代人嗎?我們從這個(gè)角度跟大家分享一下。
我們機(jī)器人歷史也不長(zhǎng),機(jī)器人這個(gè)詞是1920年出來(lái)的。你這個(gè)ROB這個(gè)詞在1920年是沒(méi)有的。機(jī)器人學(xué)是科幻小說(shuō)1941年提出來(lái)的所以歷史很短暫,1941年查這個(gè)文獻(xiàn)是沒(méi)有的。
我們看看研究的成果,有一種比較快的方法看,就是從數(shù)據(jù)庫(kù)里面看,我們把傳統(tǒng)機(jī)器人和機(jī)器人學(xué),圖象處理、自動(dòng)化、信息、能源做一個(gè)比較,1985年之前,這個(gè)數(shù)據(jù)庫(kù)搜集是這樣的,就是機(jī)器人非常的少,傳統(tǒng)的行業(yè),像能源、控制系統(tǒng)工程文章特別多。后面的十年,增長(zhǎng)相當(dāng)?shù)目?,大家看到這個(gè)機(jī)器人增長(zhǎng)相對(duì)快,但是1995年到2004年是這樣的增長(zhǎng)。如果用倍數(shù)來(lái)看,機(jī)器人增長(zhǎng)是倍數(shù)最多。我們?cè)跈C(jī)器人本身這個(gè)行業(yè)里比的話,我們協(xié)作機(jī)器人、仿真機(jī)器人,機(jī)器人感知,微小型機(jī)器人、還有工業(yè)機(jī)器人、服務(wù)機(jī)器人,19 85年之前沒(méi)有這方面的文章。從1985年到1994年大家有關(guān)注,包括人性機(jī)器人,協(xié)作機(jī)器人有了,突破了0。1995年到2004年的增長(zhǎng),可以看到這個(gè)仿真機(jī)器人進(jìn)展還是非常快的。但是還不行。截止到2015年人機(jī)合作文章還是比較少。只有500多篇,仿真機(jī)器人多一點(diǎn)。原來(lái)是0,所以是放大倍數(shù)是無(wú)窮大,所以人機(jī)合作有很大的余地。真的想要機(jī)器人融入我們的生活,我們要克服的就是讓機(jī)器人和人能夠共同的生存,共同的工作。那么,機(jī)器人換人一個(gè)先決條件就是說(shuō)機(jī)器人要能夠跟人共同生存。所以說(shuō),從這樣一個(gè)角度,我們覺(jué)得應(yīng)該稍微看一下機(jī)器人的發(fā)展史。
1960年的時(shí)候,第一次用機(jī)器人上了雞尾酒,所以這兩個(gè)人結(jié)緣。還有1961年第一臺(tái)機(jī)器人賣(mài)JM。當(dāng)時(shí)是處理鍛造艦的運(yùn)輸。當(dāng)時(shí)并不是做裝配的事。歷史上還有一件非常重要的事情就是1968年,在斯坦福研究了機(jī)器人控制的機(jī)械臂,這個(gè)機(jī)械臂后來(lái)變成了斯坦福R,這成為第一個(gè)真正計(jì)算機(jī)控制的機(jī)械臂,這個(gè)計(jì)算機(jī)控制的機(jī)械臂,工業(yè)機(jī)器人,那么真正到了市場(chǎng),就是到1978年的事,所以這個(gè)成為了第一個(gè)利用自由度,完全計(jì)算機(jī)控制的機(jī)器人。所以這個(gè)歷史非常的短暫。但是,我們看傳統(tǒng)的工業(yè)裝配機(jī)器人有一些特點(diǎn),第一個(gè)就是它運(yùn)行速度非常的高,第二個(gè)就是說(shuō)它的運(yùn)行精度非常的高。因?yàn)樗麄兪遣痪邆淙魏蔚?a href="http://m.wnmc.org.cn/sell/search.php?keyword=%E6%99%BA%E8%83%BD" title="智能" target="_blank">智能和傳感這樣的功能的。所以說(shuō)必須要靠精確的編成完成所有的任務(wù),這個(gè)就是這樣的。也沒(méi)有協(xié)作。所以當(dāng)時(shí)的裝配線要評(píng)比起來(lái),不能讓人進(jìn)來(lái),因?yàn)闄C(jī)器人沒(méi)有智力,也不知道有沒(méi)有人這樣的事情。這樣的裝配線現(xiàn)在逐漸被人機(jī)協(xié)調(diào)的裝配線替代掉,這個(gè)是寶馬最新的生產(chǎn)線,可以看到,現(xiàn)在的概念是讓人做人最擅長(zhǎng)的事,讓機(jī)器人做機(jī)器人最擅長(zhǎng)的事。大家發(fā)揮優(yōu)勢(shì),能夠讓效率提高得非常好。而且在一些非常笨重,人做起來(lái)費(fèi)勁,不愿意做,非常困難的事讓機(jī)器人做,相對(duì)容易的事,而且用機(jī)器人來(lái)做相對(duì)困難的事,這個(gè)時(shí)候我們用人來(lái)做。所以說(shuō),人和機(jī)器人的協(xié)調(diào),真正的開(kāi)始從工業(yè)進(jìn)入。要讓這樣機(jī)器人和人一塊合作首先有一個(gè)非常重要的條件,那就是說(shuō)機(jī)器人必須知道人的存在,這樣的工作讓人知道非常簡(jiǎn)單,靈巧,而且不用太消耗太多的體力就可以完成。但是,你要用機(jī)器人來(lái)做,這樣的事相對(duì)來(lái)說(shuō)效率非常的低。這就是目前的一種趨勢(shì)。那么,這個(gè)要求就是我剛才要說(shuō)的,一定要讓機(jī)器人有一定的智能,和人打交道的能力,這樣可以讓機(jī)器人進(jìn)入這個(gè)環(huán)境。
就是說(shuō)我們現(xiàn)在從機(jī)械方面來(lái)說(shuō),除了裝配線上機(jī)器人,這里就是說(shuō)想替代單位的工人。這個(gè)就是一個(gè)小的工房,小型的企業(yè),如果有個(gè)別崗位需要有一個(gè)比較能夠替代人的工作,希望用這樣的機(jī)器人,這樣的機(jī)器人跟的傳統(tǒng)的機(jī)器人有一個(gè)區(qū)別,就是它速度不是特別高,精度不是特別高。但是,有很高的智能,有很多傳感信息。所以說(shuō),能夠知道怎么樣,知道怎么跟人合作,不會(huì)傷到人,可以看到人做什么,學(xué)習(xí)起來(lái)非常容易,手把手教他就可以自動(dòng)的編程,而且這樣的機(jī)器人成本不是特別,特別適合中小企業(yè),或者單工位替工,但是這樣的機(jī)器人是不是真的能夠換人呢?我們看一個(gè)簡(jiǎn)單的視頻,
這個(gè)事讓人做相對(duì)容易多了,但是我們用單工位機(jī)器人做起來(lái)還是非常費(fèi)勁的。如果要讓他來(lái)疊衣服的話還沒(méi)有準(zhǔn)備好。我們也是做了很多非常先進(jìn),酷的機(jī)器人,包括仿人的,說(shuō)老實(shí)話,在從硬件設(shè)備商來(lái)說(shuō),已經(jīng)達(dá)到了登峰造極的水平了,就是人類對(duì)于用一個(gè)鋼鐵模仿柔體的生物獲得了一定的程度,即便這樣的技術(shù)上非常高,然后為什么我們做一些有時(shí)候看起來(lái)非常簡(jiǎn)單的事情,反而還是不了呢?這個(gè)時(shí)候我們就是需要給他做一些改進(jìn)。比如我們看這個(gè)的話,這個(gè)是我們中國(guó)的香港大學(xué)李一兵機(jī)械狗。
從硬件上要做這樣一個(gè)狗,當(dāng)時(shí)李一兵他們團(tuán)隊(duì)沒(méi)花太多的時(shí)間和金錢(qián)做出來(lái),而且得到了非常高的贊揚(yáng)。就是說(shuō)硬件上面我們要想做一件事情,實(shí)際上并不是那么難,但是為什么當(dāng)你要執(zhí)行一個(gè)任務(wù)的時(shí)候就會(huì)變成這樣難呢?我們?cè)倏纯催@個(gè)去年的DAPRPA。這個(gè)代表了現(xiàn)在最高的水平,當(dāng)他們完全單相指標(biāo)的時(shí)候都是非常的精彩,當(dāng)讓他們完成人類非常簡(jiǎn)單可以做到的任務(wù)的時(shí)候反而他們做不到。從這些例子里面我們可以吸取什么經(jīng)驗(yàn)教訓(xùn),可以看到什么問(wèn)題,引發(fā)我們什么思考,我們做機(jī)器人研究的時(shí)候,技術(shù)研究的時(shí)候,我們應(yīng)該注重哪些方面呢?所以這些事情我們就想引出我們下面的一些話題。
首先我們來(lái)比較一下,人和機(jī)器人。我們從幾個(gè)方面比較一下的話。如果我們說(shuō)它移動(dòng)性能,我們說(shuō)機(jī)器人的移動(dòng)性能的確可以做到跟人差不多。有時(shí)候比人強(qiáng)。所以再看靈活性,人絕對(duì)沒(méi)有問(wèn)題的,機(jī)器人現(xiàn)在還不是那么完美。盡管我們有柔性關(guān)節(jié)等等,但是我們機(jī)器人主要還是鋼鐵,鋼鐵機(jī)器人的時(shí)候,跟我們?nèi)嵝赃€是有嚴(yán)重的區(qū)別的,那么操作性,大家都是差不多的。有的時(shí)候機(jī)器人可以更精確,可以更快,傳感能力呢?也應(yīng)該是差不多。而且機(jī)器人有時(shí)候會(huì)比我們傳感能力更強(qiáng)。但是智能方面機(jī)器人差得比較多。這樣一比,我們發(fā)現(xiàn)兩個(gè)地方,一個(gè)是靈活性,一個(gè)是智能。這里面是分別是硬件和軟件的問(wèn)題。大家都有努力。這個(gè)實(shí)驗(yàn)室的教授就是在做。里面是用這種驅(qū)動(dòng),仿人的肌肉,韌帶驅(qū)動(dòng)來(lái)做的,這個(gè)說(shuō)老實(shí)話有很長(zhǎng)的路要走。那么,這個(gè)我們先說(shuō)和人打交道,首先要知道人智能怎么樣。我們有視覺(jué)系統(tǒng),90%的信息是視覺(jué)來(lái)的,還有嗅覺(jué),聽(tīng)覺(jué)。我們還有一個(gè)觸覺(jué),這個(gè)不僅裝在手腕上,遍布我們所有的皮膚,這些角度來(lái)說(shuō),人類盡管裝配傳感器不是那么多,但是這些傳感器非常有效的發(fā)揮作用。我們?nèi)四X的能力超出異常,我們每秒鐘可以處理1萬(wàn)億比特的信息。我們大腦每一秒鐘可以搜集4千億比特信息,大家覺(jué)得可能這個(gè)數(shù)據(jù)不靠譜,我們大腦每一秒搜集4千億比特,但是原因我們可能只對(duì)其中兩千條關(guān)注,其中七條有記憶。你搜集到的信息只有7條有記憶。最快只能對(duì)其中一條做出反映,比如我現(xiàn)在問(wèn)大家,大廳里面有多少個(gè)出口,大家說(shuō)不知道。但是你回頭一看,這個(gè)信息一直在那。但是我們沒(méi)有關(guān)注它,我們只關(guān)注其中有用的最多7條。這個(gè)我們是怎么關(guān)注的?我們?nèi)擞洃浻羞x擇性的。就是說(shuō)因?yàn)槲覀冇羞x擇性,根據(jù)我們的知識(shí),根據(jù)我們的情節(jié),根據(jù)我們做出判斷,這個(gè)我們根據(jù)我們經(jīng)驗(yàn)就會(huì)說(shuō)圓或方。我們有時(shí)候給你不相干的東西,讓你看的時(shí)候你不知所措,不知道往哪看,當(dāng)我問(wèn)你這個(gè)圖片里這個(gè)人腰帶的顏色是什么的時(shí)候,再打開(kāi)的時(shí)候,大家第一個(gè)關(guān)注的點(diǎn)就是它的皮帶,這就是人的視覺(jué),和人的大腦對(duì)于信息能夠進(jìn)行分割處理,實(shí)際上是交集的方式,不至于我們大腦累死。所以用機(jī)器人,人工智能做信息處理的時(shí)候,我們往往沒(méi)有這樣的能力,比如說(shuō),有TOP DOWN的功能,比如我兒子看到這個(gè)蒼蠅的時(shí)候,第一次,他不知道什么事。但是他見(jiàn)過(guò)蜜蜂,他就說(shuō)這是一個(gè)蜜蜂,你告訴他這不是蜜蜂,是蒼蠅,他就更新他的記憶,他下一次看到蒼蠅的的時(shí)候就說(shuō)是蒼蠅不是說(shuō)蜜蜂。這是人保護(hù)自己的一個(gè)判斷。還有BOTTOM UP,這獲取高級(jí)知識(shí)的方式,我們這個(gè)可以根據(jù)經(jīng)驗(yàn)說(shuō)是圓還是方。然后這個(gè)圖形我們根據(jù)人經(jīng)驗(yàn)是人在騎馬,這樣圖象,大家有時(shí)候也能夠判斷出來(lái)要么一個(gè)狗在走。根據(jù)我們經(jīng)驗(yàn),根據(jù)我們判斷,這樣的圖象我們都能處理,但是作為機(jī)器人就是處理不了。人和機(jī)器人有好多的互補(bǔ)性。人我們好處的就是90%的信息是眼睛獲取的,我們傳達(dá),表達(dá)出來(lái)的信息90%通過(guò)語(yǔ)言來(lái)表達(dá)的。所以說(shuō)我們語(yǔ)音方面做得相當(dāng)不錯(cuò)的。但是圖象識(shí)別方面還是做得很差。這是一個(gè)小女孩,看到一個(gè)照片以后可以解釋出來(lái)這里邊是什么現(xiàn)象。
這個(gè)是斯坦福大學(xué)人工智能的一個(gè)教授。
大家可以看到跟一個(gè)3歲小孩比還有很大的差距。那么就是和這樣的思路和想法,我舉個(gè)我們科研的例子。
第一個(gè)就是說(shuō)大家做這個(gè)我們叫ACTIVE,這個(gè)就是我們用攝像機(jī)看的東西都是被動(dòng)的,靜態(tài)的。我們捕捉的東西一個(gè)要觀測(cè)物和被觀測(cè)物他們之間的關(guān)系,我們往往建立這樣的東西,這個(gè)東西建立好以后什么東西都好做了,如果只是一個(gè)攝象頭,就能夠感知環(huán)境,感知你要操作的對(duì)象,但是放在移動(dòng)平臺(tái)上就是被動(dòng)的,因?yàn)槟愀淖兞藬z象頭的狀態(tài)。不斷改變觀測(cè)的角度和位置,而且能夠把被觀測(cè)對(duì)象同時(shí)改變,達(dá)到更好的效果。這是第一個(gè),我們小的例子。
第二個(gè)講的例子,我們開(kāi)發(fā)的一個(gè)非常簡(jiǎn)單OFFICE ROB,這個(gè)一起人就是成本很低,就三千塊錢(qián),可以自平衡,可以升降,這個(gè)OFFICE ROB就是能夠自己上電梯,還能夠到達(dá)他想去的樓層,同時(shí)能夠進(jìn)出自如。所以要具備一些目標(biāo)和人辨識(shí)的功能,同時(shí)對(duì)這個(gè)按紐和樓梯的顯示這個(gè)功能。
最后一個(gè)就功能是里面有人,他按不到按紐,他需要用簡(jiǎn)單的語(yǔ)音交流。就是幫我按一下三樓的電梯按鍵,如果他出不去,人多的時(shí)候,他會(huì)說(shuō)去借過(guò)讓我出去。我們就是用非常簡(jiǎn)單限定環(huán)境和限定任務(wù)的事情來(lái)驗(yàn)證機(jī)器人的智能,如果我們把它限制在一個(gè)特定的范圍里以后我們可以做得非常好了。所以說(shuō)這個(gè)就是來(lái)驗(yàn)證這樣一個(gè)觀點(diǎn)。那么因?yàn)闀r(shí)間的關(guān)系我不再把它繼續(xù)講下去了。
這些東西我們要把它造得便宜,我們就是要把這些好多處理的能力,分類的能力,和智能決策能力反到云端,因?yàn)檫B接到網(wǎng)絡(luò)是非常簡(jiǎn)單的事情,我們?cè)诰W(wǎng)絡(luò)上可以把最先進(jìn)的,和最聰明的算法放在這個(gè)地方,所有的加起來(lái)就可以給我們提供完美的任務(wù),那么其中,今天我想強(qiáng)調(diào)一點(diǎn)就是說(shuō)我們?cè)谧鯧N的時(shí)候,硬件的東西會(huì)逐漸變成生產(chǎn)能力特別強(qiáng)企業(yè)在做。一些小型的東西,打印機(jī)可以打的除外?;旧洗蠹胰绻亲鲂∨康挠布脑?,以后大家不會(huì)有太多的市場(chǎng)。大量的市場(chǎng)在什么地方?就是感知、人工智能、視覺(jué)智能等等。然后大量就是軟件的事情,就是在云端的決策和專家系統(tǒng)等等,大數(shù)據(jù)。還有一個(gè)東西對(duì)我們非常有幫助的就是物聯(lián)網(wǎng)。將來(lái)物聯(lián)網(wǎng)真的是到處都是的話,機(jī)器人辨識(shí)東西的能力就會(huì)大幅度提高,我們不需要費(fèi)勁去認(rèn)這是一個(gè)什么東西。這個(gè)物聯(lián)網(wǎng)會(huì)告訴我們所有的事情來(lái)簡(jiǎn)化我們計(jì)算機(jī)操作,到了那個(gè)時(shí)候機(jī)器人變成了社會(huì)的一部分,這個(gè)時(shí)代就真正到來(lái)了。今天簡(jiǎn)單跟大家匯報(bào)就這么多。謝謝。

