

想讓機器人“聽懂人話”,需要必備哪些技能?【AI大咖說】第八期,走進優(yōu)必選自然語言處理技術(shù)!
“我們把香蕉給猴子,因為它們餓了?!?/strong>
“我們把香蕉給猴子,因為它們熟透了?!?/strong>
這兩句話,你讀得懂是什么意思嗎?然而對機器人來說,就沒那么簡單了。如果AI不能清晰了解猴子和香蕉的屬性,就會導(dǎo)致無法區(qū)分。正如語音識別幫助機器人“聽”,視覺技術(shù)幫助機器人“看”,想要做到機器人“聽懂人話”,就需要自然語言處理(Natural Language Processing,NLP)來解決。一起來看看機器人是如何“善解人意”的:
AI因斯坦·琨帶你走進機器人的NLP運用▲
機器人語音交互技術(shù)概述
語音交互是機器人最重要的交互入口之一,機器人對于人類語義的理解尤為關(guān)鍵。如下圖所示,人類語音通過ASR(語音識別)把音頻變成文本,文本經(jīng)過NLU(語義理解)、DM(對話管理)以及NLG(語言生成),語言生成后再通過TTS(語音合成),完成人機對話。
NLP概述與發(fā)展
自然語言是人類智慧的結(jié)晶,機器人對語義的理解和分析能力、對自然語言的生成能力、對知識的學(xué)習(xí)能力,是AI最核心且最具挑戰(zhàn)的技術(shù)之一。我們先來看一下NLP發(fā)展的幾個階段:
· 第一階段:2000年之前,主要基于規(guī)則和概率統(tǒng)計的方法,50年代提出圖靈測試概念來判斷機器是否會思考,然而到目前為止,還沒有出現(xiàn)被一致認可的通過圖靈測試的對話系統(tǒng)。
· 第二階段:2013年,神經(jīng)網(wǎng)絡(luò)興起,極大提升NLP的各項能力。
· 第三階段:基于seq2seq模型的NLP和注意力機制,文本生成和機器翻譯方面獲得較大進展。
· 第四階段:2018年以來,大型預(yù)訓(xùn)練模型發(fā)展,NLP領(lǐng)域突破捷報頻頻,也就是現(xiàn)在所處的階段。
NLP技術(shù)則分為核心應(yīng)用和基礎(chǔ)技術(shù)。它的應(yīng)用非常廣泛,包括情感、信息、問答、機器翻譯、自動文摘、閱讀理解以及文本分類等。
自然語言處理技術(shù)的核心應(yīng)用
基礎(chǔ)技術(shù)包括自動分詞、詞性標(biāo)注、命名實體識別以及句法分析。
· 自動分詞
中文分詞是自然語言處理領(lǐng)域基礎(chǔ)的模塊,由此前的基于規(guī)則和基于概率統(tǒng)計,發(fā)展到今天的基于深度學(xué)習(xí)。比如“武漢市長|江大橋”還是“武漢市|長江大橋”的劃分,就是通過統(tǒng)計模型把詞分配好。
悟空機器人分詞斷句后,理解并執(zhí)行任務(wù)
· 詞性標(biāo)注
在中文分詞之后,預(yù)測每個詞的漢語詞性也是中文自然語言處理的基礎(chǔ)模塊。通常詞性標(biāo)注的粒度很細,如動詞、副動詞、趨向動詞、不及物動詞等。
詞性分析決定句子用哪一個“de”
· 命名實體識別
識別文本中具有特定意義的實體,包括人名、地名、機構(gòu)名、專有名詞等,以及時間、數(shù)量、貨幣、比例數(shù)值等文字。
命名實體識別是一個從句中挑出實體類型的過程
· 句法分析
用于確定句子的語法結(jié)構(gòu)或詞匯之間的依存關(guān)系(主謂賓、定狀補等句法關(guān)系),包括句法結(jié)構(gòu)分析、依存關(guān)系分析。


