本發(fā)明涉及語音識別技術(shù)領(lǐng)域,特別是涉及一種語音識別方法、裝置及電子設(shè)備。
背景技術(shù):
目前,很多智能設(shè)備具有語音識別功能。通常語音識別的功能可以通過以下2種方式來實(shí)現(xiàn):
一種是:由智能設(shè)備接收語音指令信息,并對語音指令信息進(jìn)行識別,獲得識別出的指令信息,針對識別出的指令信息進(jìn)行響應(yīng)。
另一種是:由智能設(shè)備接收語音指令信息,并將該語音執(zhí)行信息發(fā)送至云端服務(wù)器,由云端服務(wù)器對語音指令信息進(jìn)行識別,獲得識別出的指令信息,針對識別出的指令信息進(jìn)行響應(yīng),將響應(yīng)信息返回給智能設(shè)備。
現(xiàn)實(shí)生活中,用戶在說出語音指令信息的時(shí)候,經(jīng)常會(huì)由于猶豫不決而說話不連貫。例如,用戶在想聽音樂但不一時(shí)想不起具體的歌曲時(shí),經(jīng)常會(huì)說出類似于“我想聽…那個(gè)…嗯…忘情水”的話。
這種情況下,不論是上述那種語音識別的方式都會(huì)出錯(cuò)。這是因?yàn)?,現(xiàn)有技術(shù)通常只對連續(xù)的語音進(jìn)行識別,中間出現(xiàn)停頓,就會(huì)認(rèn)為該句話已經(jīng)說完,就進(jìn)行語音識別。如上述情況,只會(huì)識別出“我想聽”,后面的話都被忽略掉了。這樣,智能設(shè)備會(huì)輸出“語音指令錯(cuò)誤,請重新輸入”或“對不起,沒聽懂”等類似的報(bào)錯(cuò)提示。
也就是說,由于不連貫語音中靜音片段的存在,現(xiàn)有的語音識別方法在識別此類不連貫的語音時(shí),通常會(huì)出導(dǎo)致識別出的語意不完整,影響語音識別效果。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種語音識別方法、裝置及電子設(shè)備,以提高不連貫語音的語音識別效果。
為達(dá)到上述目的,本發(fā)明實(shí)施例提供了一種語音識別方法,應(yīng)用于電子設(shè)備,所述方法包括:
獲得待識別語音信息;
對所述待識別語音信息進(jìn)行識別,獲得該待識別語音信息對應(yīng)的當(dāng)前語音識別信息;
判斷是否存在已保存的待拼接語音識別信息;
如果存在,對所述待拼接語音識別信息和所述當(dāng)前語音識別信息進(jìn)行拼接,得到拼接后的語音識別信息;
確定所述拼接后的語音識別信息是否有完整的語義;
如果是,則將所述拼接后的語音識別信息確定為語音識別結(jié)果;
如果否,將拼接后的語音識別信息確定為待拼接語音識別信息進(jìn)行保存,并繼續(xù)執(zhí)行所述獲得待識別語音信息的步驟。
可選地,所述方法還包括:
若判斷出不存在已保存的語音識別信息,則判斷當(dāng)前語音識別信息是否有完整的語義;
如果有,則將當(dāng)前語音識別信息確定為語音識別結(jié)果;
如果沒有,則將當(dāng)前語音識別信息確定為待拼接語音識別信息進(jìn)行保存,并繼續(xù)執(zhí)行所述獲得待識別語音信息的步驟。
可選地,所述確定所述拼接后的語音識別信息是否有完整的語義的步驟,包括:
對所述拼接后的語音識別信息進(jìn)行語義解析,獲得語義解析結(jié)果;
將所述語義解析信息與預(yù)設(shè)的意圖庫中存儲(chǔ)的意圖進(jìn)行匹配,獲得用戶意圖;
從所述意圖庫中獲得所述用戶意圖對應(yīng)的響應(yīng)信息;
判斷所述響應(yīng)信息是否為不能提供服務(wù)的提示信息;
如果所述響應(yīng)信息是不能提供服務(wù)的提示信息,則確定所述拼接后的語音識別信息沒有完整的語義;
如果所述響應(yīng)信息不是不能提供服務(wù)的提示信息,則確定所述拼接后的語音識別信息有完整的語義。
可選地,所述的意圖庫為樹形結(jié)構(gòu)意圖庫;
所述對所述拼接后的語音識別信息進(jìn)行語義解析,獲得語義解析結(jié)果的步驟,包括;
按預(yù)設(shè)規(guī)則,從所述語音識別信息中提取多段特征文字,其中各段特征文字與預(yù)設(shè)的樹形結(jié)構(gòu)意圖庫中的各個(gè)級別一一對應(yīng);
所述將所述語義解析結(jié)果與預(yù)設(shè)的意圖庫中存儲(chǔ)的意圖進(jìn)行匹配,獲得用戶意圖的步驟,包括:
將第一級別對應(yīng)的特征文字確定為當(dāng)前級別的特征文字;
將所述樹形結(jié)構(gòu)意圖庫中第一級別的所有意圖確定為候選意圖;
將所述當(dāng)前級別的特征文字與所述各個(gè)候選意圖進(jìn)行匹配,獲得當(dāng)前意圖;
判斷是否所有特征文字匹配完成;
若是,則將當(dāng)前意圖確定為用戶意圖;
若否,則將下一級別對應(yīng)的特征文字確定為當(dāng)前級別的特征文字;將所述樹形結(jié)構(gòu)意圖庫中當(dāng)前意圖對應(yīng)的下一級別的所有意圖確定為候選意圖;
返回所述將所述當(dāng)前級別的特征文字與所述各個(gè)候選意圖進(jìn)行匹配,獲得當(dāng)前意圖的步驟。
可選地,在將拼接后的語音識別信息確定為待拼接語音識別信息進(jìn)行保存后,所述方法還包括:
若在第一預(yù)設(shè)時(shí)長達(dá)到時(shí),未獲得待識別語音信息,則對已保存的待拼接語音識別信息進(jìn)行語義解析,獲得語義解析結(jié)果;
向用戶輸出預(yù)設(shè)的與所述語義解析結(jié)果對應(yīng)的服務(wù)提示語音信息。
可選地,在將拼接后的語音識別信息確定為待拼接語音識別信息進(jìn)行保存后,所述方法還包括:
若在第一預(yù)設(shè)時(shí)長達(dá)到時(shí),未獲得待識別語音信息,則向用戶輸出語音識別失敗提示語音信息。
可選地,所述電子設(shè)備為智能設(shè)備;
所述獲得待識別語音信息的步驟,包括:
實(shí)時(shí)檢測語音信息;
在檢測到用戶輸入語音信息后,當(dāng)靜音時(shí)長達(dá)到第二預(yù)設(shè)時(shí)長時(shí),將用戶輸入的語音信息確定為待識別語音信息。
可選地,所述電子設(shè)備為與智能設(shè)備通信連接的云端服務(wù)器;
所述獲得待識別語音信息的步驟,包括:接收所述智能設(shè)備發(fā)送的待識別語音信息;所述智能設(shè)備發(fā)送的待識別語音信息為:所述智能設(shè)備在檢測到用戶輸入語音信息后,當(dāng)靜音時(shí)長達(dá)到第二預(yù)設(shè)時(shí)長時(shí),將用戶輸入的語音信息確定為待識別語音信息后發(fā)送至所述云端服務(wù)器的。
本發(fā)明實(shí)施例還提供了一種語音識別裝置,應(yīng)用于電子設(shè)備,所述裝置包括:
獲取模塊,用于獲得待識別語音信息;
識別模塊,用于對所述待識別語音信息進(jìn)行識別,獲得該待識別語音信息對應(yīng)的當(dāng)前語音識別信息;
第一判斷模塊,用于判斷是否存在已保存的待拼接語音識別信息;
拼接模塊,用于當(dāng)所述判斷模塊的判斷結(jié)果為存在時(shí),對所述待拼接語音識別信息和所述當(dāng)前語音識別信息進(jìn)行拼接,得到拼接后的語音識別信息;
第一確定模塊,用于確定所述拼接后的語音識別信息是否有完整的語義;
第二確定模塊,用于當(dāng)所述第一確定模塊的確定結(jié)果為是時(shí),則將所述拼接后的語音識別信息確定為語音識別結(jié)果;
第三確定模塊,用于當(dāng)所述第一確定模塊的確定結(jié)果為否時(shí),將拼接后的語音識別信息確定為待拼接語音識別信息進(jìn)行保存,并觸發(fā)所述獲取模塊。
可選地,所述裝置還包括:
第二判斷模塊,用于當(dāng)所述第一判斷模塊判斷出不存在已保存的語音識別信息時(shí),則判斷當(dāng)前語音識別信息是否有完整的語義;
第四確定模塊,用于當(dāng)所述第二判斷模塊的判斷結(jié)果為有時(shí),則將當(dāng)前語音識別信息確定為語音識別結(jié)果;
第五確定模塊,用于當(dāng)所述第二判斷模塊的判斷結(jié)果為沒有時(shí),則將當(dāng)前語音識別信息確定為待拼接語音識別信息進(jìn)行保存,并觸發(fā)所述獲取模塊。
可選地,所述第一確定模塊,包括:
解析單元,用于對所述拼接后的語音識別信息進(jìn)行語義解析,獲得語義解析結(jié)果;
匹配單元,用于將所述語義解析信息與預(yù)設(shè)的意圖庫中存儲(chǔ)的意圖進(jìn)行匹配,獲得用戶意圖;
獲取單元,用于從所述意圖庫中獲得所述用戶意圖對應(yīng)的響應(yīng)信息;
判斷單元,用于判斷所述響應(yīng)信息是否為不能提供服務(wù)的提示信息;
第一確定單元,用于當(dāng)判斷單元的判斷出所述響應(yīng)信息是不能提供服務(wù)的提示信息時(shí),則確定所述拼接后的語音識別信息沒有完整的語義;
第二確定單元,用于當(dāng)判斷單元的判斷出所述響應(yīng)信息不是不能提供服務(wù)的提示信息,則確定所述拼接后的語音識別信息有完整的語義。
可選地,所述的意圖庫為樹形結(jié)構(gòu)意圖庫;
所述解析單元,具體用于按預(yù)設(shè)規(guī)則,從所述語音識別信息中提取多段特征文字,其中各段特征文字與預(yù)設(shè)的樹形結(jié)構(gòu)意圖庫中的各個(gè)級別一一對應(yīng);
所述匹配單元,包括:
第一確定子單元,用于將第一級別對應(yīng)的特征文字確定為當(dāng)前級別的特征文字;
第二確定子單元,用于將所述樹形結(jié)構(gòu)意圖庫中第一級別的所有意圖確定為候選意圖;
匹配子單元,用于將所述當(dāng)前級別的特征文字與所述各個(gè)候選意圖進(jìn)行匹配,獲得當(dāng)前意圖;
判斷子單元,用于判斷是否所有特征文字匹配完成;
第三確定子單元,用于當(dāng)所述判斷子單元的判斷結(jié)果為是時(shí),則將當(dāng)前意圖確定為用戶意圖;
第四確定子單元,用于當(dāng)所述判斷子單元的判斷結(jié)果為否時(shí),則將下一級別對應(yīng)的特征文字確定為當(dāng)前級別的特征文字;將所述樹形結(jié)構(gòu)意圖庫中當(dāng)前意圖對應(yīng)的下一級別的所有意圖確定為候選意圖;觸發(fā)所述匹配子單元。
可選地,所述裝置還包括:
解析模塊,用于若在第一預(yù)設(shè)時(shí)長達(dá)到時(shí),未獲得待識別語音信息,則對已保存的待拼接語音識別信息進(jìn)行語義解析,獲得語義解析結(jié)果;
第一輸出模塊,用于向用戶輸出預(yù)設(shè)的與所述語義解析結(jié)果對應(yīng)的服務(wù)提示語音信息。
可選地,所述裝置還包括:
第二輸出模塊,用于若在第一預(yù)設(shè)時(shí)長達(dá)到時(shí),未獲得待識別語音信息,則向用戶輸出語音識別失敗提示語音信息。
可選地,所述電子設(shè)備為智能設(shè)備;
所述獲取模塊,包括:
檢測單元,用于實(shí)時(shí)檢測語音信息;
第三確定單元,用于在檢測到用戶輸入語音信息后,當(dāng)靜音時(shí)長達(dá)到第二預(yù)設(shè)時(shí)長時(shí),將用戶輸入的語音信息確定為待識別語音信息。
可選地,所述電子設(shè)備為與智能設(shè)備通信連接的云端服務(wù)器;
所述獲取模塊,具體用于接收所述智能設(shè)備發(fā)送的待識別語音信息;所述智能設(shè)備發(fā)送的待識別語音信息為:所述智能設(shè)備在檢測到用戶輸入語音信息后,當(dāng)靜音時(shí)長達(dá)到第二預(yù)設(shè)時(shí)長時(shí),將用戶輸入的語音信息確定為待識別語音信息后發(fā)送至所述云端服務(wù)器的。
本發(fā)明實(shí)施例還提供了一種電子設(shè)備,所述電子設(shè)備包括:殼體、處理器、存儲(chǔ)器、電路板和電源電路,其中,電路板安置在殼體圍成的空間內(nèi)部,處理器和存儲(chǔ)器設(shè)置在電路板上;電源電路,用于為電子設(shè)備的各個(gè)電路或器件供電;存儲(chǔ)器用于存儲(chǔ)可執(zhí)行程序代碼;處理器通過讀取存儲(chǔ)器中存儲(chǔ)的可執(zhí)行程序代碼來運(yùn)行與可執(zhí)行程序代碼對應(yīng)的程序,以用于執(zhí)行所述的語音識別方法。
本發(fā)明實(shí)施例提供的一種語音識別方法、裝置及電子設(shè)備,獲得待識別語音信息;對待識別語音信息進(jìn)行識別,獲得該待識別語音信息對應(yīng)的當(dāng)前語音識別信息;判斷是否存在已保存的待拼接語音識別信息;如果存在,對待拼接語音識別信息和當(dāng)前語音識別信息進(jìn)行拼接,得到拼接后的語音識別信息;確定拼接后的語音識別信息是否有完整的語義;如果是,則將拼接后的語音識別信息確定為語音識別結(jié)果;如果否,將拼接后的語音識別信息確定為待拼接語音識別信息進(jìn)行保存,并繼續(xù)獲得待識別語音信息。
本發(fā)明實(shí)施例中,通過對不存在已保存的待拼接語音識別信息情況下的當(dāng)前語音識別信息進(jìn)行判斷是否有完整的語義,以及對已保存的待拼接語音識別信息和當(dāng)前語音識別信息進(jìn)行拼接得到拼接后的語音識別信息,并判斷其是否有完整的語義。如果沒有,則繼續(xù)獲得語音信息進(jìn)而繼續(xù)對語音識別信息再次進(jìn)行拼接,直至得到完整的語義為止;本發(fā)明實(shí)施例保證了識別出的語義的完整性,提高了不連貫語音的語音識別效果。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例提供的語音識別方法的流程圖;
圖2為本發(fā)明實(shí)施例提供的確定拼接后的語音識別信息是否有完整的語義的流程圖;
圖3為本發(fā)明實(shí)施例提供的語音識別裝置的結(jié)構(gòu)示意圖;
圖4為本發(fā)明實(shí)施例提供的第一確定模塊的結(jié)構(gòu)示意圖;
圖5為本發(fā)明實(shí)施例提供的電子設(shè)備的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
為達(dá)到上述目的,本發(fā)明實(shí)施例提供了一種語音識別方法,該方法可以應(yīng)用于電子設(shè)備,該電子設(shè)備可以為智能設(shè)備,也可以為與智能設(shè)備通信連接的云端服務(wù)器。本發(fā)明實(shí)施例中,智能設(shè)備可以是智能手機(jī)、智能音箱、智能機(jī)器人或智能平板電腦等帶有語音識別功能的設(shè)備。
圖1為本發(fā)明實(shí)施例提供的語音識別方法的流程圖,該方法包括:
s110,獲得待識別語音信息。
本實(shí)施例中,語音信息為包含用戶發(fā)出語音的語音信息。
具體地,電子設(shè)備可監(jiān)聽其周圍的聲音,獲取相應(yīng)的語音信息并將其作為待識別語音信息。
在本發(fā)明實(shí)施例的一種具體實(shí)現(xiàn)方式中,當(dāng)電子設(shè)備為智能設(shè)備時(shí),步驟s110可以包括:
a1、實(shí)時(shí)檢測語音信息。
a2、在檢測到用戶輸入語音信息后,當(dāng)靜音時(shí)長達(dá)到第二預(yù)設(shè)時(shí)長時(shí),將用戶輸入的語音信息確定為待識別語音信息。
具體地,智能設(shè)備監(jiān)控到用戶的喚醒語音(包含預(yù)設(shè)的用于喚醒智能設(shè)備的喚醒詞的語音)被激活以后,實(shí)時(shí)檢測周圍的語音信息。設(shè)初始時(shí)刻周圍的聲音的音量較小,此時(shí)處于靜音狀態(tài),當(dāng)突然檢測到聲音的音量大與某一個(gè)預(yù)設(shè)值的時(shí)候,則可確定當(dāng)前有用戶輸入語音信息,此時(shí)進(jìn)入語音階段,智能設(shè)備采集語音階段的語音信息。經(jīng)過一段時(shí)間的語音后,聲音的音量小于預(yù)設(shè)值,語音再次進(jìn)入靜音階段,當(dāng)進(jìn)入靜音階段達(dá)到第二預(yù)設(shè)時(shí)長時(shí),將用戶輸入的語音信息(即智能設(shè)備采集到的語音信息)確定為待識別語音信息。本實(shí)施例中,第二預(yù)設(shè)時(shí)長可自由設(shè)定,第二預(yù)設(shè)時(shí)長優(yōu)選優(yōu)選為500毫秒。
在本發(fā)明實(shí)施例的另一種具體實(shí)現(xiàn)方式中,當(dāng)電子設(shè)備為與智能設(shè)備通信連接的云端服務(wù)器時(shí),步驟s110可以包括:
接收所述智能設(shè)備發(fā)送的待識別語音信息;所述智能設(shè)備發(fā)送的待識別語音信息為:所述智能設(shè)備在檢測到用戶輸入語音信息后,當(dāng)靜音時(shí)長達(dá)到第二預(yù)設(shè)時(shí)長時(shí),將用戶輸入的語音信息確定為待識別語音信息后發(fā)送至所述云端服務(wù)器的。
具體地,當(dāng)智能設(shè)備在檢測到聲音的音量大與某一個(gè)預(yù)設(shè)值的時(shí)候,開始獲取語音信息,經(jīng)過一段時(shí)間的語音后,聲音的音量小于預(yù)設(shè)值,語音再次進(jìn)入靜音階段,且靜音達(dá)到第二預(yù)設(shè)時(shí)長時(shí),智能設(shè)備停止獲取語音信息,并將已經(jīng)獲取的語音信息確定為待識別語音信息后,將其發(fā)送給云端服務(wù)器,云端服務(wù)器接收智能設(shè)備發(fā)送的待識別語音信息。
s120,對所述待識別語音信息進(jìn)行識別,獲得該待識別語音信息對應(yīng)的當(dāng)前語音識別信息。
具體地,在獲取了待識別語音信息后,電子設(shè)備對其進(jìn)行語音識別,得到該待識別語音信息對應(yīng)的語音識別信息(由于待識別語音信息可以為任一時(shí)間段的待識別語音信息,而并非為電子設(shè)備接收到的第一個(gè)待識別語音信息,因此,可將得到的語音識別信息定義為當(dāng)前語音識別信息)。本實(shí)施例中,語音識別的具體過程為現(xiàn)有技術(shù)此處不再贅述。
s130,判斷是否存在已保存的待拼接語音識別信息;如果存在,執(zhí)行步驟s140;如果不存在,執(zhí)行步驟s180。
s140,對所述待拼接語音識別信息和所述當(dāng)前語音識別信息進(jìn)行拼接,得到拼接后的語音識別信息。
本實(shí)施例中,所謂待拼接語音識別信息指的是沒有完整語義的語音識別信息,仍需要進(jìn)一步的拼接語音識別信息方能達(dá)到完整的語義。
具體地,當(dāng)電子設(shè)備獲得當(dāng)前語音識別信息后,判斷是否存在已保存的待拼接語音識別信息,如果存在,說明用戶發(fā)出的語音是不連貫的,且當(dāng)前語音識別信息不是電子設(shè)備接收到的第一個(gè)語音識別信息,需要與之前的已保存的待拼接語音識別信息進(jìn)一步的拼接,得到拼接后的語音識別信息。
舉例而言,當(dāng)用戶發(fā)送的語音為“我想聽…那個(gè)…”的時(shí)候,令當(dāng)前的語音識別信息為“那個(gè)”,則語意詞為“嗯”,待拼接語音識別信息為“我想聽”,則得到的拼接后的語音識別信息為“我想聽+那個(gè)”。
具體地,如果不存在已保存的待拼接語音識別信息,說明當(dāng)前語音識別信息是電子設(shè)備接收到的第一個(gè)語音識別信息,則執(zhí)行步驟s180。
s150,確定所述拼接后的語音識別信息是否有完整的語義。如果是,執(zhí)行步驟s160;如果否,執(zhí)行步驟s170。
s160,將所述拼接后的語音識別信息確定為語音識別結(jié)果。
s170,將拼接后的語音識別信息確定為待拼接語音識別信息進(jìn)行保存,并繼續(xù)執(zhí)行所述步驟s110。
具體地,電子設(shè)備在得到的拼接后的語音識別信息,確定其是否有完整的意義,如果有完整的語義,則識別過程成功,將拼接后的語音識別信息確定為語音識別結(jié)果。如果沒有完整的語義,則將拼接后的語音識別信息確定為待拼接語音識別信息進(jìn)行保存,并繼續(xù)等待并獲取下一個(gè)到達(dá)的待識別語音信息,從而保證了用戶發(fā)出的語音完整的被電子設(shè)備獲取到,提高了不連貫語音的語音識別效果。
s180,若判斷出不存在已保存的語音識別信息,則判斷當(dāng)前語音識別信息是否有完整的語義。如果有,執(zhí)行步驟s190;如果沒有,執(zhí)行步驟s1100。
s190,將當(dāng)前語音識別信息確定為語音識別結(jié)果。
s1100,將當(dāng)前語音識別信息確定為待拼接語音識別信息進(jìn)行保存,并繼續(xù)執(zhí)行所述步驟s110。
具體地,如果不存在已保存的待拼接語音識別信息,說明當(dāng)前語音識別信息是電子設(shè)備接收到的第一個(gè)語音識別信息,則直接判斷當(dāng)前語音識別信息是否有完整的語義。如果有完整的語義,則表明用戶當(dāng)前發(fā)出的語音是連貫的,則將當(dāng)前語音識別信息確定為語音識別結(jié)果。如果有完整的語義,則表明用戶當(dāng)前發(fā)出的語音是不連貫的,當(dāng)前語音識別信息確定為待拼接語音識別信息進(jìn)行保存,并繼續(xù)等待并獲取下一個(gè)到達(dá)的待識別語音信息,進(jìn)一步保證了用戶發(fā)出的語音完整的被電子設(shè)備獲取到,提高了不連貫語音的語音識別效果。
本發(fā)明實(shí)施例提供的語音識別方法,獲得待識別語音信息;對待識別語音信息進(jìn)行識別,獲得該待識別語音信息對應(yīng)的當(dāng)前語音識別信息;判斷是否存在已保存的待拼接語音識別信息;如果存在,對待拼接語音識別信息和當(dāng)前語音識別信息進(jìn)行拼接,得到拼接后的語音識別信息;確定拼接后的語音識別信息是否有完整的語義;如果是,則將拼接后的語音識別信息確定為語音識別結(jié)果;如果否,將拼接后的語音識別信息確定為待拼接語音識別信息進(jìn)行保存,并繼續(xù)獲得待識別語音信息。
本發(fā)明實(shí)施例中,通過對不存在已保存的待拼接語音識別信息情況下的當(dāng)前語音識別信息進(jìn)行判斷是否有完整的語義,以及對已保存的待拼接語音識別信息和當(dāng)前語音識別信息進(jìn)行拼接得到拼接后的語音識別信息,并判斷其是否有完整的語義。如果沒有,則繼續(xù)獲得語音信息進(jìn)而繼續(xù)對語音識別信息再次進(jìn)行拼接,直至得到完整的語義為止;本發(fā)明實(shí)施例保證了識別出的語意的完整性,提高了不連貫語音的語音識別效果。
在本發(fā)明實(shí)施例的一種具體實(shí)現(xiàn)方式中,步驟s150可包括如下步驟:
b1、對所述拼接后的語音識別信息進(jìn)行語義解析,獲得語義解析結(jié)果。
b2、將所述語義解析信息與預(yù)設(shè)的意圖庫中存儲(chǔ)的意圖進(jìn)行匹配,獲得用戶意圖。
b3、從所述意圖庫中獲得所述用戶意圖對應(yīng)的響應(yīng)信息。
b4、判斷所述響應(yīng)信息是否為不能提供服務(wù)的提示信息;如果所述響應(yīng)信息是不能提供服務(wù)的提示信息,則執(zhí)行步驟b5;如果所述響應(yīng)信息不是不能提供服務(wù)的提示信息,則執(zhí)行步驟b6。
b5、確定所述拼接后的語音識別信息沒有完整的語義。
b6、確定所述拼接后的語音識別信息有完整的語義。
本實(shí)施例中,通過將所述語義解析結(jié)果與預(yù)設(shè)的意圖庫中存儲(chǔ)的意圖進(jìn)行匹配獲得用戶意圖,并從所述意圖庫中獲得所述用戶意圖對應(yīng)的響應(yīng)信息,判斷所述響應(yīng)信息是否為不能提供服務(wù)的提示信息,從而確定語音識別信息是否有完整語義。本實(shí)施例可使確定語音識別信息是否有完整語義的過程更加易于實(shí)現(xiàn)。
為了對上述步驟s150進(jìn)一步解釋,步驟s150可包括如圖2所示的步驟。圖2為本發(fā)明實(shí)施例提供的確定所述拼接后的語音識別信息是否有完整的語義的流程圖。其中,步驟b1與步驟s210對應(yīng),步驟b2與步驟s220~步驟s270對應(yīng),步驟b3與步驟s280對應(yīng),步驟b4與步驟s290對應(yīng),步驟b5與步驟s2100對應(yīng),步驟b6與步驟s2110對應(yīng)。
s210,按預(yù)設(shè)規(guī)則,從所述語音識別信息中提取多段特征文字,其中各段特征文字與預(yù)設(shè)的樹形結(jié)構(gòu)意圖庫中的各個(gè)級別一一對應(yīng)。
具體地,可將該語音識別信息輸入預(yù)設(shè)的特征文字提取模型,獲得特征文字提取模型輸出的各個(gè)級別的多段特征文字。
其中,特征文字提取模型,用于對所述語音識別信息進(jìn)行語義解析,獲得與樹形結(jié)構(gòu)意圖庫中各個(gè)級別對應(yīng)的特征文字。本實(shí)施例中,樹形結(jié)構(gòu)意圖庫中的所有級別可以只對應(yīng)一個(gè)總的特征文字提取模型。在輸入時(shí),將語音識別結(jié)果輸入該總的特征文字提取模型,獲得該總的特征文字提取模型輸出的各個(gè)級別的多段特征文字。
s220,將第一級別對應(yīng)的特征文字確定為當(dāng)前級別的特征文字。
s230,將所述樹形結(jié)構(gòu)意圖庫中第一級別的所有意圖確定為候選意圖;
具體地,在匹配時(shí),從第一級別的特征文字與樹形結(jié)構(gòu)意圖庫中第一級別的所有意圖的匹配開始執(zhí)行,然后將第二級別的特征文字與樹形結(jié)構(gòu)意圖庫中匹配成功的第二級別的所有意圖進(jìn)行匹配,將第三級別的特征文字與樹形結(jié)構(gòu)意圖庫中匹配成功的第三級別的所有意圖進(jìn)行匹配,依此規(guī)律逐級執(zhí)行匹配過程,直至所有級別的特征文字匹配完成。
s240,將所述當(dāng)前級別的特征文字與所述各個(gè)候選意圖進(jìn)行匹配,獲得當(dāng)前意圖。
具體地,獲得當(dāng)前意圖時(shí),可以直接將匹配成功的候選意圖作為當(dāng)前意圖??梢岳斫獾氖牵?dāng)前意圖為本次匹配成功的候選意圖以及在本次匹配之前所有匹配成功的各級別意圖共同構(gòu)成的意圖。
s250,判斷是否所有特征文字匹配完成;若是,則執(zhí)行步驟s260;若否,則執(zhí)行步驟s270。
s260,將當(dāng)前意圖確定為用戶意圖;
s270,將下一級別對應(yīng)的特征文字確定為當(dāng)前級別的特征文字;將所述樹形結(jié)構(gòu)意圖庫中當(dāng)前意圖對應(yīng)的下一級別的所有意圖確定為候選意圖;返回步驟s240。
可以理解的是,當(dāng)所有特征文字均匹配完成時(shí),當(dāng)前意圖即構(gòu)成了最終確定的用戶意圖。
具體地,所述意圖庫中包含所有意圖和響應(yīng)信息的對應(yīng)關(guān)系,電子設(shè)備將所述語義解析結(jié)果與預(yù)設(shè)的意圖庫中存儲(chǔ)的意圖進(jìn)行匹配,獲得用戶意圖。當(dāng)電子設(shè)備獲得了用戶意圖,就知道用戶需要怎樣的服務(wù),從而根據(jù)意圖和響應(yīng)信息的對應(yīng)關(guān)系,也就是意圖與提供服務(wù)的對應(yīng)關(guān)系,來為用戶提供相應(yīng)的服務(wù),或輸出相應(yīng)的響應(yīng)信息。響應(yīng)信息中包括:與用戶意圖對應(yīng)的服務(wù)響應(yīng)信息,以及用戶意圖不完整而確定的不能提供服務(wù)的提示信息。例如:獲得的用戶意圖為“我想”,則獲得的響應(yīng)信息可以是“對不起,指令不完整無法提供服務(wù)”等類似的提示信息。
s280,從所述意圖庫中獲得所述用戶意圖對應(yīng)的響應(yīng)信息。
s290,判斷所述響應(yīng)信息是否為不能提供服務(wù)的提示信息;如果所述響應(yīng)信息是不能提供服務(wù)的提示信息,則執(zhí)行步驟s2100;如果所述響應(yīng)信息不是不能提供服務(wù)的提示信息,則執(zhí)行步驟s2110。
s2100,確定所述拼接后的語音識別信息沒有完整的語義;
s2110,確定所述拼接后的語音識別信息有完整的語義。
具體地,在獲得了用戶意圖后,電子設(shè)備可從意圖庫中獲得該用戶意圖對應(yīng)的響應(yīng)信息。判斷該響應(yīng)信息是否為不能提供服務(wù)的提示信息,如果所述響應(yīng)信息是不能提供服務(wù)的提示信息,則確定所述拼接后的語音識別信息沒有完整的語義;如果所述響應(yīng)信息不是不能提供服務(wù)的提示信息,則確定所述拼接后的語音識別信息有完整的語義。
可選地,當(dāng)用戶長時(shí)間猶豫不決,不能想到請求的服務(wù)內(nèi)容時(shí),電子設(shè)備還可以帶有提醒功能,因此,在將拼接后的語音識別信息確定為待拼接語音識別信息進(jìn)行保存后,所述方法還包括:
若在第一預(yù)設(shè)時(shí)長達(dá)到時(shí),未獲得待識別語音信息,則對已保存的待拼接語音識別信息進(jìn)行語義解析,獲得語義解析結(jié)果;向用戶輸出預(yù)設(shè)的與所述語義解析結(jié)果對應(yīng)的服務(wù)提示語音信息。
本實(shí)施例中,第一預(yù)設(shè)時(shí)長可以用于表示從用戶發(fā)出語音信息的開始時(shí)刻到當(dāng)前時(shí)刻之間的時(shí)間長度的衡量標(biāo)準(zhǔn)。當(dāng)從用戶發(fā)出語音信息的開始時(shí)刻到當(dāng)前時(shí)刻的時(shí)間長度大于第一預(yù)設(shè)時(shí)長時(shí),電子設(shè)備未獲得待識別語音信息,則說明用戶為了想說一句完整的話而猶豫了較長的時(shí)間。例如,用戶發(fā)出的語音信息為“我想聽…那個(gè)…嗯……”,則此時(shí)的第一預(yù)設(shè)時(shí)長可以表示從“我想聽”的開始時(shí)刻到“恩”之后時(shí)刻(即當(dāng)前時(shí)刻)的衡量標(biāo)準(zhǔn)。
另外,第一預(yù)設(shè)時(shí)長還可以用于表示用戶從上一次發(fā)出語音信息的時(shí)刻到當(dāng)前時(shí)刻之間的時(shí)間長度的衡量標(biāo)準(zhǔn)。當(dāng)用戶從上一次發(fā)出語音信息的時(shí)刻到當(dāng)前時(shí)刻之間的時(shí)間長度大于第一預(yù)設(shè)時(shí)長時(shí),電子設(shè)備未獲得待識別語音信息,說明用戶為了想說一句話中的部分詞而猶豫了較長的時(shí)間。例如,用戶發(fā)出的語音信息為“我想聽…那個(gè)…嗯……”,則此時(shí)的第一預(yù)設(shè)時(shí)長可以表示從用戶發(fā)出“恩”的開始時(shí)刻到之后時(shí)刻(即當(dāng)前時(shí)刻)的時(shí)間長度的衡量標(biāo)準(zhǔn)。
第一預(yù)設(shè)時(shí)長可以自由設(shè)定,第一預(yù)設(shè)時(shí)長越長說明服務(wù)器可等待用戶的猶豫的時(shí)間越長。優(yōu)選地,第一預(yù)設(shè)時(shí)長可以為4秒。
具體地,當(dāng)電子設(shè)備在第一預(yù)設(shè)時(shí)長達(dá)到時(shí),未獲得待識別語音信息,此時(shí)電子設(shè)備可能已保存過待拼接語音識別信息,說明用戶并沒有說完一句完整的話或沒有說出一句可被識別為有完整語義的話,電子設(shè)備無法做出針對性的處理響應(yīng),則電子設(shè)備對已保存的待拼接語音識別信息進(jìn)行語義解析獲得語義解析結(jié)果,并向用戶輸出預(yù)設(shè)的與所述語義解析結(jié)果對應(yīng)的服務(wù)提示語音信息。
舉例而言,電子設(shè)備中可以預(yù)設(shè)關(guān)于“我想聽”的服務(wù)提示語音信息,該服務(wù)提示語音信息可以為“您是想聽歌嗎,請您這樣告訴我‘我想聽忘情水’”,當(dāng)用戶發(fā)出的語音為“我想聽…那個(gè)…嗯……”,電子設(shè)備得到的待拼接語音識別信息為“我想聽+那個(gè)+嗯”,當(dāng)電子設(shè)備在第一預(yù)設(shè)時(shí)長達(dá)到時(shí),未獲得待識別語音信息會(huì)向用戶輸出上述服務(wù)提示語音信息。
本實(shí)施例中,當(dāng)用戶長時(shí)間猶豫不決時(shí),電子設(shè)備還可以帶有服務(wù)提示功能,增加了電子設(shè)備的智能性,提高了用戶的體驗(yàn)。
可選地,在將拼接后的語音識別信息確定為待拼接語音識別信息進(jìn)行保存后,所述方法還包括:
若在第一預(yù)設(shè)時(shí)長達(dá)到時(shí),未獲得待識別語音信息,則向用戶輸出語音識別失敗提示語音信息。
具體地,當(dāng)電子設(shè)備在第一預(yù)設(shè)時(shí)長達(dá)到時(shí),未獲得待識別語音信息,此時(shí)用戶很長時(shí)間無法說出具體的服務(wù)內(nèi)容,可能的由于想不到具體的服務(wù)內(nèi)容而不會(huì)再繼續(xù)發(fā)出語音,電子設(shè)備也無需繼續(xù)等待可能到來的待識別語音信息的,則電子設(shè)備向用戶輸出語音識別失敗提示語音信息。舉例而言,語音識別失敗提示語音信息可以為“對不起,我沒聽懂”。
進(jìn)一步的,為了節(jié)省能耗,電子設(shè)備在向用戶輸出語音識別失敗提示語音信息后還可以進(jìn)入低功耗待機(jī)狀態(tài)。
本實(shí)施例中,電子設(shè)備還可以帶有輸出語音識別失敗提示語音信息的功能,增加了電子設(shè)備的智能性,提高了用戶的體驗(yàn)。
需要說明的是,在確定了語音識別結(jié)果后,電子設(shè)備可以對語音識別結(jié)果進(jìn)行語義解析,根據(jù)語義解析確定為用戶提供對應(yīng)的服務(wù)。
舉例而言,若電子設(shè)備為智能設(shè)備,在確定了語音識別結(jié)果后,智能設(shè)備可以對語音識別結(jié)果進(jìn)行語義解析,根據(jù)語義解析確定為用戶提供對應(yīng)的服務(wù)。假設(shè)解析結(jié)果是播放智能設(shè)備中音頻的指令,則執(zhí)行該指令,播放相應(yīng)的音頻。
再例如:若電子設(shè)備為與智能設(shè)備通信連接的云端服務(wù)器,在確定了語音識別結(jié)果后,云端服務(wù)器可以對語音識別結(jié)果進(jìn)行語義解析,根據(jù)語義解析確定為用戶提供對應(yīng)的服務(wù)。假設(shè)解析結(jié)果是播放云端服務(wù)器中音頻的指令,則執(zhí)行該指令,將相應(yīng)的音頻發(fā)送至所述智能設(shè)備進(jìn)行播放。
與方法實(shí)施例相對應(yīng)的,本發(fā)明還提供了一種語音識別裝置,該裝置可應(yīng)用于電子設(shè)備。圖3為本發(fā)明實(shí)施例提供的語音識別裝置的結(jié)構(gòu)示意圖,該裝置包括:
獲取模塊310,用于獲得待識別語音信息;
識別模塊320,用于對所述待識別語音信息進(jìn)行識別,獲得該待識別語音信息對應(yīng)的當(dāng)前語音識別信息;
第一判斷模塊330,用于判斷是否存在已保存的待拼接語音識別信息;
拼接模塊340,用于當(dāng)所述第一判斷模塊330的判斷結(jié)果為存在時(shí),對所述待拼接語音識別信息和所述當(dāng)前語音識別信息進(jìn)行拼接,得到拼接后的語音識別信息;
第一確定模塊350,用于確定所述拼接后的語音識別信息是否有完整的語義;
第二確定模塊360,用于當(dāng)所述第一確定模塊350的確定結(jié)果為是時(shí),則將所述拼接后的語音識別信息確定為語音識別結(jié)果;
第三確定模塊370,用于當(dāng)所述第一確定模塊350的確定結(jié)果為否時(shí),將拼接后的語音識別信息確定為待拼接語音識別信息進(jìn)行保存,并觸發(fā)所述獲取模塊310。
本發(fā)明實(shí)施例提供的語音識別裝置,獲得待識別語音信息;對待識別語音信息進(jìn)行識別,獲得該待識別語音信息對應(yīng)的當(dāng)前語音識別信息;判斷是否存在已保存的待拼接語音識別信息;如果存在,對待拼接語音識別信息和當(dāng)前語音識別信息進(jìn)行拼接,得到拼接后的語音識別信息;確定拼接后的語音識別信息是否有完整的語義;如果是,則將拼接后的語音識別信息確定為語音識別結(jié)果;如果否,將拼接后的語音識別信息確定為待拼接語音識別信息進(jìn)行保存,并繼續(xù)獲得待識別語音信息。
本發(fā)明實(shí)施例中,通過對不存在已保存的待拼接語音識別信息情況下的當(dāng)前語音識別信息進(jìn)行判斷是否有完整的語義,以及對已保存的待拼接語音識別信息和當(dāng)前語音識別信息進(jìn)行拼接得到拼接后的語音識別信息,并判斷其是否有完整的語義。如果沒有,則繼續(xù)獲得語音信息進(jìn)而繼續(xù)對語音識別信息再次進(jìn)行拼接,直至得到完整的語義為止;本發(fā)明實(shí)施例保證了識別出的語意的完整性,提高了不連貫語音的語音識別效果。
進(jìn)一步地,所述裝置還包括:
第二判斷模塊380,用于當(dāng)所述第一判斷模塊370判斷出不存在已保存的語音識別信息時(shí),則判斷當(dāng)前語音識別信息是否有完整的語義;
第四確定模塊390,用于當(dāng)所述第二判斷模塊380的判斷結(jié)果為有時(shí),則將當(dāng)前語音識別信息確定為語音識別結(jié)果;
第五確定模塊3100,用于當(dāng)所述第二判斷模塊380的判斷結(jié)果為沒有時(shí),則將當(dāng)前語音識別信息確定為待拼接語音識別信息進(jìn)行保存,并觸發(fā)所述獲取模塊310。
圖4為本發(fā)明實(shí)施例提供的第一確定模塊的結(jié)構(gòu)示意圖,所述第一確定模塊350,包括:
解析單元351,用于對所述拼接后的語音識別信息進(jìn)行語義解析,獲得語義解析結(jié)果;
匹配單元352,用于將所述語義解析信息與預(yù)設(shè)的意圖庫中存儲(chǔ)的意圖進(jìn)行匹配,獲得用戶意圖;
獲取單元352,用于從所述意圖庫中獲得所述用戶意圖對應(yīng)的響應(yīng)信息;
判斷單元354,用于判斷所述響應(yīng)信息是否為不能提供服務(wù)的提示信息;
第一確定單元355,用于當(dāng)判斷單元的判斷出所述響應(yīng)信息是不能提供服務(wù)的提示信息時(shí),則確定所述拼接后的語音識別信息沒有完整的語義;
第二確定單元356,用于當(dāng)判斷單元的判斷出所述響應(yīng)信息不是不能提供服務(wù)的提示信息,則確定所述拼接后的語音識別信息有完整的語義。
本實(shí)施例中,通過將所述語義解析結(jié)果與預(yù)設(shè)的意圖庫中存儲(chǔ)的意圖進(jìn)行匹配獲得用戶意圖,并從所述意圖庫中獲得所述用戶意圖對應(yīng)的響應(yīng)信息,判斷所述響應(yīng)信息是否為不能提供服務(wù)的提示信息,從而確定語音識別信息是否有完整語義。本實(shí)施例可使確定語音識別信息是否有完整語義的過程更加易于實(shí)現(xiàn)。
進(jìn)一步地,所述的意圖庫為樹形結(jié)構(gòu)意圖庫;
所述解析單元351,具體用于按預(yù)設(shè)規(guī)則,從所述語音識別信息中提取多段特征文字,其中各段特征文字與預(yù)設(shè)的樹形結(jié)構(gòu)意圖庫中的各個(gè)級別一一對應(yīng);
所述匹配單元352,包括:
第一確定子單元3521,用于將第一級別對應(yīng)的特征文字確定為當(dāng)前級別的特征文字;
第二確定子單元3522,用于將所述樹形結(jié)構(gòu)意圖庫中第一級別的所有意圖確定為候選意圖;
匹配子單元3523,用于將所述當(dāng)前級別的特征文字與所述各個(gè)候選意圖進(jìn)行匹配,獲得當(dāng)前意圖;
判斷子單元3524,用于判斷是否所有特征文字匹配完成;
第三確定子單元3525,用于當(dāng)所述判斷子單元的判斷結(jié)果為是時(shí),則將當(dāng)前意圖確定為用戶意圖;
第四確定子單元3526,用于當(dāng)所述判斷子單元的判斷結(jié)果為否時(shí),則將下一級別對應(yīng)的特征文字確定為當(dāng)前級別的特征文字;將所述樹形結(jié)構(gòu)意圖庫中當(dāng)前意圖對應(yīng)的下一級別的所有意圖確定為候選意圖;觸發(fā)所述匹配子單元3523。
進(jìn)一步地,所述裝置還包括:第三判斷模塊3110,用于判斷在第一預(yù)設(shè)時(shí)長達(dá)到時(shí),是否獲得待識別語音信息;
解析模塊3120,用于當(dāng)所述第三判斷模塊判斷出在第一預(yù)設(shè)時(shí)長達(dá)到時(shí),未獲得待識別語音信息時(shí),則對已保存的待拼接語音識別信息進(jìn)行語義解析,獲得語義解析結(jié)果;
第一輸出模塊,用于向用戶輸出預(yù)設(shè)的與所述語義解析結(jié)果對應(yīng)的服務(wù)提示語音信息。
進(jìn)一步地,所述裝置還包括:
第二輸出模塊,用于若在第一預(yù)設(shè)時(shí)長達(dá)到時(shí),未獲得待識別語音信息,則向用戶輸出語音識別失敗提示語音信息。
進(jìn)一步地,所述電子設(shè)備為智能設(shè)備;
所述獲取模塊,包括:
檢測單元,用于實(shí)時(shí)檢測語音信息;
第三確定單元,用于在檢測到用戶輸入語音信息后,當(dāng)靜音時(shí)長達(dá)到第二預(yù)設(shè)時(shí)長時(shí),將用戶輸入的語音信息確定為待識別語音信息。
進(jìn)一步地,所述電子設(shè)備為與智能設(shè)備通信連接的云端服務(wù)器;
所述獲取模塊,具體用于接收所述智能設(shè)備發(fā)送的待識別語音信息;所述智能設(shè)備發(fā)送的待識別語音信息為:所述智能設(shè)備在檢測到用戶輸入語音信息后,當(dāng)靜音時(shí)長達(dá)到第二預(yù)設(shè)時(shí)長時(shí),將用戶輸入的語音信息確定為待識別語音信息后發(fā)送至所述云端服務(wù)器的。
與上述方法實(shí)施例相對應(yīng)的,本發(fā)明實(shí)施例還提供了一種電子設(shè)備。圖5為本發(fā)明實(shí)施例提供的電子設(shè)備的結(jié)構(gòu)示意圖,所述電子設(shè)備包括:
殼體510、處理器520、存儲(chǔ)器530、電路板540和電源電路550,其中,電路板540安置在殼體510圍成的空間內(nèi)部,處理器520和存儲(chǔ)器530設(shè)置在電路板540上;電源電路550,用于為電子設(shè)備的各個(gè)電路或器件供電;存儲(chǔ)器530用于存儲(chǔ)可執(zhí)行程序代碼;處理器520通過讀取存儲(chǔ)器530中存儲(chǔ)的可執(zhí)行程序代碼來運(yùn)行與可執(zhí)行程序代碼對應(yīng)的程序,以用于執(zhí)行上述方法實(shí)施例中所述的語音識別方法。
一種實(shí)現(xiàn)方式中,上述語音識別方法可以包括:
獲得待識別語音信息;
對所述待識別語音信息進(jìn)行識別,獲得該待識別語音信息對應(yīng)的當(dāng)前語音識別信息;
判斷是否存在已保存的待拼接語音識別信息;
如果存在,對所述待拼接語音識別信息和所述當(dāng)前語音識別信息進(jìn)行拼接,得到拼接后的語音識別信息;
確定所述拼接后的語音識別信息是否有完整的語義;
如果是,則將所述拼接后的語音識別信息確定為語音識別結(jié)果;
如果否,將拼接后的語音識別信息確定為待拼接語音識別信息進(jìn)行保存,并繼續(xù)執(zhí)行所述獲得待識別語音信息的步驟。
上述語音識別方法的其他實(shí)現(xiàn)方式參見前述方法實(shí)施例部分的說明,這里不再贅述。
處理器520對上述步驟及上述語音信號處理方法的其他實(shí)現(xiàn)方式的具體執(zhí)行過程以及處理器520通過運(yùn)行可執(zhí)行程序代碼來進(jìn)一步執(zhí)行的過程,可以參見本發(fā)明實(shí)施例中圖1至圖4所示實(shí)施例的描述,在此不再贅述。
需要說明的是,該電子設(shè)備以多種形式存在,包括但不限于:
(1)移動(dòng)通信設(shè)備:這類設(shè)備的特點(diǎn)是具備移動(dòng)通信功能,并且以提供話音、數(shù)據(jù)通信為主要目標(biāo)。這類終端包括:智能手機(jī)(例如iphone)、多媒體手機(jī)、功能性手機(jī),以及低端手機(jī)等。
(2)超移動(dòng)個(gè)人計(jì)算機(jī)設(shè)備:這類設(shè)備屬于個(gè)人計(jì)算機(jī)的范疇,有計(jì)算和處理功能,一般也具備移動(dòng)上網(wǎng)特性。這類終端包括:pda、mid和umpc設(shè)備等,例如ipad。
(3)便攜式娛樂設(shè)備:這類設(shè)備可以顯示和播放多媒體內(nèi)容。該類設(shè)備包括:音頻、視頻播放器(例如ipod),掌上游戲機(jī),電子書,以及智能玩具和便攜式車載導(dǎo)航設(shè)備。
(4)服務(wù)器:提供計(jì)算服務(wù)的設(shè)備,服務(wù)器的構(gòu)成包括處理器、硬盤、內(nèi)存、系統(tǒng)總線等,服務(wù)器和通用的計(jì)算機(jī)架構(gòu)類似,但是由于需要提供高可靠的服務(wù),因此在處理能力、穩(wěn)定性、可靠性、安全性、可擴(kuò)展性、可管理性等方面要求較高。
(5)其他具有數(shù)據(jù)交互功能的電子裝置。
可見,本發(fā)明實(shí)施例所提供的方案中,電子設(shè)備的處理器通過讀取存儲(chǔ)器中存儲(chǔ)的可執(zhí)行程序代碼來運(yùn)行與可執(zhí)行程序代碼對應(yīng)的程序,獲得待識別語音信息;對待識別語音信息進(jìn)行識別,獲得該待識別語音信息對應(yīng)的當(dāng)前語音識別信息;判斷是否存在已保存的待拼接語音識別信息;如果存在,對待拼接語音識別信息和當(dāng)前語音識別信息進(jìn)行拼接,得到拼接后的語音識別信息;確定拼接后的語音識別信息是否有完整的語義;如果是,則將拼接后的語音識別信息確定為語音識別結(jié)果;如果否,將拼接后的語音識別信息確定為待拼接語音識別信息進(jìn)行保存,并繼續(xù)獲得待識別語音信息。
本發(fā)明實(shí)施例中,通過對不存在已保存的待拼接語音識別信息情況下的當(dāng)前語音識別信息進(jìn)行判斷是否有完整的語義,以及對已保存的待拼接語音識別信息和當(dāng)前語音識別信息進(jìn)行拼接得到拼接后的語音識別信息,并判斷其是否有完整的語義。如果沒有,則繼續(xù)獲得語音信息進(jìn)而繼續(xù)對語音識別信息再次進(jìn)行拼接,直至得到完整的語義為止;本發(fā)明實(shí)施例保證了識別出的語意的完整性,提高了不連貫語音的語音識別效果。
對于電子設(shè)備實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。
需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
本說明書中的各個(gè)實(shí)施例均采用相關(guān)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見即可,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處。尤其,對于系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。