本申請涉及人工智能,尤其涉及一種醫(yī)患對話模型的測試方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、醫(yī)患對話系統(tǒng)是一種基于人工智能、自然語言處理、醫(yī)學(xué)知識庫等技術(shù),實(shí)現(xiàn)患者與“虛擬醫(yī)生”或輔助醫(yī)護(hù)人員進(jìn)行智能化溝通的系統(tǒng)。
2、相關(guān)技術(shù)中,針對醫(yī)患對話系統(tǒng)的評測基準(zhǔn)主要有兩種,其中一種主要基于常規(guī)的中文評測基準(zhǔn),聚焦于通用自然語言處理的評估,例如簡單的語義理解、文本分類、實(shí)體識別等通用能力;另一種是基于醫(yī)療場景診斷正確率評測基準(zhǔn),通過固定案例庫模擬對話評估最終診斷正確率。
3、然而,相關(guān)技術(shù)無法準(zhǔn)確評估醫(yī)患對話模型的對話質(zhì)量。
技術(shù)實(shí)現(xiàn)思路
1、本申請?zhí)峁┝酸t(yī)患對話模型的測試方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),以至少解決相關(guān)技術(shù)無法準(zhǔn)確評估醫(yī)患對話模型的對話質(zhì)量的問題。
2、本申請?zhí)峁┝艘环N醫(yī)患對話模型的測試方法,包括:
3、獲取待處理的醫(yī)患對話模型和預(yù)設(shè)的患者模擬器;
4、根據(jù)醫(yī)患對話模型和預(yù)設(shè)的患者模擬器,生成醫(yī)患對話模擬系統(tǒng);
5、獲取場景測試數(shù)據(jù),以及對應(yīng)于多個(gè)測試場景的用戶畫像數(shù)據(jù)和畫像動(dòng)態(tài)調(diào)整規(guī)則;
6、根據(jù)場景測試數(shù)據(jù)、用戶畫像數(shù)據(jù)和畫像動(dòng)態(tài)調(diào)整規(guī)則,對醫(yī)患對話模擬系統(tǒng)進(jìn)行對話模擬處理,以得到多輪模擬對話;
7、獲取多個(gè)對話評分規(guī)則;
8、根據(jù)多個(gè)對話評分規(guī)則,對多輪模擬對話進(jìn)行評分處理,以得到待處理的醫(yī)患對話模型的測試結(jié)果。
9、本申請還提供了一種醫(yī)患對話模型的測試裝置,包括:
10、第一獲取模塊,用于獲取待處理的醫(yī)患對話模型和預(yù)設(shè)的患者模擬器;
11、生成模塊,用于根據(jù)醫(yī)患對話模型和預(yù)設(shè)的患者模擬器,生成醫(yī)患對話模擬系統(tǒng);
12、第二獲取模塊,用于獲取場景測試數(shù)據(jù),以及對應(yīng)于多個(gè)測試場景的用戶畫像數(shù)據(jù)和畫像動(dòng)態(tài)調(diào)整規(guī)則;
13、第一處理模塊,用于根據(jù)場景測試數(shù)據(jù)、用戶畫像數(shù)據(jù)和畫像動(dòng)態(tài)調(diào)整規(guī)則,對醫(yī)患對話模擬系統(tǒng)進(jìn)行對話模擬處理,以得到多輪模擬對話;
14、第三獲取模塊,用于獲取多個(gè)對話評分規(guī)則;
15、第二處理模塊,用于根據(jù)多個(gè)對話評分規(guī)則,對多輪模擬對話進(jìn)行評分處理,以得到待處理的醫(yī)患對話模型的測試結(jié)果。
16、本申請還提供了一種電子設(shè)備,包括:存儲(chǔ)器,用于存儲(chǔ)計(jì)算機(jī)程序;處理器,用于執(zhí)行計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述任一種醫(yī)患對話模型的測試方法的步驟。
17、本申請還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,其中,計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任一種醫(yī)患對話模型的測試方法的步驟。
18、本申請還提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任一種醫(yī)患對話模型的測試方法的步驟。
19、通過本申請,基于待測試的人工智能模型和扮演患者角色的人工智能模型對話,構(gòu)建用于模擬對話的醫(yī)患對話模擬系統(tǒng),以實(shí)現(xiàn)醫(yī)療場景的對話模擬,為了模擬多種多樣的醫(yī)療場景,融合了多個(gè)測試場景的用戶畫像數(shù)據(jù),并配置畫像動(dòng)態(tài)調(diào)整規(guī)則來適應(yīng)醫(yī)患互動(dòng)中的動(dòng)態(tài)變化,進(jìn)而得到融合多種多樣醫(yī)療場景的多輪模擬對話,再結(jié)合多維度評分規(guī)則,實(shí)現(xiàn)多維度評分,應(yīng)對不同的醫(yī)療場景以及多種多樣的對話要求,完成了對人工智能模型對話能力的多維度評估,提高了醫(yī)患對話模型的對話質(zhì)量評估的準(zhǔn)確性。
1.一種醫(yī)患對話模型的測試方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述場景測試數(shù)據(jù)、所述用戶畫像數(shù)據(jù)和所述畫像動(dòng)態(tài)調(diào)整規(guī)則,對所述醫(yī)患對話模擬系統(tǒng)進(jìn)行對話模擬處理,以得到多輪模擬對話,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述用戶畫像數(shù)據(jù)和所述畫像動(dòng)態(tài)調(diào)整規(guī)則,確定所述預(yù)設(shè)的患者模擬器的對話參數(shù),包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述對話參數(shù)包括人口特征參數(shù)、依從性參數(shù)、表達(dá)風(fēng)格參數(shù)、噪音干擾參數(shù)和邏輯問題干擾參數(shù)中的至少一種。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述畫像動(dòng)態(tài)調(diào)整規(guī)則包括觸發(fā)條件、所述觸發(fā)條件對應(yīng)的調(diào)整參數(shù)和所述觸發(fā)條件對應(yīng)的調(diào)整方式;
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述畫像動(dòng)態(tài)調(diào)整規(guī)則還包括對應(yīng)于所述觸發(fā)條件的階梯式漸進(jìn)策略;
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述階梯式漸進(jìn)策略包括依從性降級策略、噪聲干擾增強(qiáng)策略和防御模式策略中的至少一種;
8.根據(jù)權(quán)利要求1至7任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述多個(gè)對話評分規(guī)則,對所述多輪模擬對話進(jìn)行評分處理,以得到所述待處理的醫(yī)患對話模型的測試結(jié)果,包括:
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述對話評分規(guī)則包括臨床信息獲取能力評分規(guī)則、溝通技巧評分規(guī)則和診斷性信息收集能力評分規(guī)則中的多個(gè)。
10.根據(jù)權(quán)利要求8所述的方法,其特征在于,在所述根據(jù)所述多個(gè)對話評分規(guī)則,對所述多輪模擬對話進(jìn)行評分處理,以得到所述待處理的醫(yī)患對話模型的測試結(jié)果之后,還包括:
11.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述根據(jù)所述多個(gè)測試評分,確定模型優(yōu)化策略,包括:
12.一種醫(yī)患對話模型的測試裝置,其特征在于,包括:
13.一種電子設(shè)備,其特征在于,包括:
14.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,其中,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至11任一項(xiàng)所述醫(yī)患對話模型的測試方法的步驟。
15.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至11任一項(xiàng)所述醫(yī)患對話模型的測試方法的步驟。