aaa视频网站,国产最新进精品视频,国产主播一区二区,999热精品视频,а√天堂资源8在线官网在线,国产免费不卡av,麻豆国产视频

一種提取觀點的方法和設備的制造方法

文檔序號:9471475閱讀:312來源:國知局
一種提取觀點的方法和設備的制造方法
【技術領域】
[0001] 本發(fā)明的實施方式設及計算機領域,更具體地,本發(fā)明的實施方式設及一種提取 觀點的方法和設備。
【背景技術】
[0002] 本部分旨在為權利要求書中陳述的本發(fā)明的實施方式提供背景或上下文。此處的 描述不因為包括在本部分中就承認是現(xiàn)有技術。
[0003] 隨著互聯(lián)網(wǎng)技術的普及,論壇等虛擬社區(qū)不斷發(fā)展。在虛擬社區(qū)中,每天都會產(chǎn)生 大量對某個評價對象的評論內容,該評價對象可W是汽車,手機,或者食品等實物產(chǎn)品,也 可W是社交軟件,購物平臺,或者游戲道具等虛擬產(chǎn)品。商家可W統(tǒng)計消費者在虛擬社區(qū)中 對產(chǎn)品的評論內容,分析消費者對產(chǎn)品的需求,不斷對產(chǎn)品進行改進,提升產(chǎn)品質量。
[0004] 虛擬社區(qū)中對某個評價對象的評論內容,一般包括四部分:主題(topic),觀點持 有者化older),觀點(claim)W及情感極性判斷。一般情況下,從評論內容中所提取的觀點 是分析消費者對產(chǎn)品需求的主要依據(jù)。所提取的一個評價對象的觀點中,不僅包括對該評 價對象的觀點,還包括對該評價對象的屬性的觀點。
[0005] 目前,現(xiàn)有技術中采用固定的句式結構實現(xiàn)對觀點的提取,W兩個標點符號間的 一串文字作為一個整體進行分析,當所述兩個符號間的一串文字滿足表1所示的句式結構 時,將所述兩個符號間的一串文字作為觀點進行提取。
[0006] 表1中的n表示名詞,a表示形容詞,V表示動詞,d表示副詞,U表示助詞,C表示 連詞,"+ "表示詞的組合,表1中括號里面的內容可W替換括號外面沒被"+ "隔開的內容。 舉例說明:表1中n(n+n或n+n+n等)+a,觀點的句式結構為名詞(n)與形容詞(a)的組合, 其中,可W用兩個名詞(n+n)或S個名詞(n+n+n)組成的名詞短語代替名詞(n)。
[0007] 表1觀點的句式結構
[0008]



【發(fā)明內容】

[0009] 但是,現(xiàn)有技術中采用表1所示的固定的句式結構提取觀點的方法,一方面,固定 的句式結構中沒有否定的句式結構,無法識別否定的觀點;另一方面,固定的句式結構中評 價觀點不一定是對評價對象進行評價的觀點,導致提取的觀點錯誤;再一方面,該方法W兩 個標點符號之間的一串文字為一個整體進行分析,無法識別評價對象和評價觀點在不同的 短句中的觀點。由于現(xiàn)有技術所采用的提取觀點的方法存在上述問題,因此,采用現(xiàn)有技術 提取的觀點的準確率低,完整程度低,導致提取的觀點實用性差。
[0010] 因此,在現(xiàn)有技術中,提取的觀點的準確率低,完整程度低,導致的觀點實用性差, 運是非常令人煩惱的過程。
[0011] 為此,非常需要一種改進的提取觀點的方法和設備,W使得提取觀點時可W識別 否定的觀點,避免提取錯誤觀點,能夠識別評價對象和評價觀點在不同的短句中的觀點,提 高所提取觀點的正確率,完整程度W及實用性。
[0012] 在本上下文中,本發(fā)明的實施方式期望提供一種提取觀點的方法和設備。
[0013] 本發(fā)明實施例的第一方面,提供了一種提取觀點的方法,包括:從虛擬社區(qū)獲取用 戶針對評價對象的評語;對所述評語進行分詞,獲得所述評語中每個詞的詞性;根據(jù)所述 每個詞的詞性對所述評語進行依存分析,獲得所述評語中各個詞之間的依存關系;根據(jù)所 述評語中各個詞之間的依存關系,從所述虛擬社區(qū)的評語中提取用戶對所述評價對象或預 設的所述評價對象的屬性的評價觀點。
[0014] 本發(fā)明實施例的第二方面,提供了一種提取觀點的設備,包括:第一獲取模塊,用 于從虛擬社區(qū)獲取用戶針對評價對象的評語;分詞模塊,用于對所述評語進行分詞,獲得所 述評語中每個詞的詞性;分析模塊,用于根據(jù)所述每個詞的詞性對所述評語進行依存分析, 獲得所述評語中各個詞之間的依存關系;提取模塊,用于根據(jù)所述評語中各個詞之間的依 存關系,從所述虛擬社區(qū)的評語中提取用戶對所述評價對象或預設的所述評價對象的屬性 的評價觀點。
[0015] 根據(jù)本發(fā)明提供的提取觀點的方法和設備,可W在提取觀點時,對所述評語進行 分詞,獲得所述評語中每個詞的詞性,根據(jù)所述每個詞的詞性對所述評語進行依存分析,獲 得所述評語中各個詞之間的依存關系,根據(jù)所述評語中各個詞之間的依存關系提取觀點, 可W識別否定的觀點,避免提取錯誤觀點,能夠識別評價對象和評價觀點在不同的短句中 的觀點,從而顯著地降低了提取觀點的錯誤率,提高了所提取的觀點的實用性。
【附圖說明】
[0016] 通過參考附圖閱讀下文的詳細描述,本發(fā)明示例性實施方式的上述W及其他目 的、特征和優(yōu)點將變得易于理解。在附圖中,W示例性而非限制性的方式示出了本發(fā)明的若 干實施方式,其中:
[0017] 圖1為本發(fā)明的實施方式的一個示例性應用場景的框架示意圖;
[0018] 圖2為本發(fā)明的實施方式一個示例性應用場景提取的評價觀點的結果示意圖;
[0019] 圖3示意性地示出了本發(fā)明中提取觀點的方法一實施例的流程圖;
[0020] 圖4示意性地示出了根據(jù)本發(fā)明中依存關系的實例示意圖;
[0021] 圖5示意性地示出了本發(fā)明中提取觀點的設備一實施例的結構示意圖。
[0022] 在附圖中,相同或對應的標號表示相同或對應的部分。
【具體實施方式】
[0023] 下面將參考若干示例性實施方式來描述本發(fā)明的原理和精神。應當理解,給出運 些實施方式僅僅是為了使本領域技術人員能夠更好地理解進而實現(xiàn)本發(fā)明,而并非W任何 方式限制本發(fā)明的范圍。相反,提供運些實施方式是為了使本公開更加透徹和完整,并且能 夠將本公開的范圍完整地傳達給本領域的技術人員。
[0024] 本領域技術人員知道,本發(fā)明的實施方式可W實現(xiàn)為一種系統(tǒng)、裝置、設備、方法 或計算機程序產(chǎn)品。因此,本公開可W具體實現(xiàn)為W下形式,即:完全的硬件、完全的軟件 (包括固件、駐留軟件、微代碼等),或者硬件和軟件結合的形式。
[00巧]根據(jù)本發(fā)明的實施方式,提出了一種提取觀點的方法和設備。
[0026] 在本文中,需要理解的是,所設及的符號"+ "不表示數(shù)學中常規(guī)意義的求和,而是 表示該"+ "前后的內容按照順序組合。例如:屬性A+介詞C+屬性B+觀點D,表示由屬性 A,介詞C,屬性BW及觀點D依次組合所得的句式。此外,附圖中的任何元素數(shù)量均用于示 例而非限制,W及任何命名都僅用于區(qū)分,而不具有任何限制含義。
[0027] 下面參考本發(fā)明的若干代表性實施方式,詳細闡釋本發(fā)明的原理和精神。
[0028] 發(fā)巧概沐
[0029] 本發(fā)明人發(fā)現(xiàn),現(xiàn)有技術中采用固定的句式結構實現(xiàn)對觀點的提取時,一方面,固 定的句式結構中沒有否定的句式結構,無法識別否定的觀點。例如:"完全不覺得運部手機 漂亮",根據(jù)現(xiàn)有技術中的句式結構"n+a",提取出的觀點為"手機漂亮",但是實際的觀點是 "手機不漂亮"。
[0030] 另一方面,固定的句式結構中評價觀點不一定是對評價對象進行評價的觀點,導 致提取的觀點錯誤。例如:"手機麻煩你幫我修理一下",提取出的觀點為"手機麻煩",實際 上"麻煩"不是修飾手機的。
[0031] 再一方面,該方法W兩個標點符號之間的一串文字為一個整體進行分析,無法識 別評價對象和評價觀點在不同的短句中的觀點。例如:"我新買了一臺電腦,可好用了 ",由 于分析的最小單位是兩個標點符號之間的短語,則無法識別觀點"電腦好用"。
[0032] 因此,采用現(xiàn)有技術中固定的句式結構提取觀點存在上述問題,提取的觀點的準 確率低,完整程度低,導致提取的觀點實用性差。
[0033] 基于上述發(fā)現(xiàn),本發(fā)明的基本思想在于:對用戶針對評價對象的評語進行分詞,獲 得所述評語中每個詞的詞性;根據(jù)所述每個詞的詞性對所述評語進行依存分析,獲得所述 評語中各個詞之間的依存關系;根據(jù)所述評語中各個詞之間的依存關系提取觀點。一方面, 本發(fā)明中根據(jù)所述評語中各個詞之間的依存關系,可W分析得到否定的觀點,并且分析出 觀點所屬的評價對象;另一方面,本發(fā)明中分析的最小單元是評語,即一般情況下是針對評 價對象進行評論的完整的語句,而不是由任意兩個標點符號隔開的短句,可W識別評價對 象和評價觀點在不同的短句中的觀點。因此,本發(fā)明提供的提取觀點的方法能夠識別評價 對象和評價觀點在不同的短句中的觀點,提高所提取觀點的正確率,完整程度W及實用性。
[0034] 在介紹了本發(fā)明的基本原理之后,下面具體介紹本發(fā)明的各種非限制性實施方 式。
[00巧]麻用場景總哈
[0036] 首先參考圖1,圖1為本發(fā)明的實施方式的一個示例性應用場景的框架示意圖。虛 擬社區(qū)的存儲設備,用于存儲有所有評語的原始數(shù)據(jù)。虛擬社區(qū)的評語捜索設備,W評價對 象為關鍵詞,從虛擬社區(qū)的存儲設備存儲的評語中檢索針對評價對象的評語,并將針對評 價對象的評語輸出至虛擬社區(qū)的提取觀點設備。虛擬社區(qū)的觀點設備,按照本發(fā)明所提供 的提取觀點的方法提取對所述評價對象或預設的所述評價對象的屬性的評價觀點。
[0037] 圖2為本發(fā)明的實施方式一個示例性應用場景提取的評價觀點的結果示意圖。從 針對天氣的320條評語中,提取出5條關于"天氣變化快"的評價觀點,還提取出5條關于 "天氣變化大"的評價觀點。
[003引"天氣變化快"的評價觀點對應的原始的評語為:
[0039]
[0040] "天氣變it大"的評價觀點對應的原始的評語為: '
[0041]
[0042] 需要注意的是,本發(fā)明所提供的提取觀點的方法可W應用在客戶端,也可W應用 在服務器。此處的客戶端可W是現(xiàn)有的、正在研發(fā)的或將來研發(fā)的、能夠通過任何形式的
當前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1