一種數(shù)據(jù)處理方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及數(shù)據(jù)處理技術(shù)領(lǐng)域,特別是設(shè)及一種數(shù)據(jù)處理方法和裝置。
【背景技術(shù)】
[0002] 多個數(shù)據(jù)源頭(如:影視大全、豆瓣、格瓦拉、萬達等)存儲的數(shù)據(jù)可能存在交集, 很多情況下需要對存在交集的數(shù)據(jù)進行篩選與合并,W對存儲空間進行有效利用,提升各 數(shù)據(jù)源頭存儲空間的有效利用率。
[0003] 目前,在對多個數(shù)據(jù)源頭的影視數(shù)據(jù)進行數(shù)據(jù)合并時,需要對各數(shù)據(jù)源頭中存儲 的所有的數(shù)據(jù)進行相互匹配,W找到相同的影視數(shù)據(jù),從而進行合并操作。常規(guī)的對各數(shù)據(jù) 源頭中存儲的數(shù)據(jù)進行匹配的方式為:確定一個數(shù)據(jù)源頭中的存儲的一段影視數(shù)據(jù)為待匹 配的影視數(shù)據(jù),將確定的該段待匹配的影視數(shù)據(jù)分別與同一數(shù)據(jù)源頭W及其它數(shù)據(jù)源頭中 存儲的各段影視數(shù)據(jù)進行兩兩匹配,最終確定出與當前待匹配的影視數(shù)據(jù)相匹配的影視數(shù) 據(jù)。重復(fù)上述方式,分別對各數(shù)據(jù)源頭中存儲的各段影視數(shù)據(jù)進行處理,W分別篩選出各段 影視數(shù)據(jù)相匹配的影視數(shù)據(jù)。
[0004] 現(xiàn)有的運種直接對所有的數(shù)據(jù)進行兩兩匹配、合并的方式所占用時間的復(fù)雜度為 0 (n2),整個計算過程所占用的時間長。
【發(fā)明內(nèi)容】
陽〇化]鑒于上述現(xiàn)有的數(shù)據(jù)匹配、合并方法進行數(shù)據(jù)合并占用時間長的問題,提出了本 發(fā)明W便提供一種克服上述問題或者至少部分地解決上述問題的數(shù)據(jù)處理方法和裝置。
[0006] 依據(jù)本發(fā)明的一個方面,提供了一種數(shù)據(jù)處理方法,包括:對各數(shù)據(jù)源中存儲的數(shù) 據(jù)按照第一設(shè)定關(guān)鍵詞組進行投影,W獲得與各設(shè)定關(guān)鍵詞相匹配的數(shù)據(jù)組;針對每個數(shù) 據(jù)組分別判斷存儲的數(shù)據(jù)中是否存在兩兩匹配的數(shù)據(jù);當存在兩兩匹配的數(shù)據(jù)時,將兩兩 匹配的數(shù)據(jù)進行合并生成匹配后的數(shù)據(jù)組;將匹配后的全部數(shù)據(jù)組中存儲的數(shù)據(jù)組合成第 一數(shù)據(jù)集合。
[0007] 優(yōu)選地,在所述將匹配后的全部數(shù)據(jù)組中存儲的數(shù)據(jù)組合成一個數(shù)據(jù)集合的步驟 之后,所述方法還包括:對組合后的所述數(shù)據(jù)集合中存儲的數(shù)據(jù)按照第二設(shè)定關(guān)鍵詞組進 行投影,W獲得與各設(shè)定關(guān)鍵詞相匹配的數(shù)據(jù)組;針對每個數(shù)據(jù)組分別判斷存儲的數(shù)據(jù)中 是否存在兩兩匹配的數(shù)據(jù);當存在兩兩匹配的數(shù)據(jù)時,將兩兩匹配的數(shù)據(jù)進行合并生成匹 配后的數(shù)據(jù)組;將匹配后的全部數(shù)據(jù)組中存儲的數(shù)據(jù)組合成第二數(shù)據(jù)集合。
[0008] 優(yōu)選地,所述針對每個數(shù)據(jù)組分別判斷存儲的數(shù)據(jù)中是否存在兩兩匹配的數(shù)據(jù)的 步驟包括:針對當前數(shù)據(jù)組判斷存儲的數(shù)據(jù)中是否存在兩兩匹配的數(shù)據(jù)時:判斷當前數(shù)據(jù) 組中是否存儲有至少兩段數(shù)據(jù);若是,則判斷存儲的數(shù)據(jù)中是否存在兩兩匹配的數(shù)據(jù)。
[0009] 優(yōu)選地,所述數(shù)據(jù)源為影視數(shù)據(jù)存儲源;所述第一設(shè)定關(guān)鍵詞組為主電影名的前 兩個字,所述第二設(shè)定關(guān)鍵詞組為導(dǎo)演名。
[0010] 依據(jù)本發(fā)明的一個方面,還提供了一種數(shù)據(jù)處理裝置,其特征在于,包括:第一分 組模塊,用于對各數(shù)據(jù)源中存儲的數(shù)據(jù)按照第一設(shè)定關(guān)鍵詞組進行投影,w獲得與各設(shè)定 關(guān)鍵詞相匹配的數(shù)據(jù)組;第一合并模塊,用于針對每個數(shù)據(jù)組分別判斷存儲的數(shù)據(jù)中是否 存在兩兩匹配的數(shù)據(jù);當存在兩兩匹配的數(shù)據(jù)時,將兩兩匹配的數(shù)據(jù)進行合并生成匹配后 的數(shù)據(jù)組;第一組合模塊,用于將匹配后的全部數(shù)據(jù)組中存儲的數(shù)據(jù)組合成第一數(shù)據(jù)集合。
[0011] 優(yōu)選地,所述裝置還包括:第二分組模塊,用于在所述第一組合模塊將匹配后的全 部數(shù)據(jù)組中存儲的數(shù)據(jù)組合成一個數(shù)據(jù)集合之后,對組合后的所述數(shù)據(jù)集合中存儲的數(shù)據(jù) 按照第二設(shè)定關(guān)鍵詞組進行投影,W獲得與各設(shè)定關(guān)鍵詞相匹配的數(shù)據(jù)組;第二合并模塊, 用于針對每個數(shù)據(jù)組分別判斷存儲的數(shù)據(jù)中是否存在兩兩匹配的數(shù)據(jù);當存在兩兩匹配的 數(shù)據(jù)時,將兩兩匹配的數(shù)據(jù)進行合并生成匹配后的數(shù)據(jù)組;第二組合模塊,用于將匹配后的 全部數(shù)據(jù)組中存儲的數(shù)據(jù)組合成第二數(shù)據(jù)集合。
[0012] 優(yōu)選地,所述第一合并模塊針對每個數(shù)據(jù)組分別判斷存儲的數(shù)據(jù)中是否存在兩兩 匹配的數(shù)據(jù),針對當前數(shù)據(jù)組判斷存儲的數(shù)據(jù)中是否存在兩兩匹配的數(shù)據(jù)時:判斷當前數(shù) 據(jù)組中是否存儲有至少兩段數(shù)據(jù);若是,則判斷存儲的數(shù)據(jù)中是否存在兩兩匹配的數(shù)據(jù)。
[0013] 優(yōu)選地,所述數(shù)據(jù)源為影視數(shù)據(jù)存儲源;所述第一設(shè)定關(guān)鍵詞組為主電影名的前 兩個字,所述第二設(shè)定關(guān)鍵詞組為導(dǎo)演名。
[0014] 與現(xiàn)有技術(shù)相比,本發(fā)明具有W下優(yōu)點:
[0015] 本發(fā)明實施例提供的數(shù)據(jù)處理方案,將各數(shù)據(jù)源中的數(shù)據(jù)首先按照設(shè)定關(guān)鍵詞組 進行投影成多個數(shù)據(jù)組,然后將投影后的各數(shù)據(jù)組分別進行兩兩匹配、合并。相較于現(xiàn)有的 直接將各數(shù)據(jù)源中存儲的數(shù)據(jù)進行兩兩匹配、合并的數(shù)據(jù)處理方案,大大縮短了數(shù)據(jù)處理 時間。
[0016] 上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段, 而可依照說明書的內(nèi)容予W實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠 更明顯易懂,W下特舉本發(fā)明的【具體實施方式】。
【附圖說明】
[0017] 通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通 技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明 的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0018] 圖1是根據(jù)本發(fā)明實施例一的一種數(shù)據(jù)處理方法的步驟流程圖;
[0019] 圖2是根據(jù)本發(fā)明實施例二的一種數(shù)據(jù)處理方法的步驟流程圖;
[0020] 圖3是采用實施例二中所述的方法進行數(shù)據(jù)處理的流程示意圖;
[0021] 圖4是根據(jù)本發(fā)明實施例=的一種數(shù)據(jù)處理裝置的結(jié)構(gòu)框圖。
【具體實施方式】
[0022] 下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開 的示例性實施例,然而應(yīng)當理解,可各種形式實現(xiàn)本公開而不應(yīng)被運里闡述的實施例 所限制。相反,提供運些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍 完整的傳達給本領(lǐng)域的技術(shù)人員。 W23] 實施例一
[0024] 參照圖1,示出了本發(fā)明實施例一的一種數(shù)據(jù)處理方法的步驟流程圖。
[0025] 本發(fā)明實施例的數(shù)據(jù)處理方法包括W下步驟:
[00%] 步驟S102 :對各數(shù)據(jù)源中存儲的數(shù)據(jù)按照第一設(shè)定關(guān)鍵詞組進行投影,W獲得與 各設(shè)定關(guān)鍵詞相匹配的數(shù)據(jù)組。
[0027] 其中,第一設(shè)定關(guān)鍵詞組可W由本領(lǐng)域技術(shù)人員根據(jù)實際需求進行設(shè)置。例如:可 W設(shè)置成一組電影名稱,還可W設(shè)定成多個電影的第一導(dǎo)演的姓名。
[0028] 例如:第一關(guān)鍵詞組為A、B、C和D,各數(shù)據(jù)源中存儲的數(shù)據(jù)為1、2、3、4、5、6、7和8。 其中,1和2與關(guān)鍵詞A匹配,3和4與關(guān)鍵詞B匹配,5和6與關(guān)鍵詞C匹配,7和8與關(guān)鍵 詞D匹配,在按照第一關(guān)鍵詞組進行投影時,將1、2投影至一個數(shù)據(jù)組,將2、3投影至一個 數(shù)據(jù)組,將4、5投影至一個數(shù)據(jù)組,將6、7投影至一個數(shù)據(jù)組。
[0029] 步驟S104 :針對每個數(shù)據(jù)組分別判斷存儲的數(shù)據(jù)中是否存在兩兩匹配的數(shù)據(jù);當 存在兩兩匹配的數(shù)據(jù)時,將兩兩匹配的數(shù)據(jù)進行合并生成匹配后的數(shù)據(jù)組。
[0030] 例如通過步驟S102將所有待處理的數(shù)據(jù)分成了A、B和CS個數(shù)據(jù)組,則在本步驟 中,分別對=個數(shù)據(jù)組中的數(shù)據(jù)進行兩兩匹配并合并。
[0031] 具體地,對各數(shù)據(jù)組中的數(shù)據(jù)進行兩兩匹配并合時可W參見相關(guān)技術(shù),本發(fā)明實 施例對此不作具體限制。
[0032] 步驟S106:將匹配后的全部數(shù)據(jù)組中存儲的數(shù)據(jù)組合成第一數(shù)據(jù)集合。
[0033] 通過本發(fā)明實施例提供的數(shù)據(jù)處理方法,將各數(shù)據(jù)源中的數(shù)據(jù)首先按照設(shè)定關(guān)鍵 詞組進行投影成多個數(shù)據(jù)組,然后將投影后的各數(shù)據(jù)組分別進行兩兩匹配合并,相較于現(xiàn) 有的直接將各數(shù)據(jù)源中存儲的數(shù)據(jù)進行兩兩合并的數(shù)據(jù)處理方法,大大縮短了數(shù)據(jù)處理時 間。
[0034] 實施例二
[0035] 參照圖2,示出了本發(fā)明實施例二的一種數(shù)據(jù)處理方法的步驟流程圖。
[0036] 本發(fā)明實施例的數(shù)據(jù)處理方法具體包括W下步驟:
[0037] 步驟S202 :處理裝置對各數(shù)據(jù)源中存儲的數(shù)據(jù)按照第一設(shè)定關(guān)鍵詞組進行投影, W獲得與各設(shè)定關(guān)鍵詞相匹配的數(shù)據(jù)組。
[0038] 其中,處理裝置可W是計算機、服務(wù)器等具有運算功能的設(shè)備。
[0039] 需要說明的是,本發(fā)