本公開(kāi)涉及電子技術(shù)領(lǐng)域,尤其涉及一種電子書(shū)轉(zhuǎn)換處理方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù):
近年來(lái)文字識(shí)別技術(shù)不斷發(fā)展,得到了越來(lái)越廣泛的應(yīng)用。
對(duì)于紙質(zhì)書(shū),通過(guò)拍照、攝影、掃描等方式,可將紙質(zhì)書(shū)轉(zhuǎn)換為圖片;然后再通過(guò)文字識(shí)別,識(shí)別出圖片中的文字,從而將紙質(zhì)書(shū)轉(zhuǎn)換為電子書(shū)。
相關(guān)技術(shù)中,當(dāng)僅需轉(zhuǎn)換紙質(zhì)書(shū)的部分內(nèi)容(例如,帶標(biāo)記的內(nèi)容)為電子書(shū)時(shí),得到的電子書(shū)為內(nèi)容片段,內(nèi)容片段所屬的章、節(jié)、段落等結(jié)構(gòu)層次信息會(huì)丟失。
技術(shù)實(shí)現(xiàn)要素:
為克服相關(guān)技術(shù)中存在的問(wèn)題,本公開(kāi)提供一種電子書(shū)轉(zhuǎn)換處理方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
根據(jù)本公開(kāi)實(shí)施例的第一方面,提供一種電子書(shū)轉(zhuǎn)換處理方法,包括:獲取目標(biāo)紙質(zhì)書(shū)的目標(biāo)圖像;
對(duì)所述目標(biāo)圖像進(jìn)行圖像識(shí)別,得到電子文本信息;
通過(guò)分析所述電子文本信息,確定所述電子文本信息的文本結(jié)構(gòu)信息;
根據(jù)所述電子文本信息和所述文本結(jié)構(gòu)信息,生成針對(duì)所述目標(biāo)紙質(zhì)書(shū)的電子書(shū)。
優(yōu)選地,所述通過(guò)分析所述電子文本信息,確定所述電子文本信息的文本結(jié)構(gòu)信息,包括:
獲取所述電子文本信息對(duì)應(yīng)的文本格式,其中,所述文本格式包括字體、字號(hào)、行距、是否加粗和段落格式中的一者或多者;以及
根據(jù)預(yù)設(shè)文本結(jié)構(gòu)分類(lèi)模型和所述文本格式,確定所述電子文本信息的文本結(jié)構(gòu)信息。
優(yōu)選地,在所述根據(jù)預(yù)設(shè)文本結(jié)構(gòu)分類(lèi)模型和識(shí)別出的文字的文本格式,確定所述電子文本信息的文本結(jié)構(gòu)信息之前,所述方法還包括:
獲取訓(xùn)練樣本集,所述訓(xùn)練樣本集中包括:所述目標(biāo)紙質(zhì)書(shū)的圖像數(shù)據(jù)和所述圖像數(shù)據(jù)所對(duì)應(yīng)的文本結(jié)構(gòu)信息;
利用訓(xùn)練樣本集對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,獲得卷積神經(jīng)網(wǎng)絡(luò)的各層參數(shù)信息;
根據(jù)所述各層參數(shù)信息構(gòu)建所述預(yù)設(shè)文本結(jié)構(gòu)分類(lèi)模型。
優(yōu)選地,所述方法還包括:
獲取所述電子文本信息中的筆記部分;
將所述筆記部分以及所述筆記部分所對(duì)應(yīng)的文本結(jié)構(gòu)信息關(guān)聯(lián)存儲(chǔ);以及
當(dāng)滿(mǎn)足預(yù)設(shè)條件時(shí),顯示所述筆記部分以及所述筆記部分所對(duì)應(yīng)的文本結(jié)構(gòu)信息。
根據(jù)本公開(kāi)實(shí)施例的第二方面,提供一種電子書(shū)轉(zhuǎn)換處理裝置,包括:
目標(biāo)圖像獲取模塊,被配置為獲取目標(biāo)紙質(zhì)書(shū)的目標(biāo)圖像;
電子文本信息獲取模塊,被配置為對(duì)所述目標(biāo)圖像進(jìn)行圖像識(shí)別,得到電子文本信息;
結(jié)構(gòu)信息確定模塊,被配置為通過(guò)分析所述電子文本信息,確定所述電子文本信息的文本結(jié)構(gòu)信息;
電子書(shū)生成模塊,被配置為根據(jù)所述電子文本信息和所述文本結(jié)構(gòu)信息,生成針對(duì)所述目標(biāo)紙質(zhì)書(shū)的電子書(shū)。
優(yōu)選地,所述結(jié)構(gòu)信息確定模塊包括:
文本格式獲取子模塊,被配置為獲取所述電子文本信息對(duì)應(yīng)的文本格式,其中,所述文本格式包括字體、字號(hào)、行距、是否加粗和段落格式中的一者或多者;以及
結(jié)構(gòu)信息確定子模塊,被配置為根據(jù)預(yù)設(shè)文本結(jié)構(gòu)分類(lèi)模型和所述文本格式,確定所述電子文本信息的文本結(jié)構(gòu)信息。
優(yōu)選地,所述裝置還包括:
訓(xùn)練樣本集獲取模塊,被配置為獲取訓(xùn)練樣本集,所述訓(xùn)練樣本集中包括:所述目標(biāo)紙質(zhì)書(shū)的圖像數(shù)據(jù)和所述圖像數(shù)據(jù)所對(duì)應(yīng)的文本結(jié)構(gòu)信息;
參數(shù)信息獲取模塊,被配置為利用訓(xùn)練樣本集對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,獲得卷積神經(jīng)網(wǎng)絡(luò)的各層參數(shù)信息;
預(yù)設(shè)分類(lèi)模型構(gòu)建模塊,被配置為根據(jù)所述各層參數(shù)信息構(gòu)建所述預(yù)設(shè)文本結(jié)構(gòu)分類(lèi)模型。
優(yōu)選地,所述裝置還包括:
筆記獲取模塊,被配置為獲取所述電子文本信息中的筆記部分;
存儲(chǔ)模塊,被配置為將所述筆記部分以及所述筆記部分所對(duì)應(yīng)的文本結(jié)構(gòu)信息關(guān)聯(lián)存儲(chǔ);以及
顯示模塊,被配置為在滿(mǎn)足預(yù)設(shè)條件時(shí),顯示所述筆記部分以及所述筆記部分所對(duì)應(yīng)的文本結(jié)構(gòu)信息。
根據(jù)本公開(kāi)實(shí)施例的第三方面,提供一種電子書(shū)轉(zhuǎn)換處理裝置,包括:
處理器;用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
其中,所述處理器被配置為:獲取目標(biāo)紙質(zhì)書(shū)的目標(biāo)圖像;對(duì)所述目標(biāo)圖像進(jìn)行圖像識(shí)別,得到電子文本信息;通過(guò)分析所述電子文本信息,確定所述電子文本信息的文本結(jié)構(gòu)信息;根據(jù)所述電子文本信息和所述文本結(jié)構(gòu)信息,生成針對(duì)所述目標(biāo)紙質(zhì)書(shū)的電子書(shū)。
根據(jù)本公開(kāi)實(shí)施例的第四方面,提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序指令,該程序指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)本公開(kāi)第一方面所提供的電子書(shū)轉(zhuǎn)換處理方法的步驟。
本公開(kāi)的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:在將目標(biāo)紙質(zhì)書(shū)轉(zhuǎn)換為電子書(shū)時(shí),可保留文本結(jié)構(gòu)信息,使得將紙質(zhì)書(shū)轉(zhuǎn)換為電子書(shū)時(shí),不會(huì)丟失其結(jié)構(gòu)層次信息;且無(wú)需進(jìn)行人工轉(zhuǎn)換。
應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開(kāi)。
附圖說(shuō)明
此處的附圖被并入說(shuō)明書(shū)中并構(gòu)成本說(shuō)明書(shū)的一部分,示出了符合本公開(kāi)的實(shí)施例,并與說(shuō)明書(shū)一起用于解釋本公開(kāi)的原理。
圖1是根據(jù)一示例性實(shí)施例示出的一種電子書(shū)轉(zhuǎn)換處理方法的流程圖。
圖2是本公開(kāi)一實(shí)施例中獲取文本結(jié)構(gòu)信息的流程示意圖。
圖3是本公開(kāi)的一實(shí)施例中,當(dāng)目標(biāo)圖像中的文字均屬于正文文本時(shí)的處理流程示意圖。
圖4是本公開(kāi)一實(shí)施例進(jìn)行訓(xùn)練獲得預(yù)設(shè)文本結(jié)構(gòu)分類(lèi)模型的流程示意圖。
圖5是本公開(kāi)一實(shí)施例對(duì)訓(xùn)練好的預(yù)設(shè)文本結(jié)構(gòu)分類(lèi)模型進(jìn)行測(cè)試的流程示意圖。
圖6是本公開(kāi)一實(shí)施例中對(duì)筆記部分進(jìn)行電子書(shū)轉(zhuǎn)換的流程示意圖。
圖7是本公開(kāi)一實(shí)施例的對(duì)筆記部分和筆記部分所對(duì)應(yīng)的文件結(jié)構(gòu)信息進(jìn)行顯示的效果示意圖。
圖8是根據(jù)一示例性實(shí)施例示出的一種電子書(shū)轉(zhuǎn)換處理裝置的框圖。
圖9是根據(jù)一示例性實(shí)施例示出的一種用于電子書(shū)轉(zhuǎn)換處理方法的裝置的框圖。
具體實(shí)施方式
這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說(shuō)明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本公開(kāi)相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書(shū)中所詳述的、本公開(kāi)的一些方面相一致的裝置和方法的例子。
圖1是根據(jù)一示例性實(shí)施例示出的一種電子書(shū)轉(zhuǎn)換處理方法的流程圖,如圖1所示,該電子書(shū)轉(zhuǎn)換處理方法用于終端中,包括以下步驟:
在步驟s11中,獲取目標(biāo)紙質(zhì)書(shū)的目標(biāo)圖像。目標(biāo)圖像可包括正文圖像和筆記圖像。
用戶(hù)閱讀紙質(zhì)書(shū)時(shí),可在紙質(zhì)書(shū)上通過(guò)劃線(xiàn)、圖形標(biāo)注、手寫(xiě)筆記等做筆記。當(dāng)需要將紙質(zhì)書(shū)的某些部分(例如,帶標(biāo)記的字、詞、句子、段落或章節(jié)等)轉(zhuǎn)換為電子書(shū)時(shí),通過(guò)圖像采集裝置對(duì)包含目標(biāo)紙質(zhì)書(shū)進(jìn)行圖像采集,獲得目標(biāo)圖像。
在本公開(kāi)的實(shí)施例中,圖像采集裝置可為相機(jī)、掃描儀、手機(jī)等。對(duì)目標(biāo)紙質(zhì)書(shū)進(jìn)行圖像采集,即通過(guò)圖像采集裝置對(duì)目標(biāo)紙質(zhì)書(shū)進(jìn)行拍攝或掃描,得到目標(biāo)圖像。
在步驟s12中,對(duì)目標(biāo)圖像進(jìn)行圖像識(shí)別,得到電子文本信息。
通過(guò)對(duì)目標(biāo)圖像進(jìn)行圖像識(shí)別,識(shí)別目標(biāo)圖像中的文字,得到電子文本信息,電子文本信息至少包括文字及文字的文本格式。文本格式包括字體、字號(hào)、行距、是否加粗和段落格式中的一者或多者。
在本公開(kāi)的一實(shí)施例中,可通過(guò)對(duì)目標(biāo)圖像進(jìn)行預(yù)處理(例如,對(duì)目標(biāo)圖像進(jìn)行灰度化、降噪、二值化、字符切分以及歸一化等等),以及對(duì)預(yù)處理后的目標(biāo)圖像進(jìn)行特征提取和降維處理后,進(jìn)行文字識(shí)別和文本格式識(shí)別。
在一個(gè)實(shí)施例中,為了提高文字識(shí)別的準(zhǔn)確率,獲得文字識(shí)別結(jié)果后,再對(duì)文字識(shí)別結(jié)果進(jìn)行優(yōu)化,以對(duì)文字識(shí)別結(jié)果進(jìn)行校正。對(duì)文字識(shí)別結(jié)果進(jìn)行校正可通過(guò)語(yǔ)言模型來(lái)進(jìn)行校正,以糾正識(shí)別錯(cuò)誤的文字。
在步驟s13中,通過(guò)分析電子文本信息,確定電子文本信息的文本結(jié)構(gòu)信息。
文本結(jié)構(gòu)信息至少包括以下信息中的一者或多者:所屬部分、所屬章、所屬節(jié)和所屬頁(yè)。
參見(jiàn)圖2,在本公開(kāi)的一實(shí)施例中,通過(guò)以下方式獲取文本結(jié)構(gòu)信息:
在步驟s21中,獲取電子文本信息對(duì)應(yīng)的文本格式。
在步驟s22中,根據(jù)預(yù)設(shè)文本結(jié)構(gòu)分類(lèi)模型和文本格式,確定電子文本信息的文本結(jié)構(gòu)信息。
在本公開(kāi)的實(shí)施例中,通過(guò)對(duì)訓(xùn)練樣本集進(jìn)行訓(xùn)練得到預(yù)設(shè)文本結(jié)構(gòu)分類(lèi)模型,由此,可對(duì)文本結(jié)構(gòu)信息進(jìn)行識(shí)別。
應(yīng)理解,根據(jù)紙質(zhì)書(shū)排版格式的不同,文本結(jié)構(gòu)信息可以不同的方式被識(shí)別出。例如,對(duì)于一些排版格式,所屬部分、所屬章和所屬頁(yè)均可從頁(yè)眉、頁(yè)腳等信息中識(shí)別出;而所屬節(jié)可從正文部分,根據(jù)文本格式識(shí)別出。通過(guò)對(duì)預(yù)設(shè)文本結(jié)構(gòu)分類(lèi)模型進(jìn)行訓(xùn)練,可實(shí)現(xiàn)準(zhǔn)確的對(duì)文本結(jié)構(gòu)信息進(jìn)行識(shí)別。預(yù)設(shè)文本結(jié)構(gòu)分類(lèi)模型的獲取將在后續(xù)進(jìn)行詳細(xì)介紹。
在步驟s14中,根據(jù)電子文本信息和文本結(jié)構(gòu)信息,生成針對(duì)目標(biāo)紙質(zhì)書(shū)的電子書(shū)。
由此,本公開(kāi)實(shí)施例的電子書(shū)轉(zhuǎn)換處理方法,在將目標(biāo)紙質(zhì)書(shū)轉(zhuǎn)換為電子書(shū)時(shí),可保留文本結(jié)構(gòu)信息,使得將紙質(zhì)書(shū)轉(zhuǎn)換為電子書(shū)時(shí),不會(huì)丟失其結(jié)構(gòu)層次信息;且無(wú)需進(jìn)行人工轉(zhuǎn)換。
參見(jiàn)圖3,在本公開(kāi)的一實(shí)施例中,當(dāng)目標(biāo)圖像中的文字均屬于正文文本,不包含可反應(yīng)文本結(jié)構(gòu)信息的文字時(shí):
在步驟s31中,采集目標(biāo)圖像所在頁(yè)的前一頁(yè)紙質(zhì)書(shū)圖像。
在步驟s32中,對(duì)采集的紙質(zhì)書(shū)圖像的文本結(jié)構(gòu)信息進(jìn)行識(shí)別。
在步驟s33中,若識(shí)別到文本結(jié)構(gòu)信息時(shí),將該頁(yè)最后的文本結(jié)構(gòu)信息作為目標(biāo)圖像的文本結(jié)構(gòu)信息;若未識(shí)別到文本結(jié)構(gòu)信息,則繼續(xù)采集目標(biāo)圖像前面頁(yè)的紙質(zhì)書(shū)圖像,直到識(shí)別到文本結(jié)構(gòu)信息。
由此,可快速實(shí)現(xiàn)目標(biāo)圖像文字所屬文本結(jié)構(gòu)信息的獲取,且保證識(shí)別成功率。
參見(jiàn)圖4,為本公開(kāi)一實(shí)施例進(jìn)行訓(xùn)練獲得預(yù)設(shè)文本結(jié)構(gòu)分類(lèi)模型的流程示意圖。
在步驟s41中,獲取訓(xùn)練樣本集。
在本公開(kāi)的實(shí)施例中,通過(guò)圖像采集裝置對(duì)紙質(zhì)書(shū)進(jìn)行拍攝或掃描獲取紙質(zhì)書(shū)的圖像數(shù)據(jù)。應(yīng)理解,為了提高識(shí)別的準(zhǔn)確率,訓(xùn)練樣本所采用的紙質(zhì)書(shū)可與目標(biāo)紙質(zhì)書(shū)相同;此外,也可從同一出版社的紙質(zhì)書(shū)、同一類(lèi)別的紙質(zhì)書(shū)或同一紙質(zhì)書(shū)的不同版本中獲取訓(xùn)練樣本。
在一個(gè)實(shí)施例中,獲取到紙質(zhì)書(shū)的圖像數(shù)據(jù)后,對(duì)圖像進(jìn)行預(yù)處理、文字識(shí)別和優(yōu)化。預(yù)處理即將采集到的圖像進(jìn)行灰度化、降噪、二值化、字符切分以及歸一化等等。
由此,可獲得訓(xùn)練樣本集,訓(xùn)練樣本集包括多個(gè)向量對(duì)(y,p),其中,y為紙質(zhì)書(shū)的圖片經(jīng)預(yù)處理后的圖像數(shù)據(jù),p為圖像數(shù)據(jù)所對(duì)應(yīng)的文本結(jié)構(gòu)信息。應(yīng)理解,圖像數(shù)據(jù)所對(duì)應(yīng)的文本結(jié)構(gòu)信息可預(yù)置。
在步驟s42中,利用訓(xùn)練樣本集對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,獲得卷積神經(jīng)網(wǎng)絡(luò)的各層參數(shù)信息。
對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練時(shí),在向前傳播階段,將訓(xùn)練樣本集中的向量對(duì)中的紙質(zhì)書(shū)的圖像數(shù)據(jù)y輸入網(wǎng)絡(luò),計(jì)算相應(yīng)的實(shí)際輸出。
在卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的向后傳播階段,根據(jù)實(shí)際輸出與相應(yīng)的理想輸出p,調(diào)整卷積層、池化層和全連接層的權(quán)值和偏置,使得實(shí)際輸出與理想輸出的偏差最小。
各層參數(shù)信息包括卷積神經(jīng)網(wǎng)絡(luò)的卷積層、池化層和全連接層的權(quán)值和偏置。
在步驟s43中,根據(jù)各層參數(shù)信息構(gòu)建預(yù)設(shè)文本結(jié)構(gòu)分類(lèi)模型。
為了保證預(yù)設(shè)文本結(jié)構(gòu)分類(lèi)模型的分類(lèi)效果,參見(jiàn)圖5為本公開(kāi)一實(shí)施例對(duì)訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行測(cè)試的流程示意圖。
在步驟s51中,獲取測(cè)試樣本集,測(cè)試樣本集中包括待識(shí)別紙質(zhì)書(shū)的圖像數(shù)據(jù)。
待識(shí)別紙質(zhì)書(shū)的圖像數(shù)據(jù)可為圖像采集裝置100采集,并按照上述的預(yù)處理進(jìn)行處理后的圖像數(shù)據(jù)。應(yīng)理解,這里的待識(shí)別紙質(zhì)書(shū)可為目標(biāo)紙質(zhì)書(shū)。
在步驟s52中,將測(cè)試樣本集中的待識(shí)別紙質(zhì)書(shū)的圖像數(shù)據(jù)輸入通過(guò)各層參數(shù)信息構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)中,識(shí)別待識(shí)別紙質(zhì)書(shū)的文本結(jié)構(gòu)信息。
在步驟s53中,當(dāng)獲取到的待識(shí)別紙質(zhì)書(shū)的文本結(jié)構(gòu)信息不滿(mǎn)足預(yù)設(shè)條件時(shí),根據(jù)訓(xùn)練樣本集,對(duì)卷積神經(jīng)網(wǎng)絡(luò)重新進(jìn)行訓(xùn)練,以更新各層參數(shù)信息。
預(yù)設(shè)條件可為:識(shí)別出的待識(shí)別紙質(zhì)書(shū)的文本結(jié)構(gòu)信息與實(shí)際的文本結(jié)構(gòu)信息相一致或誤差最小化。
參見(jiàn)圖6,在本公開(kāi)的一實(shí)施例中,對(duì)于用戶(hù)在紙質(zhì)書(shū)上進(jìn)行劃線(xiàn)、圖形標(biāo)注(例如,畫(huà)圈、化括號(hào)等)、手寫(xiě)筆記等進(jìn)行筆記產(chǎn)生的筆記部分,通過(guò)以下步驟可將筆記部分以及筆記部分所對(duì)應(yīng)的文本結(jié)構(gòu)信息轉(zhuǎn)換為電子書(shū):
在步驟s61中,獲取電子文本信息中的筆記部分。
在步驟s62中,將筆記部分以及筆記部分所對(duì)應(yīng)的文本結(jié)構(gòu)信息關(guān)聯(lián)存儲(chǔ)。由此,可得到筆記部分的帶文本結(jié)構(gòu)信息的電子書(shū)。
在步驟s63中,當(dāng)滿(mǎn)足預(yù)設(shè)條件時(shí),顯示筆記部分以及筆記部分所對(duì)應(yīng)的文本結(jié)構(gòu)信息。預(yù)設(shè)條件可為用戶(hù)選擇筆記部分進(jìn)行顯示,或其它條件。
在本公開(kāi)的一實(shí)施例中,由于目標(biāo)圖像所對(duì)應(yīng)的電子文本信息所對(duì)應(yīng)的文本結(jié)構(gòu)信息可按照上述實(shí)施例確定,由此,將筆記部分與確定了文本結(jié)構(gòu)信息的電子文本信息進(jìn)行匹配,即可得到筆記部分的文本結(jié)構(gòu)信息。例如,將筆記部分與確定了文本結(jié)構(gòu)的電子文本信息進(jìn)行比較,若連續(xù)預(yù)設(shè)個(gè)數(shù)(例如,20或20以上)的文字都相同,則匹配結(jié)果為匹配。
當(dāng)匹配結(jié)果為匹配時(shí),筆記部分的文本結(jié)構(gòu)信息和確定了文本結(jié)構(gòu)的電子文本信息相同。
本公開(kāi)該實(shí)施例的電子書(shū)轉(zhuǎn)換處理方法,可獲得筆記部分的文本結(jié)構(gòu)信息,使得將筆記部分轉(zhuǎn)換為電子書(shū)時(shí),不會(huì)丟失其文本結(jié)構(gòu)信息;另一方面,可根據(jù)筆記部分的文本結(jié)構(gòu)信息進(jìn)行顯示,既方便用戶(hù)查閱,又可去掉不需要的額外文字信息。
在本公開(kāi)的一實(shí)施例中,將電子文本信息和電子文本信息所對(duì)應(yīng)的文本結(jié)構(gòu)信息關(guān)聯(lián)存儲(chǔ),獲取文本索引信息。文本結(jié)構(gòu)信息包括:正文結(jié)構(gòu)信息和筆記結(jié)構(gòu)信息,相應(yīng)的文本索引信息包括正文索引信息和筆記索引信息。其中,正文索引信息用于基于正文結(jié)構(gòu)信息定位電子書(shū)中的正文部分,筆記索引信息用于基于筆記結(jié)構(gòu)信息定位電子書(shū)中的筆記部分。應(yīng)理解,正文索引信息和筆記索引信息還可合成為一個(gè)總索引。
參見(jiàn)圖7,在本公開(kāi)的一實(shí)施例中,根據(jù)上述實(shí)施例的方法,可獲得筆記部分以及筆記部分對(duì)應(yīng)的文件結(jié)構(gòu)信息,以及將筆記部分以及筆記部分所對(duì)應(yīng)的文本結(jié)構(gòu)信息進(jìn)行存儲(chǔ)。當(dāng)用戶(hù)想閱讀筆記部分時(shí),顯示筆記部分,以及筆記部分對(duì)應(yīng)的文件結(jié)構(gòu)信息。
本公開(kāi)實(shí)施例的電子書(shū)轉(zhuǎn)換處理方法,通過(guò)機(jī)器學(xué)習(xí),在識(shí)別目標(biāo)紙質(zhì)書(shū)的文字的同時(shí),也識(shí)別文字的文本結(jié)構(gòu)信息,將文字和文本結(jié)構(gòu)信息對(duì)應(yīng)起來(lái)。在一個(gè)實(shí)施例中,在識(shí)別出文字和文字的文本結(jié)構(gòu)信息后,進(jìn)行文本編輯,得到包含文字和文字所屬的文本結(jié)構(gòu)信息的文本。
在另一些實(shí)施例中,識(shí)別出文字和文字的文本結(jié)構(gòu)信息后,即將文字插入其所屬的文本結(jié)構(gòu)中,得到包含文字和文本結(jié)構(gòu)信息的電子書(shū)。
圖8是根據(jù)一示例性實(shí)施例示出的一種電子書(shū)轉(zhuǎn)換處理裝置的框圖。該裝置800包括:
目標(biāo)圖像獲取模塊801,被配置為獲取目標(biāo)紙質(zhì)書(shū)的目標(biāo)圖像;
電子文本信息獲取模塊802,被配置為對(duì)所述目標(biāo)圖像進(jìn)行圖像識(shí)別,得到電子文本信息;
結(jié)構(gòu)信息確定模塊803,被配置為通過(guò)分析所述電子文本信息,確定所述電子文本信息的文本結(jié)構(gòu)信息;
電子書(shū)生成模塊804,被配置為根據(jù)所述電子文本信息和所述文本結(jié)構(gòu)信息,生成針對(duì)所述目標(biāo)紙質(zhì)書(shū)的電子書(shū)。
在一個(gè)實(shí)施例中,結(jié)構(gòu)信息確定模塊803包括:
文本格式獲取子模塊,被配置為獲取所述電子文本信息對(duì)應(yīng)的文本格式,其中,所述文本格式包括字體、字號(hào)、行距、是否加粗和段落格式中的一者或多者;以及
結(jié)構(gòu)信息確定子模塊,被配置為根據(jù)預(yù)設(shè)文本結(jié)構(gòu)分類(lèi)模型和所述文本格式,確定所述電子文本信息的文本結(jié)構(gòu)信息。
在一個(gè)實(shí)施例中,裝置800還包括:
訓(xùn)練樣本集獲取模塊,被配置為獲取訓(xùn)練樣本集,所述訓(xùn)練樣本集中包括:所述目標(biāo)紙質(zhì)書(shū)的圖像數(shù)據(jù)和所述圖像數(shù)據(jù)所對(duì)應(yīng)的文本結(jié)構(gòu)信息;
參數(shù)信息獲取模塊,被配置為利用訓(xùn)練樣本集對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,獲得卷積神經(jīng)網(wǎng)絡(luò)的各層參數(shù)信息;
預(yù)設(shè)分類(lèi)模型構(gòu)建模塊,被配置為根據(jù)所述各層參數(shù)信息構(gòu)建所述預(yù)設(shè)文本結(jié)構(gòu)分類(lèi)模型。
在一個(gè)實(shí)施例中,裝置800還包括:
筆記獲取模塊,被配置為獲取所述電子文本信息中的筆記部分;
存儲(chǔ)模塊,被配置為將所述筆記部分以及所述筆記部分所對(duì)應(yīng)的文本結(jié)構(gòu)信息關(guān)聯(lián)存儲(chǔ);以及
顯示模塊,被配置為在滿(mǎn)足預(yù)設(shè)條件時(shí),顯示所述筆記部分以及所述筆記部分所對(duì)應(yīng)的文本結(jié)構(gòu)信息。
關(guān)于上述實(shí)施例中的裝置,其中各個(gè)模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實(shí)施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說(shuō)明。
本公開(kāi)還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序指令,該程序指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)本公開(kāi)提供的電子書(shū)轉(zhuǎn)換處理方法的步驟。
圖9是根據(jù)一示例性實(shí)施例示出的一種用于電子書(shū)轉(zhuǎn)換處理方法的裝置900的框圖。例如,裝置900可以是移動(dòng)電話(huà),計(jì)算機(jī),數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺(tái),平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個(gè)人數(shù)字助理等。
參照?qǐng)D9,裝置900可以包括以下一個(gè)或多個(gè)組件:處理組件902,存儲(chǔ)器904,電力組件906,多媒體組件907,音頻組件910,輸入/輸出(i/o)的接口912,傳感器組件914,以及通信組件916。
處理組件902通??刂蒲b置900的整體操作,諸如與顯示,電話(huà)呼叫,數(shù)據(jù)通信,相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理組件902可以包括一個(gè)或多個(gè)處理器920來(lái)執(zhí)行指令,以完成上述的電子書(shū)轉(zhuǎn)換處理方法的全部或部分步驟。此外,處理組件902可以包括一個(gè)或多個(gè)模塊,便于處理組件902和其他組件之間的交互。例如,處理組件902可以包括多媒體模塊,以方便多媒體組件907和處理組件902之間的交互。
存儲(chǔ)器904被配置為存儲(chǔ)各種類(lèi)型的數(shù)據(jù)以支持在裝置900的操作。這些數(shù)據(jù)的示例包括用于在裝置900上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話(huà)簿數(shù)據(jù),消息,圖片,視頻等。存儲(chǔ)器904可以由任何類(lèi)型的易失性或非易失性存儲(chǔ)設(shè)備或者它們的組合實(shí)現(xiàn),如靜態(tài)隨機(jī)存取存儲(chǔ)器(sram),電可擦除可編程只讀存儲(chǔ)器(eeprom),可擦除可編程只讀存儲(chǔ)器(eprom),可編程只讀存儲(chǔ)器(prom),只讀存儲(chǔ)器(rom),磁存儲(chǔ)器,快閃存儲(chǔ)器,磁盤(pán)或光盤(pán)。
電力組件906為裝置900的各種組件提供電力。電力組件906可以包括電源管理系統(tǒng),一個(gè)或多個(gè)電源,及其他與為裝置900生成、管理和分配電力相關(guān)聯(lián)的組件。
多媒體組件907包括在所述裝置900和用戶(hù)之間的提供一個(gè)輸出接口的屏幕。在一些實(shí)施例中,屏幕可以包括液晶顯示器(lcd)和觸摸面板(tp)。如果屏幕包括觸摸面板,屏幕可以被實(shí)現(xiàn)為觸摸屏,以接收來(lái)自用戶(hù)的輸入信號(hào)。觸摸面板包括一個(gè)或多個(gè)觸摸傳感器以感測(cè)觸摸、滑動(dòng)和觸摸面板上的手勢(shì)。所述觸摸傳感器可以不僅感測(cè)觸摸或滑動(dòng)動(dòng)作的邊界,而且還檢測(cè)與所述觸摸或滑動(dòng)操作相關(guān)的持續(xù)時(shí)間和壓力。在一些實(shí)施例中,多媒體組件907包括一個(gè)前置攝像頭和/或后置攝像頭。當(dāng)裝置900處于操作模式,如拍攝模式或視頻模式時(shí),前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個(gè)前置攝像頭和后置攝像頭可以是一個(gè)固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。
音頻組件910被配置為輸出和/或輸入音頻信號(hào)。例如,音頻組件910包括一個(gè)麥克風(fēng)(mic),當(dāng)裝置900處于操作模式,如呼叫模式、記錄模式和語(yǔ)音識(shí)別模式時(shí),麥克風(fēng)被配置為接收外部音頻信號(hào)。所接收的音頻信號(hào)可以被進(jìn)一步存儲(chǔ)在存儲(chǔ)器904或經(jīng)由通信組件916發(fā)送。在一些實(shí)施例中,音頻組件910還包括一個(gè)揚(yáng)聲器,用于輸出音頻信號(hào)。
i/o接口912為處理組件902和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤(pán),點(diǎn)擊輪,按鈕等。這些按鈕可包括但不限于:主頁(yè)按鈕、音量按鈕、啟動(dòng)按鈕和鎖定按鈕。
傳感器組件914包括一個(gè)或多個(gè)傳感器,用于為裝置900提供各個(gè)方面的狀態(tài)評(píng)估。例如,傳感器組件914可以檢測(cè)到裝置900的打開(kāi)/關(guān)閉狀態(tài),組件的相對(duì)定位,例如所述組件為裝置900的顯示器和小鍵盤(pán),傳感器組件914還可以檢測(cè)裝置900或裝置900一個(gè)組件的位置改變,用戶(hù)與裝置900接觸的存在或不存在,裝置900方位或加速/減速和裝置900的溫度變化。傳感器組件914可以包括接近傳感器,被配置用來(lái)在沒(méi)有任何的物理接觸時(shí)檢測(cè)附近物體的存在。傳感器組件914還可以包括光傳感器,如cmos或ccd圖像傳感器,用于在成像應(yīng)用中使用。在一些實(shí)施例中,該傳感器組件914還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
通信組件916被配置為便于裝置900和其他設(shè)備之間有線(xiàn)或無(wú)線(xiàn)方式的通信。裝置900可以接入基于通信標(biāo)準(zhǔn)的無(wú)線(xiàn)網(wǎng)絡(luò),如wifi,2g或3g,或它們的組合。在一個(gè)示例性實(shí)施例中,通信組件916經(jīng)由廣播信道接收來(lái)自外部廣播管理系統(tǒng)的廣播信號(hào)或廣播相關(guān)信息。在一個(gè)示例性實(shí)施例中,所述通信組件916還包括近場(chǎng)通信(nfc)模塊,以促進(jìn)短程通信。例如,在nfc模塊可基于射頻識(shí)別(rfid)技術(shù),紅外數(shù)據(jù)協(xié)會(huì)(irda)技術(shù),超寬帶(uwb)技術(shù),藍(lán)牙(bt)技術(shù)和其他技術(shù)來(lái)實(shí)現(xiàn)。
在示例性實(shí)施例中,裝置900可以被一個(gè)或多個(gè)應(yīng)用專(zhuān)用集成電路(asic)、數(shù)字信號(hào)處理器(dsp)、數(shù)字信號(hào)處理設(shè)備(dspd)、可編程邏輯器件(pld)、現(xiàn)場(chǎng)可編程門(mén)陣列(fpga)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn),用于執(zhí)行上述電子書(shū)轉(zhuǎn)換處理方法。
在示例性實(shí)施例中,還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),例如包括指令的存儲(chǔ)器904,上述指令可由裝置900的處理器920執(zhí)行以完成上述電子書(shū)轉(zhuǎn)換處理方法。例如,所述非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是rom、隨機(jī)存取存儲(chǔ)器(ram)、cd-rom、磁帶、軟盤(pán)和光數(shù)據(jù)存儲(chǔ)設(shè)備等。
本領(lǐng)域技術(shù)人員在考慮說(shuō)明書(shū)及實(shí)踐本公開(kāi)后,將容易想到本公開(kāi)的其它實(shí)施方案。本申請(qǐng)旨在涵蓋本公開(kāi)的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開(kāi)的一般性原理并包括本公開(kāi)未公開(kāi)的本技術(shù)領(lǐng)域中的公知常識(shí)或慣用技術(shù)手段。說(shuō)明書(shū)和實(shí)施例僅被視為示例性的,本公開(kāi)的真正范圍和精神由下面的權(quán)利要求指出。
應(yīng)當(dāng)理解的是,本公開(kāi)并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開(kāi)的范圍僅由所附的權(quán)利要求來(lái)限制。