使用效果如下圖。直接在會博通搜索引擎上輸入搜索文字,結(jié)果反饋除了文檔格式之外,還包括PDF等圖片格式。
OCR技術(shù)指的是,對文本資料的圖像文件,進(jìn)行分析識別處理,獲取版面信息的過程。在眾多OCR應(yīng)用當(dāng)中,基于對識別準(zhǔn)確率、場景覆蓋面、語種豐富度等因素的考量,會博通選擇了百度OCR。
在圖片文字識別上,百度OCR不僅能夠識別常規(guī)PDF文件,還能識別存在背景豐富、低亮度、低對比度、光照不均、透視變形、字號、字重、顏色不一等多重問題的圖片,精準(zhǔn)度可以說是非常高的。同時,百度OCR也適用于卡證驗核、財會報銷、交通物流、教育培訓(xùn)、內(nèi)容審核等多種文字識別場景,滿足檔案管理的多種需求。此外,百度OCR還支持英、日、韓、法、德、意等20多種語種,對于多語言識別也不在話下。
在配置了OCR功能的會博通檔案系統(tǒng)當(dāng)中,圖片資料一經(jīng)上傳,系統(tǒng)便會分配一個后臺任務(wù),在系統(tǒng)空閑的時候,對文件進(jìn)行識別成為文本文件。 文本文件識別完成后,內(nèi)容就會自動接入到會博通搜索平臺當(dāng)中,與搜索內(nèi)容進(jìn)行匹配,便于用戶精準(zhǔn)快速獲取包含圖片在內(nèi)的信息。
會博通檔案管理系統(tǒng),擁有非常強大的檔案搜索功能,提供了包括關(guān)鍵詞檢索、全文檢索、類自然語言檢索、二次搜索等多種檢索方式,并且搜索結(jié)果可依權(quán)限反饋。在這個基礎(chǔ)之上,在結(jié)合百度ocr功能,可以說是非常全面、安全、高效的一套檔案搜索體系了,完全滿足當(dāng)下檔案文件搜索需要。
在會博通檔案管理軟件當(dāng)中,OCR功能屬于選配組件。如果您的檔案當(dāng)中存在大量的PDF、JPG等圖片資料,為方便后期檢索,我們建議您最好選配OCR功能;如果您對于檔案全文檢索需求不大,或檔案資料以電子化的文檔為主,那么也可以暫且不配置該功能;如果您的系統(tǒng)安裝沒有配置OCR功能,但隨著業(yè)務(wù)的發(fā)展,對于圖片搜索的需求增加,那么也可以隨時聯(lián)系我們進(jìn)行系統(tǒng)升級。