近期,合合信息旗下掃描全能王“智能高清濾鏡”正式上線(xiàn)。該功能基于A(yíng)I技術(shù)及智能掃描引擎,可自動(dòng)檢測圖像中存在的問(wèn)題并判定圖像的優(yōu)化方式,實(shí)現模糊、陰影、手指、屏幕紋等干擾因素的一鍵全處理。使用者無(wú)需思考拍攝角度、光源、背景,只要點(diǎn)擊單拍、多拍、掃描等任意拍攝按鈕,便可得到一張如原稿打印般平整、清晰的圖片。
“一鍵到位”的背后,AI在幫人“思考”圖像問(wèn)題
與傳統的手機掃描流程相比,掃描全能王“智能高清濾鏡”的亮點(diǎn)之一,便是讓AI代替人去“思考”圖片中需要解決的問(wèn)題,并為用戶(hù)自動(dòng)選擇出最優(yōu)處理方案,通過(guò)算法上的智能研判,達成多個(gè)問(wèn)題一鍵解決的效果。
據合合信息掃描全能王事業(yè)部負責人曹超陽(yáng)介紹,“智能高清濾鏡”的智能研判主要基于精準的圖像感知,來(lái)達成場(chǎng)景化的決策效果,例如,去除手指產(chǎn)生的遮擋、感知到圖像是過(guò)暗還是過(guò)亮,然后針對性地調整圖像的亮度和對比度等。
“智能高清濾鏡”能夠迅速判定文檔種類(lèi)并進(jìn)行處理方法決策,在辦公文檔電子化、教育資料處理、商務(wù)資料留存等涉及文檔處理的場(chǎng)景中具有廣闊的應用前景。
智能掃描引擎,讓AI讀懂圖像與文字
現實(shí)生活中,書(shū)本等文檔并不總是平面的,AI在處理相關(guān)圖片時(shí)需要進(jìn)行“矯正”。此外,由于拍攝角度和鏡頭畸變的問(wèn)題,即使是平面的文檔,拍攝后也可能出現透視扭曲。掃描全能王采用了基于深度學(xué)習的曲面檢測和矯正技術(shù)來(lái)進(jìn)行處理,能夠應對各種復雜的曲面文檔。
據介紹,智能掃描引擎AI-Scan(簡(jiǎn)稱(chēng)“AI-Scan引擎”),基于合合信息智能文字識別、智能圖像處理技術(shù),對圖像處理、文字識別及版面還原進(jìn)行全面優(yōu)化,綜合提升掃描效果。
多語(yǔ)種識別是巨大的挑戰。例如,阿拉伯語(yǔ)的書(shū)寫(xiě)方向是從右到左,而且同一字母在單詞的不同位置有著(zhù)不同的形態(tài)。而掃描全能王采用了一種結合深度學(xué)習和自然語(yǔ)言處理的全新方法,能夠有效地處理不同語(yǔ)種的字符關(guān)聯(lián)和順序問(wèn)題。
在服務(wù)全球億級別用戶(hù)的過(guò)程中,掃描全能王對大量的多語(yǔ)種文本進(jìn)行預訓練,能夠對全球41個(gè)語(yǔ)種的文檔進(jìn)行識別,滿(mǎn)足了全球超過(guò)100個(gè)國家和地區用戶(hù)的辦公、生活需求。