欧美亚洲日韩国产综合网-欧美亚洲日韩国产综合视频网站-欧美亚洲日韩国产人成在线播放-欧美亚洲日韩国产-欧美亚洲日韩动漫偷自拍页-欧美亚洲日韩aⅴ在线观看

天天視訊!小米新技術落地:能將圖片中的表格轉化成Excel文件

來源:快科技

今天下午,小米創辦人雷軍介紹了小米自研的一套表格識別算法,該算法高效準確地將圖片中的表格轉化為可編輯的Excel文件,大幅提升使用體驗。表格識別是指將圖片中的表格結構和文字信息識別成計算機可以理解的數據格式,在辦公、商務、教育等場景中有著廣泛的實用價值,也一直是文檔分析研究中的熱點問題。


(資料圖)

訪問:

阿里云1核2G云服務器低至1折 最高可得500元滿減優惠券

訪問:

小米有品

圍繞這個問題,小米研發了一套表格識別算法,該算法高效準確地提取圖片中的表格,轉化為可編輯的Excel 文件。目前算法已經成功落地于小米10S系列、MIX Fold 2等旗艦機型,大家可以從相冊-更多-表格識別,或者掃一掃進入體驗。

表格檢測算法

小米表示,表格檢測算法主要是從圖片中準確的提取表格區域,并對表格進行矯正,得到平整的表格圖片以便下一步的表格識別;

表格識別算法主要是從圖片中提取表格結構和表格文字內容,然后將這些信息有效的結合在一起,輸出可編輯的Excel表格。

表格檢測有以下難點:一方面是手機上的算法和內存有限,另一方面是對表格檢測結果要求非常高,表格周圍往往包含其他文字,如果檢測結果不準,會對后面的識別結果造成負面影響。

小米的表格檢測算法會同時檢測到表格區域和表格的四個角點,通過透視變換和我們自研的抗扭曲算法得到只有表格區域的平整表格,效果如圖所示。

由于算法運行在手機端,需要保證運行速度和模型大小,小米采用了一個非常輕便的一階段檢測框架,backbone采用shuffleNetV2;

在檢測出表格框的同時,回歸出關鍵點信息,便于表格的透視矯正,并用Wing loss代替L1 loss讓關鍵點回歸更加準確;

數據方面,用算法低成本地從公開數據中挖掘大量表格檢測數據,顯著性地提高表格檢測效果。最終模型大小為1M左右,順暢地運行在小米手機上。

表格識別算法

表格識別算法在服務端運行,主要包含的模塊有:文本檢測、文本識別、表格結構預測、單元格匹配、對齊算法、Excel導出。

目前主流的方法是將表格用HTML的超文本表示,然后對HTML進行編碼,預測HTML序列和對應的坐標信息。

該方法在開源數據集上取得了不錯的效果,中國平安科技和百度也采用了這種方案,但是HTML 的標簽過多導致表格結構識別容易出錯。

針對該方法的不足,我們對表格采用全新的編碼方式,僅用四個標簽就能表示任意結構的表格,極大地提高了表格結構識別準確率。

表格識別在部署過程中,采用Fastertransformer推理框架進行加速,官方稱小米的推理速度提升了大約20倍,明顯改善用戶體驗。

總結

該算法能高效方便地從圖片中提取表格,極大地提高辦公效率。小米表示,工程師們將持續提升小米手機中文檔類圖片的識別體驗。

關鍵詞: Xiaomi 小米新技術落地能將圖片中的表格轉化成Ex

推薦

直播更多》

關閉

資訊更多》

焦點

主站蜘蛛池模板: 欧美巨大精品欧美一区二区 | 国产乱妇乱子在线视频 | 日韩在线欧美高清一区 | 日韩欧美精品在线观看视 | 精品视频免费看天天春夜夜春 | 国产在线手机视频时看 | 精品国产不卡女 | 亚洲欧美丝袜另类清纯 | 精品欧美亚 | 国产午夜激情视频自拍 | 亚洲v天堂v手机在线 | 岛国在线看片国产色片 | 99在线视频播放 | 国产在线欧美一区二区 | 日本中文字幕视频在线看 | 国产一二片视频免费观看 | 国产精品欧美在线另类小说 | 99久热re | 国产亚洲成a人片在线观看 国产v欧美v日韩v综合精品 | 日韩一中文字 | 国产精品一区二区免费 | 最新国产精品视频免费看 | 99这里只有免费费精品 | 国产区在线视频 | 欧美精选一区二区三区 | 被粗黑进进出出在线观看 | 日韩精品三| 欧美aaaaaa级午夜福利视 | 精品亚洲a | 国产美腿91肉丝袜在线播放 | 日本一区二区三区高清视频 | 欧美日韩免费性爱视频 | 精品国产一区二区三区高清观看 | 国产精品三级在线播放 | 国产欧美日韩一区二区三区在线 | 日韩欧美国产精品91 | 日本高清一区二区免费2025 | 欧美性爱第1页影音先锋 | 国产精品日本欧美一区二区 | 2025国产精品系列一区二区 | 日韩亚洲制服一区欧美综合 |