引:新的 Document AI 平台將會成為 Google Cloud 的一部分,Google 表示這個產品旨在分析文件,並提取上面的數據進行核對,容許使用者或 App 能夠存取文件上的內容而無需手動輸入。
Google Document AI 透過 API 提供文件分析器、工具和解決方案,支援建立和自訂利用 Google Cloud 預設分類法構建的文件處理工作流,無需執行其他數據映射或訓練。DocAI 提供通用處理器,包括表格分析器、W9 分析器、光學字符辨識(OCR)、文件拆分器和針對特定領域文件的自訂工作流。
Search
ocr api中文 在 [工具] 中文OCR 的library? - 看板java - 批踢踢實業坊 的必吃
用 ocr, java 來搜尋,那大概逃不掉這個網站
https://asprise.com/product/ocr/index.php?lang=java
我用裡頭的 demo 來測試,中文基本上是會掛掉的
(「中」會變成 $,「文」跟「口」都出不來)
用 ocr, java, chinese, api.... 似乎找不到像樣的東西
跑到 sourceforge 上頭找 ocr, chinese
好像只有這個比較接近...
https://sourceforge.net/projects/mini-ocr/
不過學校的爛網路一直抓不下來 T__T
而且那也是 C++ 寫的
網路上另外有找到一個 JOCR,據說可以辨識中文
(javaworld@tw 上頭講的)
我用了一下,沒辦法正常辨識,出現 ActiveX 的錯誤
因為他好像是利用 M$-Office 套件來辨識
所以,厚臉皮上來問一下
有沒有中文辨識的 library 可以用
就算不是 Java 的也沒關係(咪的,用 JNI 硬幹)
或是從英文 OCR 轉成中文 OCR 的可能性?
謝謝各位了 Orz
--
侃侃長論鮮窒礙 首頁:https://www.psmonkey.idv.tw
眾目睽睽無心顫 Blog:https://ps-think.blogspot.com
煢居少聊常人事
殺頭容易告白難 歡迎參觀 Java 版(@ptt.cc)精華區 \囧/
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.136.200.60
... <看更多>