Appearance
大模型OCR-文檔 ?
組件概述 ?
大模型OCR-文檔組件利用先進的大語言模型技術,對各類文檔進行智能識別和信息提取,支持從復雜文檔中提取結構化數據。
配置說明 ?
大模型OCR文檔識別服務URL ?
- 作用:指定大模型OCR文檔識別服務的API接口地址
- 示例:
https://your-doc-ocr-api-endpoint.com
提示詞 ?
- 功能:提示提取特定信息和以什么格式返回信息
- 示例:
提取統(tǒng)一社會信用代碼,文本格式
文檔選擇 ?
提供多種方式指定需要識別的文檔源:
選擇文檔 ?
- 功能:手動上傳本地文檔文件進行識別
- 支持格式:PDF、Word、Excel、JPG、JPEG、PNG、BMP、TIFF
文檔base64變量名 ?
- 功能:通過變量傳遞base64編碼的文檔數據
- 格式要求:完整的base64字符串(包含
data:...前綴) - 示例:
docImage或@docImageVc
文檔路徑變量名 ?
- 功能:通過變量傳遞文檔文件系統(tǒng)路徑
- 格式要求:有效的本地文件路徑
- 示例:
docPath或@docPathVaria
使用優(yōu)先級 ?
系統(tǒng)按以下順序選擇文檔源:
- base64變量(最高優(yōu)先級)
- 手動上傳
- 路徑變量(最低優(yōu)先級)
數據輸出 ?
分配給變量 ?
將識別出的文檔內容保存到變量中
- 變量名稱:指定存儲識別結果的變量名稱
插入表格 ?
將識別結果插入到表中
- 選擇列:指定插入識別結果的表格列
技術特性 ?
- 基于大語言模型,理解文檔上下文語義
- 支持多種文檔格式,包括可編輯和掃描文檔
- 能夠提取結構化信息,如統(tǒng)一社會信用代碼等特定字段
- 處理復雜版式和表格數據
應用場景 ?
- 企業(yè)資質證件信息提取
- 合同關鍵條款識別
- 財務報表數據采集
- 證件照文字信息識別
注意事項 ?
- 確保OCR服務可用且網絡連接正常
- 文檔清晰度直接影響識別準確率
- 復雜版式文檔可能需要更長的處理時間
- 建議對關鍵信息進行人工復核

MakAgent在線文檔