Appearance
大模型OCR-文檔 ?
組件概述 ?
大模型OCR-文檔組件利用先進的大語言模型技術(shù),對各類文檔進行智能識別和信息提取,支持從復(fù)雜文檔中提取結(jié)構(gòu)化數(shù)據(jù)。
配置說明 ?
大模型OCR文檔識別服務(wù)URL ?
- 作用:指定大模型OCR文檔識別服務(wù)的API接口地址
- 示例:
https://your-doc-ocr-api-endpoint.com
提示詞 ?
- 功能:提示提取特定信息和以什么格式返回信息
- 示例:
提取統(tǒng)一社會信用代碼,文本格式
文檔選擇 ?
提供多種方式指定需要識別的文檔源:
選擇文檔 ?
- 功能:手動上傳本地文檔文件進行識別
- 支持格式:PDF、Word、Excel、JPG、JPEG、PNG、BMP、TIFF
文檔base64變量名 ?
- 功能:通過變量傳遞base64編碼的文檔數(shù)據(jù)
- 格式要求:完整的base64字符串(包含
data:...前綴) - 示例:
docImage或@docImageVc
文檔路徑變量名 ?
- 功能:通過變量傳遞文檔文件系統(tǒng)路徑
- 格式要求:有效的本地文件路徑
- 示例:
docPath或@docPathVaria
使用優(yōu)先級 ?
系統(tǒng)按以下順序選擇文檔源:
- base64變量(最高優(yōu)先級)
- 手動上傳
- 路徑變量(最低優(yōu)先級)
數(shù)據(jù)輸出 ?
分配給變量 ?
將識別出的文檔內(nèi)容保存到變量中
- 變量名稱:指定存儲識別結(jié)果的變量名稱
插入表格 ?
將識別結(jié)果插入到表中
- 選擇列:指定插入識別結(jié)果的表格列
技術(shù)特性 ?
- 基于大語言模型,理解文檔上下文語義
- 支持多種文檔格式,包括可編輯和掃描文檔
- 能夠提取結(jié)構(gòu)化信息,如統(tǒng)一社會信用代碼等特定字段
- 處理復(fù)雜版式和表格數(shù)據(jù)
應(yīng)用場景 ?
- 企業(yè)資質(zhì)證件信息提取
- 合同關(guān)鍵條款識別
- 財務(wù)報表數(shù)據(jù)采集
- 證件照文字信息識別
注意事項 ?
- 確保OCR服務(wù)可用且網(wǎng)絡(luò)連接正常
- 文檔清晰度直接影響識別準確率
- 復(fù)雜版式文檔可能需要更長的處理時間
- 建議對關(guān)鍵信息進行人工復(fù)核

MakAgent在線文檔