當我把3000字的技術合同交給DeepSeek審查……
自開年以來,DeepSeek成為提及最多的AI提效工具,很多人拿它寫文章,寫代碼。為驗證其在合同審核場景的適用性,昨天我用DeepSeek-R1對一份3000字的技術服務合同進行了3輪審核,重點關注審核嚴謹性、處理效率及用戶體驗。
01
在首次測試中,系統在合同上傳后不到一分鐘即生成審查報告,準確識別出簽訂日期不一致等顯性錯誤。AI在基礎信息校驗方面的優勢顯著,尤其在標準化格式核驗及簡單錯誤識別領域,其效率遠超傳統人工審查。
02
為驗證結果穩定性,我使用相同提示詞二次提交合同。結果生成的報告和第一次存在明顯差異。比如,在付款條件和違約責任等關鍵條款的風險提示上,系統給出了不同的結論。
第一次審核結果和第二次審核結果對比
03
于是,我又調換了合同首尾頁的甲乙雙方信息進行了第三次測試,這次DeepSeek在主體信息欄仍然標注“名稱準確”,沒能發現首尾頁信息矛盾的問題。
這說明其在跨頁信息比對方面還存在邏輯盲區,對合同結構化要素的關聯性校驗不夠完善。
合同原文
系統未審核出甲乙方矛盾的問題
同時,合同原文明確約定第四期付款需同時滿足“驗收合格后滿一年”和“發票收到后”兩個條件,但系統只識別“驗收合格后滿一年”這個單一條件,沒有建立正確的“且”關系邏輯鏈。
合同原文需要滿足兩個條件
系統只識別到單一條件
在整個使用過程中,系統還多次彈出“服務器繁忙”的警告,導致審核進程意外中斷,體驗感不佳。
總結一下
綜合測試結果,DeepSeek在合同審查場景呈現以下特性:
基礎錯誤審查效率較人工提升顯著;
內置法律知識庫可對常規條款提供合規建議;
輕量化特性適配個人用戶及已部署本地服務企業的補充性需求。
但在專業審核場景中,仍建議采用企業級智能審查系統——該類平臺通常對接專業法律大模型,并且基于專業的合同審查規則庫和RAG技術,能有效規避大模型幻覺問題,確保審核結果的準確性和一致性。
金現代合同審查場景及條款沉淀