合肥企業(yè)網(wǎng)站建設(shè)工作室網(wǎng)站快速收錄
在2024稀土開發(fā)者大會-AI Agent與應(yīng)用創(chuàng)新分會上,我有幸分享了我們團(tuán)隊在企業(yè)應(yīng)用中實施RAG(檢索增強生成)的難點與創(chuàng)新。希望通過這篇文章,與大家探討我們在實踐中遇到的問題和解決方案,為從事相關(guān)工作的朋友提供一些新的思路。
一、企業(yè)應(yīng)用中實施的四大難點
1. 文件解析的挑戰(zhàn)
在企業(yè)環(huán)境中,文件解析是實施RAG的第一步,也是關(guān)鍵的一步。如果文件解析做不好,后續(xù)的檢索、向量化等工作都無從談起。
老舊文件格式的解析:我們發(fā)現(xiàn),在許多國企和特定行業(yè)中,仍然存在大量的老舊文件格式,如.doc
(非.docx
)等。市面上的許多解析工具并不支持這些格式,這需要我們投入額外的精力進(jìn)行支持和兼容。
PDF表格解析:在金融、標(biāo)準(zhǔn)化工業(yè)等領(lǐng)域,PDF中的表格解析是一個剛需。復(fù)雜的表格結(jié)構(gòu)、合并單元格、跨行跨列等情況增加了解析的難度。為此,我們基于Apache PDFBox進(jìn)行了二次開發(fā),成功實現(xiàn)了對復(fù)雜表格的準(zhǔn)確解析。
OCR的觸發(fā)時機:對于包含圖文混排的文件,何時啟動OCR是一個需要深思的問題。過早或過晚都會影響解析效率和準(zhǔn)確性。
布局識別的復(fù)雜性:對于一些特殊的文件,如機票、票據(jù)等,需要進(jìn)行布局識別,以理解不同區(qū)域所代表的信息。這超出了傳統(tǒng)OCR的能力范圍,需要更高級的技術(shù)支持。
2. 結(jié)構(gòu)化數(shù)據(jù)的融合
在實際企業(yè)應(yīng)用中,很少有場景是純粹的非結(jié)構(gòu)化數(shù)據(jù)處理。通常需要與企業(yè)現(xiàn)有的結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行融合。
與關(guān)系型數(shù)據(jù)庫的融合:大模型在處理結(jié)構(gòu)化數(shù)據(jù)時,存在一定的局限性,尤其是在處理復(fù)雜邏輯和高精度查詢時。為此,我們保留了原有的結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu),通過提取元數(shù)據(jù)和資源描述,結(jié)合Function Call,實現(xiàn)了自然語言與結(jié)構(gòu)化數(shù)據(jù)的融合。
Text-to-SQL的現(xiàn)狀與挑戰(zhàn):盡管Text-to-SQL被視為未來的解決方案,但目前在處理復(fù)雜邏輯和企業(yè)級應(yīng)用時,仍存在許多挑戰(zhàn),需要更多的技術(shù)突破。
3. 索引建立過程中的處理
在資源有限的情況下,我們需要在有限的硬件條件下實現(xiàn)高效的索引和檢索。
基于元數(shù)據(jù)的檢索范圍縮小:通過在文件上傳時提取元數(shù)據(jù)(如文件名、屬性、標(biāo)題等),并在查詢時使用命名實體識別(NER)模型,我們能夠縮小檢索范圍,提高檢索準(zhǔn)確性。
使用NER模型提高準(zhǔn)確性:NER模型能夠幫助我們理解用戶的查詢意圖,進(jìn)而在大量的文檔中快速定位相關(guān)內(nèi)容。
4. 使用Rerank提升檢索結(jié)果
為了提高檢索結(jié)果的準(zhǔn)確性,我們在檢索后增加了Rerank(重排序)步驟。
使用密度函數(shù)優(yōu)化得分:通過計算檢索得分的密度函數(shù),我們能夠自動截斷低相關(guān)性的結(jié)果,只保留最相關(guān)的文檔。
在問答環(huán)節(jié)的應(yīng)用:在問答系統(tǒng)中,我們使用Rerank確保返回的原文與大模型生成的答案高度匹配,避免了答案與原文不一致的問題。
二、應(yīng)用中的創(chuàng)新案例
1. 金融研報的應(yīng)用創(chuàng)新
在金融領(lǐng)域,研報的撰寫需要耗費大量時間和精力。我們開發(fā)了一款工具,允許用戶將數(shù)百份文件上傳至系統(tǒng),然后通過自然語言提問,如“這家公司最近3年的復(fù)合增長率是多少?”,系統(tǒng)會給出準(zhǔn)確的答案并提供原文參考。
這大大縮短了研報撰寫的時間,從原來的三周縮短到幾個小時。同時,系統(tǒng)還能生成初步的研報草稿,供分析師進(jìn)一步潤色和完善。
2. 零售領(lǐng)域的創(chuàng)新應(yīng)用
Touch-V哆啦A夢助力導(dǎo)購:在零售業(yè),尤其是擁有大量SKU的商店,導(dǎo)購人員很難快速匹配客戶的復(fù)雜需求。通過我們的系統(tǒng),導(dǎo)購只需輸入客戶的需求,系統(tǒng)就能從數(shù)萬個SKU中篩選出最合適的產(chǎn)品。
裝修設(shè)計中的即時反饋:在裝修設(shè)計領(lǐng)域,客戶的需求變化頻繁,傳統(tǒng)的溝通方式效率低下。通過我們的應(yīng)用,設(shè)計師可以在平板電腦上實時與客戶互動,根據(jù)客戶的反饋即時調(diào)整設(shè)計方案,顯著提高了效率。
3. 規(guī)則預(yù)審的應(yīng)用創(chuàng)新
合同預(yù)審的自動化:大型企業(yè)在合同審查上耗費大量人力。我們的系統(tǒng)能夠根據(jù)預(yù)設(shè)的規(guī)則,對合同進(jìn)行自動審查,標(biāo)記出需要注意的條款,減少了法務(wù)人員的工作量,加快了合同審批流程。
項目評審中的規(guī)則應(yīng)用:在項目評審中,我們的系統(tǒng)能夠根據(jù)不同的評審規(guī)則,對項目文件進(jìn)行自動化的審查和評估,提高了評審的客觀性和效率。
三、總結(jié)與思考
在大模型應(yīng)用落地的實踐中,我們深刻體會到,要想做好AI在企業(yè)中的應(yīng)用,需要具備以下三個特點:
-
功能小:專注于具體的、可量化的功能,解決實際問題,而非追求大而全。
-
質(zhì)量高:確保應(yīng)用的準(zhǔn)確性和可靠性,在現(xiàn)有技術(shù)條件下,力求做到最好。
-
價值大:專注于為客戶創(chuàng)造實際價值,解決他們最關(guān)心的問題。
在與客戶合作的過程中,我們也認(rèn)識到,沉淀大量的應(yīng)用場景是企業(yè)服務(wù)的核心競爭力。這不僅能夠幫助我們更好地理解客戶需求,也使我們在技術(shù)迭代和模型升級中,始終保持領(lǐng)先。
展望未來,隨著大模型技術(shù)的不斷發(fā)展,我們期待能有更多的技術(shù)突破,如多模態(tài)識別、更加精準(zhǔn)的Text-to-SQL等。這些進(jìn)步將為企業(yè)應(yīng)用帶來更大的可能性,也為我們解決更多的實際問題提供了技術(shù)支持。