OpenAI o1風(fēng)格的推理大模型,有行業(yè)垂直版了。 HK-O1aw,是由香港生成式人工智能研發(fā)中心(HKGAI)旗下AI for Reasoning團隊(HKAIR) 聯(lián)合北京大學(xué)對齊團隊(PKU-Alignment Team)推出的全球首個慢思考范式法律推理大模型。 HK-O1aw的推理能力,在多個法律場景的測試中得到證明。該模型在合同法、消費者權(quán)益保護法等多個法律領(lǐng)域中均展現(xiàn)出色的表現(xiàn),并能靈活適應(yīng)各類法律咨詢場景。 以下是HK-O1aw模型用戶體驗演示: 提問1:拿衣服去干洗后,干洗店弄壞了衣服,根據(jù)香港法例,可否向店鋪索償?應(yīng)該以什么渠道索價? 在個案咨詢場景中,針對“干洗店洗壞衣服”的情形,用戶咨詢HK-O1aw如何利用香港法例進行消費者維權(quán)。HK-O1aw通過“分析香港法律條例——分析索償途徑——小額錢債審裁處的適用性——民事法庭的訴訟程序”完整的邏輯鏈條進行思考。最終提供用戶答案:可以進行索賠,首先建議直接聯(lián)系店鋪索賠,若無果則向消費者委員會投訴,或通過法律途徑解決。 提問2:商業(yè)為什么需要調(diào)解和仲裁? 在法律知識解答場景中,針對用戶提出“商業(yè)為什么需要調(diào)解和仲裁”,HK-O1aw的推理能力幫助它把問題進行拆分,按商業(yè)調(diào)解和商業(yè)仲裁的定義和功能、調(diào)解和仲裁各自的優(yōu)點、適用性驗證的思路進行深度思考,并給出最終答案。 推理能力的實現(xiàn),進一步保障了大模型在法律場景下法律條例引用、事實判斷、決策意見的準確性,分析角度的完備性,讓大模型在法律服務(wù)中更加專業(yè)可靠。 像這樣,一直以來都是耗時耗力且成本高昂法律糾紛處理,如今可以慢慢交給法律推理大模型來干了。 深度推理:HK-O1aw法律大模型的核心競爭力 早期市場上的法律大模型在深度推理能力上有所欠缺。 早期的法律大模型即便能夠提供豐富的法律知識,但面對現(xiàn)實社會中的復(fù)雜法律糾紛,它們往往在關(guān)鍵邏輯上出現(xiàn)疏漏,最終難以解決法律場景下的實際問題。 HK-O1aw通過采用O1風(fēng)格的數(shù)據(jù)集和訓(xùn)練設(shè)置,實現(xiàn)法律模型深度推理能力的躍升,這使得法律大模型能夠深入分析復(fù)雜的法律文本和案例,提供邏輯縝密的法律意見,滿足行業(yè)對深度分析和復(fù)雜問題解決的迫切需求。 O1風(fēng)格是什么? 它指的是一種類似于OpenAI o1模型的長考能力,它側(cè)重于慢思考(slow thinking)和鏈式推理(Chain of Thought, CoT)。在法律領(lǐng)域,O1風(fēng)格專注于深入分析和推理,以應(yīng)對法律文本和案例的復(fù)雜性。這種風(fēng)格的模型技術(shù)難點主要體現(xiàn)在以下幾個方面: 復(fù)雜性處理:法律文本常包含專業(yè)術(shù)語和復(fù)雜的邏輯結(jié)構(gòu),O1風(fēng)格的模型必須能夠進行深入的思考和推理。 長鏈推理:為了在復(fù)雜案件中進行全面分析和判斷,O1風(fēng)格的模型必須能夠支持更長的推理鏈條。 準確性和可靠性:O1風(fēng)格的模型必須確保模型在推理過程中的一致性和可靠性,以避免錯誤判斷。 可解釋性:O1風(fēng)格的模型需要提供可解釋的模型輸出,以便法律專業(yè)人士理解和信任模型的結(jié)論。 想要訓(xùn)練出邏輯超強的模型,豐富并且高質(zhì)量的數(shù)據(jù)集必不可少。 依托于經(jīng)過嚴格清洗和預(yù)處理的法律材料,HKAIR團隊為HK-O1aw構(gòu)建了15959個包含“問題-思考-答案”的三元組,全部以簡體中文呈現(xiàn),并以結(jié)構(gòu)化的JSON格式存儲,并在Hugging Face平臺上開源(詳見文末鏈接)。這種設(shè)計旨在模擬法律專業(yè)人士的思考過程,增強法律大模型的深入分析能力。 數(shù)據(jù)集中的問題類型廣泛,涵蓋案例分析、法律應(yīng)用和法律概念解釋等多個方面,難度級別為中級到高級,對于法律專業(yè)人士和法學(xué)院學(xué)生來說具有挑戰(zhàn)性。 HKGAI團隊介紹 HKAIR Lab隸屬于香港生成式人工智能研發(fā)中心(HKGAI)。HKAIR Lab 由香港科技大學(xué)首席副校長郭毅可教授和跨學(xué)科學(xué)院韓斯睿助理教授指導(dǎo),成員主要由香港科技大學(xué)跨學(xué)科學(xué)院的博士研究生和研究員團隊組成。HKAIR Lab 與北大對齊團隊在 HK-O1aw 和“慢思考”范式下,就生成式人工智能如何賦能法律應(yīng)用場景展開了合作。 為了把握未來機遇并應(yīng)對挑戰(zhàn),HKAIR研究團隊將持續(xù)對HK-O1aw進行優(yōu)化。計劃中包括引入法律領(lǐng)域?qū)<覅⑴c模型的訓(xùn)練與評估,這將促進模型對法律概念的深入理解,提升其推理能力,并拓寬模型在多樣化法律場景中的應(yīng)用范圍。 HK-O1aw模型開源資源鏈接: 本文來源:量子位 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選