太平洋科技要聞

全球首個法律o1大模型發(fā)布，System2范式下慢思考法律專家

量子位整合編輯：太平洋科技發(fā)布于：2024-11-12 16:48

OpenAI o1風(fēng)格的推理大模型，有行業(yè)垂直版了。

HK-O1aw，是由香港生成式人工智能研發(fā)中心(HKGAI)旗下AI for Reasoning團隊(HKAIR) 聯(lián)合北京大學(xué)對齊團隊（PKU-Alignment Team）推出的全球首個慢思考范式法律推理大模型。

HK-O1aw的推理能力，在多個法律場景的測試中得到證明。該模型在合同法、消費者權(quán)益保護法等多個法律領(lǐng)域中均展現(xiàn)出色的表現(xiàn)，并能靈活適應(yīng)各類法律咨詢場景。

以下是HK-O1aw模型用戶體驗演示：

提問1:拿衣服去干洗后，干洗店弄壞了衣服，根據(jù)香港法例，可否向店鋪索償？應(yīng)該以什么渠道索價？

在個案咨詢場景中，針對“干洗店洗壞衣服”的情形，用戶咨詢HK-O1aw如何利用香港法例進行消費者維權(quán)。HK-O1aw通過“分析香港法律條例——分析索償途徑——小額錢債審裁處的適用性——民事法庭的訴訟程序”完整的邏輯鏈條進行思考。最終提供用戶答案：可以進行索賠，首先建議直接聯(lián)系店鋪索賠，若無果則向消費者委員會投訴，或通過法律途徑解決。

提問2:商業(yè)為什么需要調(diào)解和仲裁？

在法律知識解答場景中，針對用戶提出“商業(yè)為什么需要調(diào)解和仲裁”，HK-O1aw的推理能力幫助它把問題進行拆分，按商業(yè)調(diào)解和商業(yè)仲裁的定義和功能、調(diào)解和仲裁各自的優(yōu)點、適用性驗證的思路進行深度思考，并給出最終答案。

推理能力的實現(xiàn)，進一步保障了大模型在法律場景下法律條例引用、事實判斷、決策意見的準確性，分析角度的完備性，讓大模型在法律服務(wù)中更加專業(yè)可靠。

像這樣，一直以來都是耗時耗力且成本高昂法律糾紛處理，如今可以慢慢交給法律推理大模型來干了。

深度推理：HK-O1aw法律大模型的核心競爭力

早期市場上的法律大模型在深度推理能力上有所欠缺。

早期的法律大模型即便能夠提供豐富的法律知識，但面對現(xiàn)實社會中的復(fù)雜法律糾紛，它們往往在關(guān)鍵邏輯上出現(xiàn)疏漏，最終難以解決法律場景下的實際問題。

HK-O1aw通過采用O1風(fēng)格的數(shù)據(jù)集和訓(xùn)練設(shè)置，實現(xiàn)法律模型深度推理能力的躍升，這使得法律大模型能夠深入分析復(fù)雜的法律文本和案例，提供邏輯縝密的法律意見，滿足行業(yè)對深度分析和復(fù)雜問題解決的迫切需求。

O1風(fēng)格是什么？

它指的是一種類似于OpenAI o1模型的長考能力，它側(cè)重于慢思考（slow thinking）和鏈式推理（Chain of Thought, CoT）。在法律領(lǐng)域，O1風(fēng)格專注于深入分析和推理，以應(yīng)對法律文本和案例的復(fù)雜性。這種風(fēng)格的模型技術(shù)難點主要體現(xiàn)在以下幾個方面：

復(fù)雜性處理：法律文本常包含專業(yè)術(shù)語和復(fù)雜的邏輯結(jié)構(gòu)，O1風(fēng)格的模型必須能夠進行深入的思考和推理。

長鏈推理：為了在復(fù)雜案件中進行全面分析和判斷，O1風(fēng)格的模型必須能夠支持更長的推理鏈條。

準確性和可靠性：O1風(fēng)格的模型必須確保模型在推理過程中的一致性和可靠性，以避免錯誤判斷。

可解釋性：O1風(fēng)格的模型需要提供可解釋的模型輸出，以便法律專業(yè)人士理解和信任模型的結(jié)論。

想要訓(xùn)練出邏輯超強的模型，豐富并且高質(zhì)量的數(shù)據(jù)集必不可少。

依托于經(jīng)過嚴格清洗和預(yù)處理的法律材料，HKAIR團隊為HK-O1aw構(gòu)建了15959個包含“問題-思考-答案”的三元組，全部以簡體中文呈現(xiàn)，并以結(jié)構(gòu)化的JSON格式存儲，并在Hugging Face平臺上開源（詳見文末鏈接）。這種設(shè)計旨在模擬法律專業(yè)人士的思考過程，增強法律大模型的深入分析能力。

數(shù)據(jù)集中的問題類型廣泛，涵蓋案例分析、法律應(yīng)用和法律概念解釋等多個方面，難度級別為中級到高級，對于法律專業(yè)人士和法學(xué)院學(xué)生來說具有挑戰(zhàn)性。

HKGAI團隊介紹

HKAIR Lab隸屬于香港生成式人工智能研發(fā)中心（HKGAI）。HKAIR Lab 由香港科技大學(xué)首席副校長郭毅可教授和跨學(xué)科學(xué)院韓斯睿助理教授指導(dǎo)，成員主要由香港科技大學(xué)跨學(xué)科學(xué)院的博士研究生和研究員團隊組成。HKAIR Lab 與北大對齊團隊在 HK-O1aw 和“慢思考”范式下，就生成式人工智能如何賦能法律應(yīng)用場景展開了合作。

為了把握未來機遇并應(yīng)對挑戰(zhàn)，HKAIR研究團隊將持續(xù)對HK-O1aw進行優(yōu)化。計劃中包括引入法律領(lǐng)域?qū)＜覅⑴c模型的訓(xùn)練與評估，這將促進模型對法律概念的深入理解，提升其推理能力，并拓寬模型在多樣化法律場景中的應(yīng)用范圍。

HK-O1aw模型開源資源鏈接：
模型地址：
https://huggingface.co/HKAIR-Lab/HK-O1aw
數(shù)據(jù)集地址：
https://huggingface.co/datasets/HKAIR-Lab/HK-O1aw-SFT-16K
代碼地址：
https://github.com/HKAIR-Lab/HK-O1aw/

本文來源：量子位

法律推理慢思考深度分析

量子位

原創(chuàng)欄目