全球首个法律o1大模型发布,system2范式下慢思考法律专家
hk-o1aw团队 投稿
量子位 公众号 qbitai
openai o1风格的推理大模型,有行业垂直版了。
hk-o1aw,是由香港生成式人工智能研发中心(hkgai)旗下ai for reasoning团队(hkair) 联合北京大学对齐团队pku-alignment team推出的全球首个慢思考范式法律推理大模型。
hk-o1aw的推理能力,在多个法律嘲的测试中得到证明。该模型在合同法、消费者权益保护法等多个法律领域中均展现出色的表现,并能灵活适应各类法律咨询嘲。
以下是hk-o1aw模型用户体验演示:
提问1:拿衣服去干洗后,干洗店弄坏了衣服,根据香港法例,可否向店铺索偿?应该以什么渠道索价?
在个案咨询嘲中,针对“干洗店洗坏衣服”的情形,用户咨询hk-o1aw如何利用香港法例进行消费者维权。hk-o1aw通过“分析香港法律条例——分析索偿途径——小额钱债审裁处的适用性——民事法庭的诉讼程序”完整的逻辑链条进行思考。最终提供用户答案:可以进行索赔,首先建议直接联系店铺索赔,若无果则向消费者委员会投诉,或通过法律途径解决。
提问2:商业为什么需要调解和仲裁?
在法律知识解答嘲中,针对用户提出“商业为什么需要调解和仲裁”,hk-o1aw的推理能力帮助它把问题进行拆分,按商业调解和商业仲裁的定义和功能、调解和仲裁各自的优点、适用性验证的思路进行深度思考,并给出最终答案。
推理能力的实现,进一步保障了大模型在法律嘲下法律条例引用、事实判断、决策意见的准确性,分析角度的完备性,让大模型在法律服务中更加专业可靠。
像这样,一直以来都是耗时耗力且成本高昂法律纠纷处理,如今可以慢慢交给法律推理大模型来干了。
早期市场上的法律大模型在深度推理能力上有所欠缺。
早期的法律大模型即便能够提供丰富的法律知识,但面对现实社会中的复杂法律纠纷,它们往往在关键逻辑上出现疏漏,最终难以解决法律嘲下的实际问题。
hk-o1aw通过采用o1风格的数据集和训练设置,实现法律模型深度推理能力的跃升,这使得法律大模型能够深入分析复杂的法律文本和案例,提供逻辑缜密的法律意见,满足行业对深度分析和复杂问题解决的迫切需求。
o1风格是什么?
它指的是一种类似于openai o1模型的长考能力,它侧重于慢思考slow thinking和链式推理chain of thought, cot。在法律领域,o1风格专注于深入分析和推理,以应对法律文本和案例的复杂性。这种风格的模型技术难点主要体现在以下几个方面:
想要训练出逻辑超强的模型,丰富并且高质量的数据集必不可少。
依托于经过严格清洗和预处理的法律材料,hkair团队为hk-o1aw构建了15959个包含“问题-思考-答案”的三元组,全部以简体中文呈现,并以结构化的json格式存储,并在hugging face平台上开源详见文末链接。这种设计旨在模拟法律专业人士的思考过程,增强法律大模型的深入分析能力。
数据集中的问题类型广泛,涵盖案例分析、法律应用和法律概念解释等多个方面,难度级别为中级到高级,对于法律专业人士和法学院学生来说具有挑战性。
hkair lab隶属于香港生成式人工智能研发中心hkgai。hkair lab 由香港科技大学首席副校长郭毅可教授和跨学科学院韩斯睿助理教授指导,成员主要由香港科技大学跨学科学院的博士研究生和研究员团队组成。hkair lab 与北大对齐团队在 hk-o1aw 和“慢思考”范式下,就生成式人工智能如何赋能法律应用嘲展开了合作。
为了把握未来机遇并应对挑战,hkair研究团队将持续对hk-o1aw进行优化。计划中包括引入法律领域专家参与模型的训练与评估,这将促进模型对法律概念的深入理解,提升其推理能力,并拓宽模型在多样化法律嘲中的应用范围。
免责声明:本文章由会员“极目新闻”发布如果文章侵权,请联系k8凯发天生赢家一触即发人生处理,本站仅提供信息存储空间服务如因作品内容、k8凯发天生赢家一触即发人生的版权和其他问题请于本站联系