无论承认与否,AI会对律师行业造成巨大冲击,尤其是在中国国产的开源大语言模型DeepSeek横空出世之后,其惊人的效率、极高的准确性和广泛的适用性让不少律师惊出一身冷汗:难道我们的工作要被AI替代了么?
笔者认为,短期视野下AI会成为律师们的重要效率工具,极大提升法律研究、格式文件起草、合同审查等工作的效率;而中长期视野下,AI无疑会“结构性重构”法律行业,传统法律技能组需要重组,甚至会进一步推动法律服务行业的“马太效应”——中大型律师事务所可能投资的定制化法律服务AI系统将对那些没有AI辅助的律师事务所进行“降维打击”。
以DeepSeek为代表的开源通用大语言模型对法律服务行业而言是一种“慢变量”——技术的渗透会在一个相对较长内的时间里逐渐发生,而不是顷刻间天翻地覆——但是在这段时间之后的后来者进行追赶时就会发现,在模型性能没有本质区别的情况下,“场景+数据”已经为先行者构建了宛如马里亚纳海沟般的护城河:这种技术进步带来的生产率飞跃已经难以跨越了。
在展开这一部分的内容前,需要强调的是,当前的市面上流行的AI大模型只是通用大模型,并非足够垂直专业的行业AI(尽管DeepSeek采用了MoE即专家混合路径)。因此对AI更加恰当的定位应当是效率提升工具或个人助理的角色,而不是一个完全可靠、无需验证的权威专家。
诸多律师同行关注AI技术的重要原因,主要的考虑是两方面:一是AI技术是否取代了律师的专业技能;二是AI技术的普及是否能够节省律师事务所的人力成本(助理费用)。
在充分利用AI技术的前提下,AI能够协助律师进行一定程度上的法律检索、协助法律研究、快速生成格式化文书、进行初步的合同审查、简单翻译、数据分析、进行简单的法律咨询和客户沟通等等。对于此等基础性、标准化的事务性工作,AI能够显著的提升法律服务工作效率,带来基础性工作的效率革命。
因此,对于第一个疑问的回答是,AI技术的普及对律师技能组的结构性更新提出了要求:能够充分利用AI的律师会大幅度提高对于简单重复的事务性工作的效率,从而更加专注在诸如复杂法律问题的分析处理,以及战略策略规划、精细沟通、商业洞察、高阶情感连接和创新性解决方案等方面的高附加值工作。同时因为AI的飞速迭代,律师不仅需要具备充分利用AI的技术素养,还需要包括持续学习、辨析利用AI工具的伦理和法律边界、一定程度上的数据分析能力(笔者的硕士论文就是对一段时间内某区域中特定类型司法案件的数据分析)等在内的新技能。
那么对于第二个疑问的回答将是,由于AI技术虽然加速了基础性事务性工作的处理效率,但是对新的法律服务技能组提出了要求,因此短期来看AI技术的普及不能立刻节省律师事务所的人力成本,甚至在AI技术探索和律师事务所AI基础设施建设方面会增加律师事务所的人力成本;而长期看来,在AI充分赋能、相关技术探索和基础设施较为完善的前提下,能够塑造法律服务工作效率的“超级个体”,从而减少相应的人力成本。
除了效率提升之外,AI技术还能够为律师的技能培养赋能,并且扩展新的法律服务边界。
因为DeepSeek的开源,让本地部署AI大模型从未如此简单,而对于法律服务行业来说,本地部署AI具有极为重大的意义。
1.数据安全
由于法律服务行业的特殊性,往往会涉及到客户及相关案件的个人隐私、商业秘密和各类敏感信息。本地部署AI能够让相关数据始终存储于律师事务所自有的服务器或数据中心,在物理和逻辑层面完全由律师事务所控制,避免相应的数据安全风险,特别是在刑事案件、资本市场案件、政府事务等领域的法律服务中尤为重要。
同时还需要额外强调的是,本地部署AI能够解除云端AI的部分功能限制,而解除限制的部分功能对法律服务而言非常重要。
2.数据合规
AI普及将会让跨法域的法律服务变得更加容易,但是不同法域对数据合规有不同的要求,尤其是在金融、医疗、政府事务等领域。本地部署AI能够更好适配包括中国《个人信息保护法》(PIPL)、《数据安全法》(DSL)、欧盟《通用数据保护条例》(GDPR)等监管规则的要求,无论是否涉及数据出境的问题。
3.技术护城河
云端AI通常是通用大模型,对于像法律这样的专业领域并不足够垂直。而律师事务所可以在开源大模型的加持下构建自主的定制化专业知识库,以开源大模型为基础训练出高度专业化并且权威可信的AI模型,形成技术护城河,利用持续的技术创新和合规管理在与其它律师事务所的竞争过程中取得优势,更好助力律师们从“合规执行人”到“价值创造者”的优雅转身。
辅助法律检索和法律研究是时常被提到的AI赋能法律服务的方式之一,但是由于训练AI的法律规范文本数据库往往并不是最新的,也可能存在部分数据的缺失,导致利用AI进行法律检索的可靠性极低。比如下面的这个例子:
假如我们真正仔细研读2025年2月7日上海市通信管理局发布的《上海信息通信业聚焦提升企业感受持续打造国际一流通信服务能级和营商环境行动方案》的话,不难发现AI输出的内容与该方案真正内容大相径庭,甚至AI煞有介事举例的“元宇宙”“一网通办”“云网融合”等内容在该方案中根本没有出现。
相似的现象也会出现在引用法律或者案例的情况中,比如AI会引用不存在或者错误的法律和案例,此时专业人士的人工复核就非常重要了。
而大语言模型“一本正经的胡说八道”现象被称为幻觉(hallucination)问题,指的是生成式人工智能在生成文本时,尽管表面上呈现出逻辑通顺的形式,但是内容可能包括完全虚构、不准确或错误的信息。幻觉通常可以分为事实性幻觉(Factuality Hallucination)和忠实性幻觉(Faithfulness Hallucination)两类,而幻觉的来源可能是数据源、训练过程和推理过程¹。上文的例子就是大语言模型的事实性幻觉问题,即模型输出的内容与可验证的现实世界事实不一致。而本地部署的AI可以通过私有且及时更新的数据库,来解决来自于数据源方面的幻觉问题。
格式性法律文书的生成与审查似乎是当前AI对法律服务行业效率提升最明显的领域,很多律师已经习惯于利用AI制作格式性的法律文书并进行初步审查。但是当前的AI技术对于完善和严谨的法律文书要求来说仍然有一些缺陷,以下面的这个例子来说明:
2025年2月9日,笔者利用云端DeepSeek-R1模型生成一份竞业限制协议,笔者使用的提示词(prompt)如下:
可以发现当前AI生成的合同粗一看“像模像样”,但是具体细节却“惨不忍睹”:
● 法律理解不够专业。AI在2.1条保密义务第一款提及了在职的保密义务与离职后的保密义务,但这种区分仅仅是提及(且其注释的《劳动合同法》第23条的参照完全错误),并没有实质性的了解在职期间基于劳动者忠实义务的“兼营竞业禁止”与离职后保护商业秘密的“特定期限、范围、地域从事竞业”的区别,因此在后文中我们可以发现对于“兼营竞业禁止”的情形完全没有约定,而这种疏忽是与客户想要防范相关风险的初衷相悖的;
● 相关条文过于粗糙。单就违约责任一条,可以简单对比笔者使用的《竞业限制协议》,就能发现AI输出文本的缺陷所在:
● 法律的经验性知识不够。对于环境和安全技术咨询公司特殊的行业背景和要求并没有充分了解和认知;同时还需要额外强调的是,在涉及竞业限制的案件场景中,双方是否能够顺利的接收到有效的文书,也就是送达的问题非常重要,而AI版本的合同中却缺少了相关的约定。
当然这份AI生成的合同问题还有很多,这里就不一一展开。举这个例子是说明两个问题:一是当前的通用大语言模型并没有进化到足够媲美专业人士的专业水准,因此利用AI提高工作效率的同时专业人士的人工干预与修正必不可少;二是AI的专业水准是可以利用私有的专业数据知识库进行训练提高的,这也强调了律师事务所部署本地AI的重要性。
AI的普及已经使得翻译行业哀鸿遍野,而DeepSeek的横空出世对文本翻译的冲击更为剧烈,我们甚至可以看到有颇具翻译经验和能力的译者感叹“去年这个时候,翻译网文的价格大概还是千字50元,现在30块的报价都难找到了”²。
但是在法律领域的多语言互译,AI还有路要走。譬如2025年2月13日,笔者利用云端DeepSeek-R1对《民法典》第1006条进行中译英的翻译,使用的提示词如下:
对比官方发布的《民法典》英文版,
我们可以发现明显差异:
这种差异不仅是在具有官方文本的情况下不选择官方文本而另行翻译“显得不够专业”,更为严重的是可能造成相关的执业风险。
比如《民法典》第1006条第1款第2句,“任何组织或者个人不得强迫、欺骗、利诱其捐献”,官方英文文本为“No organization or individual may force, deceive, or induce the person to donate such”,而网络版AI,在用户已经强调要参考官方文本的情况下,输出的结果是“No organization or individual may coerce, deceive, or induce such person to make a donation”。仅就强迫一词的用法(暂时不考虑to donate such与to make a donation的区别),就能发现巨大的区别。参考布莱克法律词典可以发现,coerce的含义为to compel by force or threat<coerce a confession>³,而force的含义为to compel by physical means or by legal requirement<Barnes used a gun to force Jillian to use her ATM card><under the malpractice policy, the insurance company was forced to defend the doctor>⁴。在coerce一词的用法上,通常指向的是不法的强迫,这种强迫通过强力或者威胁达成;而在force一词的用法上,就不要求对该“强迫”进行合法或非法的判断:该种强迫既有可能来自法律要求,也有可能来自于物理手段。
回到《民法典》第1006条第1款第2句中,“任何组织或者个人不得强迫、欺骗、利诱其捐献”,不难发现,该条文限制的不仅是那些不法的强迫,也限制组织或个人通过合法的形式进行强迫。因此,在利用AI进行多语言互译的时候,需要格外小心。
上面的例子仅仅只是利用网页端大语言模型辅助法律工作的部分例子,事实上AI对法律服务行业的赋能远远不止于此,比如微信聊天记录在很多民商事争议中都是非常重要的,但往往十分冗长,整理起来很费精力。此时可以充分利用AI辅助我们编写诸如Python等脚本变成来辅助进行证据整理工作,这就是AI让不具备编程能力的人利用自然语言进行编程,进而辅助其工作。
但是,从上面的例子不难看出,即便AI能够大幅度提高部分法律服务的效率,但是由于幻觉的存在以及专业知识库的缺失,可靠性得不到保证,需要人工进行进一步的干预和验证,因此前文会提到短期来看AI技术的普及不能立刻节省律师事务所的人力成本,传统的律师助理岗位仍有其价值。解决AI幻觉以及专业知识库缺失的问题,就需要律师事务所部署私有的专业AI。另外仍需强调的是,即便当前“AI冲击”对法律服务行业的人力冲击并不足够明显,但是已经对律师的技能组提出了更加全面的要求。
律师事务所基于DeepSeek-R1开源大模型进行本地AI部署的落地方案可以根据具体情况和不同的需求粗略划分出不同规格。下面的基础设施落地方案是一个部署本地DeepSeek-R1+私有知识库的参考建议(由DeepSeek生成):
不同的基础设施落地方案不仅取决于不同大语言模型的硬件算力要求不同(比如DeepSeek开源的大模型就有参数最少的1.5B模型到671B满血版本等八个版本的区分,B是指该模型参数数量为多少个十亿。1.5B模型就使用了十五亿个参数,671B就使用了六千七百一十亿个参数。参数越多对硬件算力的要求越高。另外需要注意的是,虽然DeepEP在2025年2月25日开源,其能够较为显著的降低模型部署成本提高模型效率,但是这种提升更多的注重于大规模的MoE模型,对于主要利用消费级硬件的本地部署来说,效率提升的效果有限),更重要的是法律服务行业特殊属性,比如合规的需求、专业数据库权限、分布式储存方案、OCR+语音解析、区块链存证、智慧法院数据互通等等。
对于很多在人工智能方面经验有所欠缺的中小型律师事务所来说,可以从最基础的本地AI部署方案开始。因为基础型部署主要成本在于硬件,运营维护的方式也较为简便。相比之下进阶型部署所需要的高额定制开发费用以及需要持续进行昂贵安全体系维护的旗舰型部署来说, 基础型部署对于中小型律师事务所有着很强的吸引力。
爆火的DeepSeek极大降低了普通人使用顶级AI的门槛,就像数年前会有当事人拿着搜索引擎的搜索结果,或者用短视频里的碎片观点来“参考”专业人士给出的法律意见相似,有些当事人会认为AI给出的“一本正经”的回答——特别是看到详细的推理过程之后——更加可靠。对于这样的情况,虽然可以通过一定的话术来重新树立起当事人的信任,但终究敌不过一句“我们律所使用的DeepSeek是经过专业法律知识库训练的,比您使用的通用大语言模型更加专业可靠,现在来看看我们的AI对您的这个问题是怎么思考的”让人心悦诚服。
对于法律服务行业的独特且保守的行业属性来说,并不需要跑过后面追的熊,也就是滚滚而来的AI浪潮,只需要的是能够跑过同行就够了。所以,私有的专业知识库,将是AI时代律师事务所的重要“护城河”。
律师事务所构建私有专业知识库有几个核心环节:
1.知识库架构设计
知识库架构设计上可以分为基础层、逻辑层和应用层,通过分层架构设计实现从原始数据到智能服务的价值转化。
基础层主要涉及数据存储和数据治理的问题,针对的是数据的精准检索。
数据存储系统可以采用NAS的存储集群,该技术具有可靠稳定、易于访问、方便共享、功能专业的特点。在数据库方面,既可以采用MySQL等对于案件文书、法律法规等结构化数据进行处理,也可以利用诸如ChromaDB、OrientDB等多模态数据库对于不同的非结构化的数据类型——比如文书扫描件、(官方公开的)庭审录音录像等——进行处理。
在数据治理方面,需要对数据中的敏感信息脱敏处理,并且可以考虑对于法律文本修订历史追溯、案件回溯等功能的支持。
逻辑层主要涉及知识图谱与组织。
对于知识图谱的构建,以裁判文书网公开判决为例,可以构建“法条-判例-司法观点”的基本关系映射三元组,并抽取案件中的“当事人”“判决法院”“主审法官”“争议焦点”“法律依据”“司法观点”等要素,形成可推理的法律知识网络。
对于搭建检索增强生成(RAG)系统,一个可参考的思路是FastAPI 作为后端框架,负责搭建 API 接口,实现与外部的交互;ChromaDB用于向量存储,高效管理文档的向量表示;LangChain 承担编排工作,协调各组件间的协作;DeepSeek-R1-Q4_K_M 671B模型负责生成回复内容;HuggingFace 的嵌入技术则用于将文本转化为向量形式,便于在向量数据库中进行检索⁵。需要额外强调的是,DeepSeek-R1-Q4_K_M 671B模型通常至少需要500GB以上的显存,但是似乎可以利用DeepSeek的MoE架构,将更注重算力而不是显存的FFN层放入CPU来减少硬件要求。
而对于模型的微调机制,可以使用LoRA技术对大模型在逻辑层进行微调,而避免了对整个模型的参数,比如671B模型就有六千多亿个参数,进行调整。
应用层主要涉及业务场景落地。
在功能接口封装方面,主要是API服务接口以及系统集成两方面的内容。API接口标准服务确保功能实现,系统集成方面主要是与现在大多数律师事务所使用的OA系统更好的对接。
同时,还需要注意系统权限的问题。比如权益合伙人、普通合伙人、执业律师、实习律师、行政人员等不同的权限划分。
另外,还要对常用的PC端和手机端(如果需要的话)增加支持。
2. 数据采集与清洗
作为专业的法律知识库,裁判文书网、执行信息公开网、国家法律法规数据库等等数百个中央和地方的官方公开信息和数据是必然需要采集的,当然这些数据可以由诸如北大法宝、威科先行等专业数据服务商有偿提供。相似的思路也可以用在域外法域的数据采集上,比如LexisNexis或Westlaw等等。
此外,律师事务所本所的历史档案文件也是值得深挖的宝藏。历史裁判文书、合同、纪要、备忘录、文章等等的整理归纳,结合着上述专业数据,形成初始的语料库。同时,由于部分档案是扫描件/手写件,可以采用OCR+NLP技术进行处理。
当然,由于这些历史档案文件中涉及诸多个人隐私、商业机密、秘密等信息,需要进行额外的脱敏处理。
3.模型微调训练与持续优化机制
正如前文提到的,私有专业知识库的本地大模型可以利用LoRA(Low-Rank Adaptation,即低秩适配)技术进行微调,这更符合律师事务所专业法律服务机构而非人工智能技术公司的属性。
对模型的微调训练与持续优化机制,决定了私有专业知识库的本地大模型与通用大模型的不同,更是对比同行的“护城河”。对于这一点,“我有一个绝妙的思路,但空白处太少,我写不下”。
在这一问题上,尽管有《新一代人工智能发展规划》(2017年),《国家新一代人工智能标准体系建设指南》(2020年),以及《全球数据安全倡议》(2020年)和《全球人工智能治理倡议》(2024年),然而当前我国关于人工智能的立法是缺位的,是仅存在年度立法规划与二十届三中全会的《决定》设定的目标中的。因此,在考虑人工智能相关的法律职业伦理与执业责任问题时,即便不涉及涉外业务,一定程度上参考《欧盟人工智能法案》(EU Artificial Intelligence Act)亦是非常有益的。从当前国内规范的角度来看,AI决策的透明度问题在法律服务行业中主要体现为三个方面的内容:
● 可靠性。《律师法》第3条第2款规定“律师执业必须以事实为根据,以法律为准绳。”同时,《律师执业管理办法》第32条规定“律师出具法律意见,应当严格依法履行职责,保证其所出具意见的真实性、合法性。律师提供法律咨询、代写法律文书,应当以事实为根据,以法律为准绳,并符合法律咨询规则和法律文书体例、格式的要求。”法律要求律师的执业行为必须“以事实为根据,以法律为准绳”,而人工智能的介入会动摇律师执业行为的可靠性:若只依据AI给出的结论来从事执业活动时,基础仅是AI的算法,并非事实或法律,而AI算法在当前绝大多数情况下又是“黑箱”。因此,律师必须对AI生成结论进行人工干预和审查,确保其真实合法,符合执业规则要求。
● 隐私性。《律师法》第38条第1款规定“律师应当保守在执业活动中知悉的国家秘密、商业秘密,不得泄露当事人的隐私。”在利用AI赋能法律服务时,会涉及当事人或其他敏感信息披AI系统采集。在这个问题上,似乎通过明确告知客户AI辅助的使用场景以及要求得到客户明确对于AI利用信息的授权来加以解决。
● 记录保存。《律师执业管理办法》第46条规定“律师承办业务,应当妥善保管与承办事项有关的法律文书、证据材料、业务文件和工作记录。在法律事务办结后,按照有关规定立卷建档,上交律师事务所保管。”那么在利用AI辅助进行法律服务活动时,律师使用AI过程,包括输入指令、输出结果、修正内容等记录文件,是否属于该办法规定的“业务文件”或“工作记录”,且需要“立卷建档,上交律师事务所保管”,是存在疑问的。
《欧盟人工智能法案》对于律师事务所部署的本地AI,如果仅仅用于诸如法律文书生成辅助、法律数据库检索等途径,通常不会被认定为是高风险AI,而在涉及可能的生物识别、(警务)执法系统、(法院)司法程序时⁶,就可能被归类为高风险AI。该法案关于透明度的规定主要有:
● 披露义务。即便律师事务所部署的本地AI并不被认定为是高风险AI,在向客户交付AI生成的结论时,必须标注AI参与的诸如判例检索、合同条款生成等具体内容;若客户会与该系统直接交互,还需要告知他们正在与AI系统进行交互⁷。
● 可解释性。若该本地AI被认定为是高风险AI,比如涉及可能的生物识别、(警务的)执法系统、(法院的)司法程序时,该AI需要对其输出的结果能够进行清晰充分的解释,确保其部署者理解决策依据⁸。
● 风险管理体系。对于高风险AI来说,应“建立、实施、记录和维护”相应的风险管理体系,且该风险管理体系伴随次高风险AI全生命周期并持续迭代⁹。
1. 责任主体的问题
根据《律师法》第2条第1款,律师应当是相应法律服务关系的法定主体,因此即便有AI的介入,律师自身的执业责任也不应因此免除。譬如因律师使用了错误的AI生成法律文书,则对于该律师而言,可能会违反《律师职业道德和执业纪律规范》第5条的“勤勉尽责,尽职尽责”等义务,因此依据在于《律师法》第54条,该律师——而非AI系统——会对可能造成的损失承担责任。
2.AI辅助的功能限制
由上段分析不难得出,在法律服务的法律关系中,律师而非AI系统是相应的法定主体,因此对于律师的相应限制也应当,从理论上来说,适用于作为辅助工具的AI系统中。
一个具体应用的例子是,《律师执业管理办法》第33条第1款规定,律师“不得用明示或者暗示方式对办理结果向委托人作出不当承诺”,而律师事务所部署的本地AI系统是否受到该限制,是可能存在一定争议的。在认定律师为法定责任主体而AI系统仅为辅助工具的思路下,似乎应当认为此等对于律师行为的限制也应当扩展到AI辅助的功能上:亦即律师不得利用AI的途径瓦解掉对“不当承诺”的限制。
3.利益冲突
在这一问题上,也说明了为什么律师事务所一定需要部署本地的私有AI。考虑这样的情形:某案件中的原被告双方(及其律师),都使用相同的云端AI平台,那么该云端AI平台在此案件中就有了利益冲突(即便在认为律师使用AI工具不瓦解掉律师本身主体责任的前提下)。而如果使用私有的本地部署AI就能避免这样的问题,能在最大程度上尊重现行法规范的同时实现AI赋能法律服务行业的结果,因为《律师法》第23条已经要求律师事务所建立健全利益冲突审查制度了。
针对目前相关人工智能利用规范缺位的具体情况,律师事务所部署本地私有AI,在技术层面上,或许需要额外做好相关的记录留痕系统,并确保AI系统的可解释性;在制度层面上,需要制定诸如《XX律师事务所AI使用规范》等内部制度规则,明确相关权限与流程,防止可能的责任风险;在监管层面上,要保持在利用人工智能赋能法律服务方面与监管部门的积极互动。
(一)DeepSeek对那些之前就建立了知识库的头部律所们有什么大的影响吗?
对于那些智能化建设比较成熟的头部律所来说,DeepSeek的出现类似于“版本大更新”,只需要把DeepSeek接入原先有的知识库和外部接口(Alpha、OA、文书网等)就行了。但问题在于并非所有的头部律所智能化建设都能称得上比较成熟。据了解,有的律所智能化建设使用的“定制化系统”十分昂贵,但是差劲,并且没有足够好的(甚至就根本没有)大语言模型。
DeepSeek最大的贡献在于将商用人工智能的门槛降到了前所未有的低,相当于拉平了之前头部律所的领先优势。
(二)AI扩展新的法律服务边界具体指的是什么?
这里至少会涉及以下几个方面的内容:
首先,新的服务领域。比如“算法自动化决策侵权”、“算法偏见治理”、“人机责任划分”等新的法律问题;
其次,新的服务方式。7/24的智能法律咨询、格式化文书生成,等等;人类律师更多提供情绪价值、经验性缄默知识、创新性解决方案等。此外,在AI的加持下律师还能够更容易的使用其它工具——比如之前提到的利用Python梳理证据的例子——使得法律服务效率更高效;
值得一提的是,因为DeepSeek的开源,很多专门做toB智能化定制的订单被大量取消,各地政府分别推出各自的DeepSeek智能系统,比如重庆两江新区的“江问”。这也意味着“企业级智能化系统”产业从有较高门槛(更不透明)的“系统开发”,转变为极低门槛(透明度很高)的“系统安装”;
最后,新的服务业态。这个命题更宏大遥远,说的是AI带来生产力的逐步提升,让大规模标准产品的生产非常高效与廉价,而“非标”的“定制化”服务,将成为包括法律服务在内所有第三产业的方向。
(三)本地AI对保密义务为什么重要,人工隐去关键信息不行么?
本地AI对保密义务非常重要,人工隐去关键信息只是理论上成立。三个例子:
1.云端AI的利益冲突。如果原被告双方都使用同一云端AI怎么办?
2.超长文本处理。特朗普被刑事起诉时起诉材料页数有一千多万页,这样超大数量的文本处理使得人工隐去关键信息太过困难(同时,这样超大数量的文本生成也需要AI的辅助)。同时,之前马斯克短时间拦截约翰逊的1,547页长提案突击也是利用的AI工具;
3.人工脱敏不足够。比如涉及重大刑事案件,办案机关是否会有较强获取云端AI记录的冲动是有一定疑问的(譬如最近咨询DeepSeek偷窃案脱罪的新闻¹⁰);资本市场案件,即便没有甲方明确要求,也可能因为相关信息(所谓的非实质的非公开信息的问题,non-material non-public information,比如公司高管行程计划、监控的停车场客流量等等。即便只有这些碎片化的零碎信息也可能被相关从业者推断出额外实质性内容,进而指引他们的交易决策)泄露造成重大利益影响;政府事务等等。
(四)本地部署AI能解除云端AI的哪些限制?
主要是功能方面的限制解除。云端会有更多的敏感词限制,本地AI没有。云端AI有分析文本长度限制,本地AI没有。云端AI更难调节temperature(联想活跃度),本地AI更容易。
另外,本地AI结合私有知识库能够更垂直,给出的分析和结论可靠性更高。
(五)本地模型规格问题:从个人到律所
个人使用和律所共同使用的本地模型都是要671B的“满血版”模型,因为其它模型不够精确,且要为后续升级留余量。两者主要区别在硬件上。
个人(2-3人小团队)使用的本地部署模型硬件要求8-12万左右,这是目前能看到的最便宜的本地部署671B模型的硬件配置,同样具备知识库的功能,主要差距在运行速度慢,响应延迟高。
而律所使用的本地模型要求会在40万以上,会有更高的响应速度,更便捷的访问方式(手机,NAS等)、更好的安全性、更高的并行数、更多的功能(链接官方、链接外部数据库、链接OA等)、更强的稳定性等等。
(六)如何在DeepSeek广泛使用的情况下,寻找到律师个人和律所品牌的优势
就像前文所述,律师提供的情绪价值、经验性缄默知识、创新性解决方案等方面的法律服务,在一段时间内是难以被AI取代的。
但是从大的趋势上来看,笔者的一点不成熟的想法是,AI技术就是后面在追的熊,我们并不需要跑得比熊快,只需要跑得比同行者/同行快,就是胜利。人工智能的潮流浩荡,无论是律师个人或是律所品牌,作为时代的个体,只能积极拥抱。这样才能在存活于时代浪潮下的基础之上,寻求新的机会。
(七)传统合伙制律所投资本地AI部署积极性不高
如果我们把当前的律师事务所类型分为公司制、合伙制、提成挂靠制三种类型的话,不难发现,公司制的律师事务所会有很强的部署本地AI的积极性,提成挂靠制律所由于其业务模式,很难愿意投资部署本地AI,而介于两者之间的传统合伙制律所则是进退两难。
作为“手工匠人联盟”的传统合伙制律所,要推动本地私有AI部署,如果有合伙人不愿意怎么办?如果仅仅只有部分合伙人的投资,那其他人“搭便车”怎么办?尤其这类需要长期持续投资,且回报并不明显和即时的项目?坦白说,这些问题很难概括回答,各个律所具体情况不一,对待AI技术的态度也不同,只能根据具体情况具体分析,进而协商解决。不过笔者在这里可以提出几个传统合伙制律所部署本地AI的优点供参考:
1.知识资产固定。几乎所有律师事务所都会面临人员流动的问题,尤其对于传统合伙制律所来说,“人走经验失”似乎是难以避免的。然而利用“AI+私有知识库”的方式,一方面将既往案件的材料留存在“知识库”中,另一方面也将那些离开的律师的经验,转化为可复用的本地AI训练结果。
2.可信的合伙人争议解决参考。在可能涉及收益分配的场景中,本地部署的AI可以根据律师事务所合伙人的贡献数据不同,给出明确的参考意见。这对于解决合伙人之间的争议,维系律所品牌长青,是一个可信的参考。
3.提升青年律师办案质量。律师事务所的人才梯队建设是每个律师事务所都绕不开的话题。利用律师事务所私有的“AI+知识库”,一方面在既往案件知识的加持下更好培养青年律师办案能力,另一方面辅助青年律师开展法律服务,提升办案质量。
4.构建品牌效应。部署本地AI可以成为差异化竞争点,可以吸引大量客户,同时能够极大提升律所的品牌形象,且有利于开拓新的市场。
行文至此,非常感谢尊敬的读者看到这里。笔者想请您思考这样三个问题:
1.假如您是律师,有客户以他使用DeepSeek的结果来“指导”您的执业行为,您会怎么做?
2.假如您是律师事务所的合伙人,其他同行已经开始利用开源的大语言模型构造出“场景+数据+技术”的专业“护城河”了,您会怎么做?
3.假如您是司法行政机关的工作人员,很多案件的双方当事人(及其律师)都会使用同一云端AI平台,这便有了利益冲突,您会怎么做?
律师事务所部署本地AI就像一根强大的魔杖,只需要轻轻一挥,上面的三个问题就能得到解决。
那么,您现在思考的问题,又是什么呢?
1、Huang L, Yu W, Ma W, et al. A survey on hallucination in large language models: Principles, taxonomy, challenges, and open questions[J]. arXiv preprint arXiv:2311.05232, 2023.