司法大数据与人工智能开发 需反思片面技术理性思潮

当下在司法大数据与人工智能开发过程中出现了片面技术理性的论调,突出表现在认为技术能够解决一切问题。

李卓谦东大国际战略智库

2019-06-29来源:民主与法制时报

本文原载于《民主与法制时报》第78期

东南大学法学院副教授王禄生从事司法大数据研究多年,针对当下在司法大数据与人工智能开发过程中出现的片面技术理性论调,王禄生认为“有所为、有所不为”应该成为推进司法大数据与人工智能技术应用的基本原则。近日,王禄生接受民主与法制社记者专访,对这一问题进行了深度剖析。

东南大学法学院副教授王禄生从事司法大数据研究多年,他认为前沿科技与司法领域的融合确实改变了传统司法运作的面相,也实质上为司法效率与司法公正的提升创造了全新可能,但当下在司法大数据与人工智能开发过程中出现了片面技术理性的论调,突出表现在认为技术能够解决一切问题。近日,王禄生接受民主与法制社记者专访,对这一问题进行了深度剖析。“有所为、有所不为”应该成为推进司法大数据与人工智能技术应用的基本原则。

人工智能为法官办案提供帮助

王禄生认为,在“智慧法院”的整体架构下,大数据与人工智能技术被整合到四大应用场景之内——服务社会公众、服务案件审判、服务判决执行、服务司法管理。其中,为法官办案提供智能辅助是“智慧法院”建设的核心目标之一。“从目前全国各地的实践来看,类案推荐、量刑辅助与偏离预警是大数据与人工智能技术在辅助法官办案即‘审判智能化’领域最为耳熟能详的应用。”

具体到实践中,人工智能如何给法官提供帮助?

王禄生介绍,类案推荐,即推荐与在办案件最为相似的案件,而判断是否类似的标准主要是案件情节、适用法条与争议焦点。

“该功能是目前全国各地智能法院办案系统几乎必备的模块,主要包含类案的快速查询、智能推送等功能,并可以进一步衍生出类似案件适用法条推荐、争议焦点推荐、主要证据推荐等功能。”王禄生说。

从技术路径来看,量刑辅助系统就像天气预报系统,运用函数对各种变量(案件情节)运算推测结果。

“从目前的开发来看,部分系统可以根据司法办案系统内部的文书(如起诉书、庭审笔录)自动提取情节,从而匹配案件并进行量刑的推荐;部分系统则可以基于法官勾选情节的方式实现量刑推荐;也有部分系统两种功能实现方式兼而有之。”王禄生指出,应当明确的是,该系统只是为法官提供参考的工具,直接让人工智能作出裁判并不符合司法的基本伦理。

如果说“量刑推荐”是针对法官未决案件的智能辅助的话,“偏离预警”则更大程度上定位在对已决案件的质量控制。

“它就像电梯的超重警报,对法官的裁判具有防控风险的功能。”王禄生举例:以刑事案件为例,系统通过运算能获得关于本案的量刑区间,这个量刑区间的准确性也依赖于系统的成熟度与数据的完整度,数据越完整,量刑区间就越准确。系统把法官审理案件的裁判情况与人工智能的量刑区间进行对比,偏离特别高的话,意味着裁判结果可能存在问题。

法律知识图谱构建过程对人工过度依赖

知识图谱构建是司法大数据与人工智能引用的关键环节。王禄生认为,现阶段法律知识图谱构建的自动化水平较低。

“由于法律数据主要以非结构化和半结构化形式存在,对结构化数据有较大依赖度的‘自底向上’的自动化、半自动化构建图谱面临一定困难,人工智能通常无法自主完成法律知识图谱中的实体抽取、关系抽取与属性抽取等工作。”王禄生解释说,多数研发主体采用“自顶而下”的方式,通过人工构造语法与语义规则推进知识图谱的构建工作。然而,刑事案件的案由有400多种,民事案件的案由更是可以细分为上千种,所以,“自顶而下”法律知识图谱构建过程对人工的过度依赖是现阶段司法大数据人工智能发展面临的最大难题之一,“进而言之,由于案件知识图谱构建速度与精度不足导致了现有的智能办案辅助系统的案由覆盖面相对有限。”

自然语言处理技术存在短板

尽管法律文书大致按照统一的格式展开,但法官和检察官在撰写法律文书时就相同事项却存在着多样化表述方式。也就是说,在知识图谱构建之后,无法通过传统的关键词匹配的方式提取情节,而是必须借助成熟的自然语言处理技术。

王禄生举例说,在法律文书中,被告人自首可能有相当多样的自然语言表述,除了“自首”之外还可能是“自动投案”“代为投案”“如实供述罪名”等。自然语言处理技术的目标是能够把一切实际上“自首”的自然语言表述精准识别,哪怕整个文书中并未出现“自首”二字。此种技术相较于传统关键词严格匹配的提取技术而言无疑有着极为显著的优势。

他认为,现阶段不同的研发主体,在该技术积累方面相差悬殊。

“实践中,绝大多数研发主体较多地运用了通用的自然语义识别技术,未有针对性地根据司法场景进行迭代开发。”王禄生说,这就会让人工智能在基于案件知识图谱提取案件情节时出现错误与遗漏,比如,盗窃罪案件中,法官对盗窃金额的描述可能分布在文书的不同位置,如果一个案件事实是盗窃了5000元,而自然语义识别技术却将金额识别为2000元,那么就会导致后面的包括类案识别、量刑的模型训练产生错误。

王禄生表示,正因为普遍存在法律场景中自然语言处理技术的短板,现阶段有相当部分研发主体还无法实现案件情节的全自动提取,由此人工为案件打标签的方式成为行业的常态,“这无疑极大地限制了情节提取的效率”。

类案识别准确率有待提升

依据已经构建好的案件知识图谱,通过自然语义识别技术从海量文书中提取情节,将每个案件全方位地结构化与标签化,然后就可将具备相似情节的案件进行整合分类,形成不同维度之下的“类案”。

尽管思路很清晰,但是王禄生表示,当前类案识别面临的问题主要是准确率有待提升。他解释说原因有两点:

一方面,类案识别的底层技术,不管是图谱的构建还是自然语义识别,在技术上都面临瓶颈。另一方面,非常重要的原因是,一线开发的技术人员往往未能准确定位一线法官对类案推荐的实际需求。

“一线法官在不同场景对类案推荐的业务需求是差异化的。对于简单案件而言,法官期待的‘类案’可能是情节高度匹配,而对于复杂案件,法官对‘类案’的期待则可能是法律关系或者争议焦点相同。”王禄生认为,在这种应用场景中,完全情节匹配反而无法满足法官的需求。

模型训练存在技术瓶颈

实现类案识别后,就要对人工智能进行模型训练。这是最为关键的一步,也是体现各个研发单位核心竞争力的步骤。目前,司法人工智能通过模型训练形成的算法,都是建立在对海量文书学习、训练的基础上的,但是,王禄生表示,研发人员在现有技术条件下无法保证训练的样本文书全都是绝对正确的。

王禄生认为,如果文书本身就是错误或者存在瑕疵,基于这些文书训练产生的模型与算法就可能遭遇精确性困境。进而,再遵循这些算法对法官办案进行辅助,可能的结果就是历史的经验错误被不断放大并形成固化错误的“路径依赖”。

除此之外,王禄生还表示模型训练还面临“小样本难题”,“这就是说,人工智能的量刑模型训练往往需要结合海量文书的深度学习形成,而司法实践中部分案件整体样本较少。在样本不足的情况下,大数据智能将面临困境。”
一线法官对量刑预测存在忧虑

王禄生介绍说,海量精准算法的积累使得量刑预测成为可能:当一个案件传入法官的裁判系统之后,就算仅有公诉文书,人工智能也可以通过自然语义识别技术,提取案件情节,根据先前形成的算法推导量刑结果。

“公诉文书提供的情节一般比较少,细节也不清晰,所以预测结果可能不准确,但是随着案件诉讼程序向前推进,相关的信息就会越来越多,系统作出的量刑预测就会更准确。”王禄生说,量刑预测就像是预测天气情况一样,根据条件推出可能的结果,预测天气是为了未雨绸缪,预测量刑则是为法官尚未裁判的案件提供参考,帮助法官发现、解决问题。

量刑预测是通过一套算法作量刑的预测,包括罪名预测、刑期预测和罚金预测。法官们本应会因为有个得力的助手而感到期待,然而王禄生说,事实上,一线法官因为不知道算法是什么,不清楚这种量刑预测是如何计算出来的,因此对这种量刑预测的系统似乎有些忧虑。“这其实也是人工智能的悖论导致的,即人工智能算法的隐蔽性和案件裁判过程透明性间的冲突。”王禄生说。

司法大数据与人工智能技术未来可期

大约从2013年开始,我国法院进入了以智能化为核心的“智慧法院”建设时期。这实际上就是在传统司法信息化建设的基础之上,进一步利用大数据与人工智能等前沿技术,在人民法院全业务、全方位和全流程实现网络化、阳光化和智能化。

此后,“智慧法院”建设的司法现代化规划逐步被国家战略所认可。2016年7月,中共中央办公厅、国务院办公厅印发《国家信息化发展战略纲要》和《“十三五”国家信息化规划》,将建设“智慧法院”列入国家信息化发展战略。2017年7月出台的《新一代人工智能发展规划》中则明确将“智慧法庭”列入规划。

王禄生认为,可以预见在未来一段时间内,大数据与人工智能驱动的“智慧法院”建设将会成为法院系统的工作重心之一。不过他也表示了自己的担忧:在司法大数据与人工智能开发的过程中出现了片面技术理性的论调,突出表现在认为技术能够解决一切问题。

对于司法大数据与人工智能技术的未来,王禄生充满期待。他认为,从人类社会的历史来看,科学技术一直呈现出加速发展的状态,“也就是说,我们今天看起来的诸多司法大数据与人工智能的技术障碍也许在不远的将来就能够得到破解。科技部2018年专门推出了国家重点研发计划的司法专项,我提到的绝大多数技术障碍都在这个专项的覆盖范围之内。”

王禄生还认为,即使技术取得了重大突破,我们也必须充分意识到,司法有自身特殊的属性。这也决定了前沿技术与司法的融合需要遵循一定的限度,尤其要避免片面技术理性的误区。概括起来,“有所为、有所不为”应该成为推进司法大数据与人工智能技术应用的基本原则。


分享到:

合作

  • 官方微信
  • 官方微博