本站首页 关于我们 法律图书馆与法律信息研究会 法律信息研究 中外法律图书馆 法学文献与检索 政府信息公开 法律图书馆导航 法律法学网导航
法律信息资源
法律信息服务
数字信息检索
数字技术发展
专业网站建设
澳门法律信息
  当前位置:首页 > 法律信息研究 > 法律信息资源
法律信息资源
暂无下载资料

 中国司法裁判文书网络公开的大数据分析
            马超等 点击量:11973
清华大学法学院
【摘要】
在互联网公布裁判文书是本轮司法改革着力推进的一项改革措施。自 2010 年与 2013 年先后两版《关于人民法院在互联网公布裁判文书的规定》发布以来,裁判文书上网已经取得了巨大的进步。我们利用信息技术对目前中国裁判文书网公布的所有文书进行了重新提取与分类整理;对已公开文书进行了一次全景式的扫描,通过翔实的数据展现了我国裁判文书公开的现状与态势。利用这些数据,结合实地调研,通过定量分析与定性分析相结合的方式,我们对裁判文书公开的全面性、及时性以及公开内容的妥当性进行了全面考察。结果显示,文书公开的全面性依然不足、公开的及时性效果欠佳、公开内容规范化程度不高,背后存在公开规定细节模糊、监督管理体系不够完善、信息技术能力不足、审判区域差异明显等原因。我们对这些问题给出了力所能及的改进建议。
【关键字】
裁判文书上网;司法大数据;司法公开;中国裁判文书网
    

    一、引言

    (一)裁判文书上网的背景与进程

    1.裁判文书上网的背景与价值

    裁判文书公开是司法公开的基本内容,是树立司法公信力的基本要求,也是本轮司法改革的重要目标。与人员管理改革和审判质量改革等改革内容相比,裁判公开在内外部,均有独特的价值。就内部功能而言,裁判文书上网有助于倒逼审判公正性与文书质量的提高。当一份裁判文书不再只面对个案的当事人和少数的法律专业人士,而是有可能接受社会大众的检阅时,法官无疑会更加谨慎地对待案件的审判与裁决。就外部功能而言,裁判公开所面向的是不特定的人群,相较于员额制、省级直管等内部改革,它的受众范围要广泛得多。司法改革可以藉此揭开司法的神秘面纱,拉近与公众的距离,收获更大的社会影响。对于社会来说,裁判文书是司法公正性和公信力的集中体现,是民众对司法公正美好想象的具体载体,法院的公正形象正是由一份份的司法文书累积塑造的。

    2.裁判文书上网的进程

    最高人民法院(以下简称最高法院)先后在2010年、2013年、2016年三次发布了《关于人民法院在互联网公布裁判文书的规定》(以下简称2010年版文书上网规定、2013年版文书上网规定、2016年版文书上网规定)。它们分别代表了裁判文书上网进程中的不同阶段。

    在2010年以前,裁判文书的公开是零星的,主要是通过一些学术研究渠道,缺乏专门的批量公开的渠道。2010年版文书上网规定发布以后,一些省市的中高级法院开始在各自网站有选择性地公布一部分裁判文书。具体数目虽然难以作出统计,但参考北大法宝的收录数据,可以从侧面得到印证。在2011年到2013年之间北大法宝收录的结案文书数量从2011年的四十多万份攀升到2013年的近百万份,增长了一倍多。2013年版文书上网规定发布以后,收录数量更是直线跃升,一年时间增长了两倍,2014年收录量近三百万份。由此可见,两版文书上网规定在推动文书上网的过程中起到了“发动机”的作用。2016年版文书上网规定再次完善了相关要求,必将大大推进裁判文书上网;但它尚未生效,因而不在报告讨论的范围。

    (二)既有的研究

    自2013年“中国裁判文书网”(以下简称裁判文书网)上线以来,不少具有前瞻意识的司法从业人员和数据从业人员均嗅出了其中潜在的巨大价值。一些法律界内外人士结合相关网络技术,利用裁判文书网所公开的数据做过一些有益的研究。

    在学术界,一些学者在裁判文书网建立之前就已经关注到了司法公开的重要意义。浙江大学钱弘道教授与浙江省高级人民法院合作,展开“司法透明指数”的研究。中国社会科学院田禾教授及其带领的研究团队自2011年起,每年发布《中国司法透明度指数报告》。这些研究对司法公开与裁判文书上网均起到了积极的推动作用。但这些报告普遍采用的仍然是项目打分制,关注重点在于法院公开信息种类的全面性与实效性,并不以大数据分析为主,与本报告的关注问题与研究路径有所区别。还有一些学者和实务人士较早利用裁判文书网的数据进行观察或者研究。周蔚博士的《大数据解读2014年裁判文书公开》,对裁判文书网数据作全景式扫描。针对具体的法律部门或某一地域作为数据分析样本的则更为多见,如高荣英律师所做的《北京市专利侵权案件数据分析报告》,《财经》记者王丽娜所做的《公开判决书中的贿赂案件大数据分析》3,以及王璟文律师所带领的课题组针对广东省民商事案件所做的一系列大数据分析报告等。这些分析报告一般均公开发布在互联网,使用普通检索方式即可获得。此外,一些商业性质的法律服务机构也会为各级法院提供更专业的一对一数据分析服务,但这些报告一般并不对外发布。

    上述这些数据分析报告作为法律界的“新生事物”,在许多方面颠覆了传统法律人士的想象,具有前瞻性和开拓性,也具备相当的实用价值。尽管如此,这些报告的数据收集与分析方法仍然较为粗放,具有一些普遍的缺陷。主要有以下几点:第一,现有的报告数据来源往往直接取自裁判文书网的检索结果;而根据我们观察,裁判文书网的检索算法并不完全准确,一些数据甚至难以自圆其说。例如,在裁判文书网检索设定法院层级为“基层法院”,审判程序为“二审”,仍可获得数千件案件的检索结果;在裁判文书网民事案件类别下检索“信息公开”,也可以获得相当数量的检索结果。第二,取词检索的数据获取方法过于简单,缺乏“精加工”,易导致结果偏差。由于裁判文书的复杂性,特别是现阶段文书的格式化程度不高,它并不能完全满足数据检索精确定位的需要。某一特定字段出现在裁判文书中的原因可能与检索者的实际需求相去甚远,还有一些项目不借助技术手段更是难以获知。例如,最高法院有裁判文书生效后7日内上网的规定,究竟有多少文书在公开时符合这一要求,通过普通的检索手段是难以获得的。第三,一些数据分析报告没有交代其检索的方法和标准,其研究结果无法验证。总而言之,现有的数据分析报告尽管具有一定的价值,但其精确性仍难以作为学术研究的可靠依据。

    (三)研究对象与研究目的

    本报告以裁判文书上网为研究对象,主要关注裁判文书网自上线以来各级法院文书发布的情况。必须指出的是,裁判文书网虽然是全国统一的公开渠道,但并非唯一渠道。许多中高级法院除了在裁判文书网公开文书外,也有自建的公开渠道。限于研究能力,我们无法对这些省级网站的公开文书逐一进行统计。本报告的主要研究对象与数据来源仍是裁判文书网。

    本报告主要目的在于对裁判文书网上线以来所公开的所有裁判文书作一次全面的深度扫描,为法律界人士提供一份可供参考的文书公开全景图,并就这份全景图中的一些现象给出我们的分析。同时,考察最高法院2013年版文书上网规定的具体落实情况,并提出相应的改进建议,也是本报告的主旨之一。因此,我们在本报告中主要关注的是裁判文书网究竟公开了哪些文书、各部分占比如何、文书公开的方式是怎样的、公开文书的质量如何、文书公开的及时性如何、现有的裁判文书上网规定是否得到了落实、现有规定的可操作性如何等。换言之,我们在报告中更侧重于关注的是文书“公开”的一面,而非具体的文书“内容”。

    (四)研究方法

    本报告主要采用定量分析与定性分析相结合的方法。一方面,作为一份以大数据作为主要方法的研究报告,定量研究是我们的题中应有之义。我们与北京华宇信息技术有限公司(以下简称华宇公司)的技术人员合作,花费一年多的时间,搭建了较为完善的数据库与检索系统,尽可能地保障数据的精准性与可靠性。另一方面,尽管我们身处数据时代,但数据并非万能,它既受限于当前的技术水平,也受限于复杂的现实环境。在报告中,我们对数据的使用仍然是谨慎的;在许多问题中,我们都作出了保留说明,并力争使其与过往的经验研究能够相互印证。在社会热点案例公开与裁判文书隐名等不适合运用大数据进行分析的问题中,我们仍然采用小样本的抽样调查和定性分析作为基本研究手段。我们相信大数据作为一种研究方法将会在未来的法学研究中占据一席之地,但并不迷信大数据。

    本课题组在研究期间还曾先后到最高法院信息中心、东南沿海、西南内陆等地区的各级法院进行调研,在四级法院了解到了有关裁判文书公开的第一手信息与资料。通过考察这些调研收集到的经验素材和直观感受,不仅有助于我们解释报告中的一些数据现象,而且有助于我们更深刻地理解这些现象背后的制度成因。

    (五)技术说明

    本报告的基础数据来源是裁判文书网自上线以来所公布的所有裁判文书。本课题组与北京华宇信息技术有限公司的技术人员进行了紧密合作,对裁判文书网所提供的裁判文书通过一定的技术手段进行提取之后,架构了全新的系统进行分类整理。在系统架构的主要阶段,本课题组均与技术人员一起合作,通过一年多的不断调试,反复通过人工阅读与软件检索进行比对,在现有的技术水平下最大限度保证了数据的可靠性。其中,以下几点需要特别说明。

    第一,在分析对象的时间限定上,我们将本报告的分析对象上传起始时间定为裁判文书网上线的2013年7月1日,截止时间定为2015年1月31日。5

    由于现实中裁判文书上传的及时性不佳,以及各级法院仍然在不断上传裁判文书网上线之前的裁判文书,所以裁判文书网的数据一直在不断变动之中。例如,我们在研究中发现,许多制作于2014年甚至更早的文书,至今仍然在不断上传导致2014年的公开总数一直在变动之中。因此,我们必须为研究对象设定一个闭合的时间区间,否则研究中的分子与分母将始终无法确定。这也是许多现有分析报告数据不够精确的原因之一。我们所使用的数据库在2015年12月31日后,除技术改进外,数据不再更新。这样尽管损失了一定的数据全面性,但保证了同一类别下的数据在不同的提取时间下是相同的,不同种类的数据也是可比较的。

    第二,在系统调试中,我们发现数据不精确主要是以下三种原因所导致的,我们一一作出了技术应对。(1)裁判文书本身的写作错误。如落款时间应为“二〇一四”,文书中写为“二〇〇一四”;“××县人民法院”,则误写为“××县中级人民法院”。类似的写作错误不胜枚举,在一定程度上导致对一部分裁判文书无法判断具体属性。我们的具体办法是从这些属性缺失的文书中抽取一部分进行人工阅读,总结常见的错误类型,对系统进行针对性的修改,使其能够分辨较为常见的一些写作错误,尽可能地挽回了这部分数据的有效性。目前经过我们修正的含有各种错误类型的裁判文书约占全部的5%。

    (2)裁判文书网自身的问题。由于我们数据库的基本数据来源仍然是裁判文书网,其中一些技术问题也难以避免地进入我们的系统之中。比如北京某法院曾经将上百份信息公开案件的文书错划为民事裁判文书,一些基层法院审理的案件在裁判文书网却被归类为二审文书。这些错误尽管数量不多,但可能在进行某一类问题分析时产生关键影响。我们的应对办法是尽可能通过技术手段将裁判文书还原为原始状态,即未上传之前的原始格式,然后按照一定的技术标准重新进行数据清洗与属性归类。

    (3)不同系统之间的格式兼容问题。由于技术标准的区别和系统架构的不一致,即便是同样数量的文书录入不同的系统,其得出的总数也会有很微小的区别。在不同标准下,总是存在个别无法识别的文书。这也部分地解释了,市场上许多法律服务机构提供的法律检索数据库,原始数据均来自裁判文书网,总量却有高有低。为了保证数据的权威性,技术人员通过不断的技术改进与系统调试,尽可能地与中国裁判文书的数据总量保持一致。如我们在2016年1月1日通过截图方式保存的裁判文书网当日总数为14,294,297篇,目前我们数据库中文书总数为14,555,018篇,误差在2%以内。6

    第三,在本报告中,常常会出现将一部分数据列为“属性缺失”的情况。这里的“属性缺失”主要指系统无法识别的裁判文书,也包括一些可以识别但因为各种原因无法利用的文书。属性缺失主要是因为个别文书由于文件损坏或质量粗糙实在难以识别。尽管在总量中占比极小,但我们仍然谨慎地将个别无法解决的问题在做具体分析时列为属性缺失,而不是一概忽略。除此之外,还有一些裁判文书问题是技术手段无法解决的。比如安徽省合肥市中级人民法院的一份刑事裁定书[案号(2014)合刑执字第04705号],发布日期为2014年6月9日,但文书落款却为2014年6月12日也就是说,这份文书“神奇”地在制作完成之前就已经发布了,它的上传与制作间隔天数为负值。因此,尽管这份文书我们可以通过技术手段识别,但在考察裁判文书上传的及时性时,我们必须选择性地将其列为属性缺失类文书。与此相似的数据问题还有许多,限于篇幅不再一一列举。

    第四,必须声明的是,受限于我们的经验与水平,以及技术发展的阶段性,本报告肯定仍存在许多瑕疵与漏洞。尽管我们与技术人员紧密合作,做到了尽可能完善,但问题始终是难以穷尽的数据也永远不会完美,误差总是不可避免的。

    二、裁判文书公开的全面性考察

    (一)2013-2015年裁判文书公开概况

    1.裁判文书发布总量

    裁判文书网开通时间为2013年7月1日。但制作于2013年之前的部分裁判文书,在各级法院的努力下,也一直在裁判文书网陆续公布。本报告的考察对象是裁判文书网开通以来至2015年12月31日发布的所有文书。在上述区间内,我们共收集到14,555,018篇裁判文书。这些裁判文书制作时间主要集中于2014年与2015年。我们根据最高法院网站发布的《人民法院年度工作报告(2014)》与《2015年全国法院审判执行情况》中公开的数据进行计算,得出2014年与2015年全国总共审执结案件数约为30,520,675件。公开文书数量与办结案件的比例在50%左右。尽管案件与裁判文书并非是一一对应关系,一个案件可能有多份文书存在(比如法院在作出驳回管辖异议的裁定后,继续审理该案件,并作出判决);而且案件办结时间与发布时间之间往往存在比较长的间隔,因此这种比较并不完全准确,但具有一定的参考意义。考虑到裁判文书公开推进时间尚短,软硬件基础设施还在建设过程中,50%左右的文书公开比例值得赞赏,也令人鼓舞。但另一方面,与裁判文书公开的目标和最高法院的要求相比,文书公开的比例在未来应当还有很大提升空间。

    2.裁判文书类型分布

    表3为各种裁判文书类型在总量中的分布情况。由表3可知,判决书占比超过一半,占相对多数。判决书与裁定书合计占比超过98%,居于绝对多数。这符合法院作为一个审判机关的职能定位。但值得注意的是,其他几种程序类文书类型,虽然占比较小,但仍然存在。在《〈关于人民法院在互联网公布裁判文书的规定〉的理解与适用》(以下简称《理解与适用》)中,最高法院明确将裁判文书限定为判决书、裁定书、决定书与调解书。但由于2013版文书上网规定第4条第3项明确将调解书列为公开排除事项,实际应当在互联网公布的裁判文书只限于判决书、裁定书、决定书三种。9因此,其他类型文书的存在,只能算是一个意外的惊喜。但被明确排除公布的调解书仍然有一万多份被公布,按当时的规定,就属于把关不严了。表3中属性缺失部分占比为0.76%,不到1%。考虑到技术原因与现实原因,这一水平应该说是较为理想的。

    3.案件类型分布

    表4为所有公布裁判文书中,不同案件类型的文书数量与占比。民事类文书占比62.54%,稳居第一。刑事类文书接近20%,执行类文书近15%,行政类文书3.62%。我们根据《人民法院年度工作报告(2014)》中给出的公开数据进行计算,得出2014年度各类案件审结数量占总审结案件的大致比例,也列在表4中。民事类文书、执行类文书、行政类文书在文书总量中的占比与这三类案件审结占比基本相符。但刑事案件相关文书公开的比例最高。根据计算,2014年刑事审结案件占全国审结案件约8.29%,往年的数据也大致是在这一水平上下浮动,但刑事类文书却占公布文书总量的18.61%,两者相差10%以上。其中一个原因可能在于刑事案件中调解结案的数量极少,因此公开比例相对更高。另外,表4中的其他案件文书是指一些不常见的案件类型文书,如司法救助类案件,区际司法协助类案件等。

    4.公开裁判文书的时间分布

    (1)裁判文书制作时间年度分布

    表5为目前数据库中所有裁判文书的制作时间分布。从表5中我们可以发现,虽然文书上传主要以裁判文书网正式上线后的2014年、2015年为主,但在之前的时间区间内并非一片空白。据我们调研了解,目前一些地方法院都在有计划、有步骤地上传过往裁判文书,这是建构一个资料健全的数据库的基础环节。需要说明的是,在实际检索中,早于2001年或晚于2015年的裁判文书也有零星存在。但我们经过人工阅读后,发现这类文书大部分都是书写错误或识别错误。如案号为“(2012)珠金法民一初字第1281号”的民事判决书,在裁判文书网制作时间被识别为1996年。原因在于系统错误地将该判决书中包含的借据日期作为了制作时间。由于这部分文书数量极少,缺乏参考意义,我们将其一并计入属性缺失。

    (2)裁判文书上传时间年度分布

    表6是我们通过提取文书的上传时间汇总所得。由于裁判文书网为2013年7月1日开通,所以2013年只有7月1日之后的数据。实际上,裁判文书网正式对外启用是在2014年年初,2013年的数据量缺乏参考意义。从表6可以看出,2014年作为启动年即上传了约558万份文书,而2015年更是有接近900万份的上传量,比2014年提高了60%多。截至2016年8月23日,2016年共上传了文书约570万份,估计全年上传量可以达到1000万份左右。可见,裁判文书公开的推进是迅猛的,最高法院对下级法院的督促是有效的。

    (3)裁判文书上传时间月度分布

    从表7中30个月的月度分布数据,我们可以证明两点:第一,年底突击上传的现象得到证实2014年12月的上传文书数量几乎是上一月的三倍,2015年12月的数据也几乎是11月的两倍,10月的三倍。可见年底突击上传的现象十分突出这显然是法院采用年底考核方式的结果。第二,季末突击上传现象普遍存在。仔细观察表7,不难发现,每季度的第三个月,文书上传量相比前两个月总是会有小幅度上扬。这与我们在调研中得知的高级法院在文书上传工作中实行“季度小考,年度大考”的信息相一致。

    (4)裁判文书上传时间的每日分布

    我们提取了在限定区间内每一天的上传文书数量,但由于数量庞大,九百多天的信息直接列出,既难以展示,也很难一望而知其中隐藏的信息。因此,我们将每月同一天的上传文书数量进行相加,如我们将三十个月每月第一天上传的所有文书量相加,即得出所有在每月第一日上传的总量,依次类推,将每日的数据总量计算出,再进行比较。理论上,如果存在普遍的月中或月底突击上传现象,是可以得到的,结果如表8所示。由表8可以看出,在以每月为观察区间的情况下,确实存在月底上传量相对于月初和月中的提升。但我们认为这一现象不够明显。因为在存在季末突击和年底突击上传的情况下,月底上传总量受到每季度末月月底与每年十二月底上传量的拉升,很难断定月底总量的提高是月底突击上传的结果。在我们所调研的几个省市中,有些省市确实存在由法院审管办在每月底批量上传文书的情况,但并非每个省均如此安排。因此,我们很难认定这一情况是普遍现象。

    为了更进一步考察这一问题,我们统计了每季度中间月份上、中、下旬的文书上传情况。排除季末月是为了限制季末与年底突击上传现象的影响,而排除季初月则是为了限制数据上传延迟现象的影响。从目标月份的统计结果来看,确实存在每月下旬文书上传量相较于上旬的数量提升。但仔细分析,却很难用这一数据证明存在月底突击上传的现象。

    第一,在统计的八个月中有两个月的下旬上传量其实是下降的(2014年11月与2015年2月)。如果存在制度意义上的月底突击上传,那这一数据是难以解释的。

    第二,2014年2月的数据不具有参考意义,应予排除。2014年2月各级法院都处于文书上网的启动阶段,中下旬相对于上旬的数量暴涨显然不是月底突击上传的结果。如果排除掉这一数据,三旬之间的上传量数字会进一步拉近。

    第三,下旬数据相对于上旬与中旬分别只有42%与12%左右的增长,这与季末与年底突击上传中几倍的增长量完全无法相提并论。

    第四,下旬的上传量虽然较高,但中旬相对于上旬也有较大的提高。如果存在月末的突击上传,那么月中的高上传量又该如何解释呢?

    综上,对于表8中反映的问题,我们认为存在两种可能的解释。一是表中的数据可能反映了法院内部具体负责文书上传的部门月初存在工作拖沓的问题,但不能证明存在普遍的月底突击上传;二是部分省份的法院有月底突击上传的情况,但并非全国法院的普遍现象。

    5.公开裁判文书的地域分布

    我们对全部公开的文书按省份进行了排名,公开数量排名前三的分别为浙江、山东、江苏。根据全国审判情况来看,这三地同时也是全国每年收结案件最多的省份。总体上来看,各省公开文书量的排名与各省案件审判的排名是基本一致的。此外,我们还统计了各省高级法院的工作报告中公布的全省结案量,并与我们提取的时间区间内的各省文书公开量进行了比较。这种比较尽管不完全准确,但有相当的参考价值。从表10中的数据来看,文书结案比超过60%的有浙江、山东、安徽、河北、陕西等省份,构成公开领先的第一梯队。尤其是陕西表现出色,比例接近80%,远远领先第二名;河南、福建、湖南、湖北、广西、宁夏等省比例也都超过了50%,居于第二梯队;余下各省比例都在20%-50%之间。总体来看,经济发达省份的公开文书量不仅超过经济落后省份,公开比例也相对更高。另外,值得提及的是,本部分将最高法院的文书公开量一并进行了提取,一起列入表10中。从数量上看,最高法院在2016年之前一共公开了11,080份裁判文书,相较于最高法院2014年与2015年的总体案件审结量,经过计算比例约为46.13%。这个数字与全国平均数大体持平。这说明在文书上网的道路上,最高法院不仅是一个规则的制定者,也是一个践行者。但考虑到最高法院作为终审法院的职能定位,考虑到其所办案件的指导意义,这个比例仍然是偏低的。理论上,最高法院所有的裁判文书都应当向社会公开,“最高裁”文书不应有秘密。最高法院仍需努力!

    (二)2014年裁判文书公开特别分析

    为了更清晰地展现裁判文书网目前文书的分布情况和上传趋势,我们继续对研究时间区间进行限缩,用一整年的完整数据作为分析对象。具体做法是,我们将整个数据库所有制作于2014年的文书单独抽取出来进行分析。之所以选择2014年作为重点分析的区间,原因有三:第一,《理解与适用》中明确要求各级法院从2014年1月1日开始上传文书。前文的数据也证明,各地法院开始在裁判文书网上传文书基本始于2014年年初,2013年12月上传文书5000多份,2014年1月即暴涨到12万份以上。因此,将2014年作为中国裁判文书在互联网发布的元年应该是没有问题的。第二,由于目前文书上传的及时性尚难以达到最高法院的要求,根据我们的统计,目前数据库中2014年制作的文书,仍有一小部分是在2015年上传的。我们抽取的制作于2014年的裁判文书也包括2015年上传的2014年文书。这一数据更具备完整性。第三,同样由于数据的延迟性,2015年的文书在2016年仍在陆续上传中,无法保证数据的完整性,选择2014年更有利于分析的展开。当然,2014年制作的裁判文书进入2016年以后还在陆续上传,但数量已经很小。

    1.2014年裁判文书公开总量及文书类型分布

    目前数据库中共有2014年公开文书6,095,938份。其中2014年公开了4,299,283份,占比70.53%;2015年公开了1,796,655份,占比29.47%。11

    由此可见,近30%的2014年文书是迟延到下一年才上传的,即便考虑到等待文书生效导致的延迟,这一比例仍显太高。

    2.2014年裁判文书案件类型分布

    我们根据最高法院公布的数字计算出了主要案件类型中上传文书与审结案件的比例。从数据上来看,刑事案件与行政案件的比例均超过了100%,这个数字在调研中得到了部分印证。由于刑事案件与行政案件的结案方式较为单一,一般都是判决或裁定,而且大部分案件都不止一份裁定,所以比例超过100%是正常现象。但是民事案件结案方式中调解结案比例较高,一些基层法院派出法庭的调解结案数量超过总结案量一半是常有之事。按照规定,调解书属于公开排除事项。因此,民事案件比例较低也是可以理解的。赔偿案件与执行案件的公开比例较低,推测可能有三种原因:一是这两种案件中也存在调解结案的情况;二是这两类案件中可能涉及当事人隐私较多,可能一些法院考虑到其敏感性,选择了不公开文书,比如一些司法赔偿案件;三是这两类案件一般以裁定结案为主,最高法院在《理解与适用》中有这样一段话,“对于裁定书和决定书,可以根据具体类型和内容,选择与当事人实体权益关系密切的裁定书、决定书在互联网公布”12。也就是说裁定书的公开地方法院是有一定的选择权的,与判决书的要求不尽相同。因此这两类案件文书公开量偏低与现行规定也有一定关系。比如我们在调研中就遇到过一类情况,有些地方对执行庭公开文书的要求较为宽松,只规定了公开必须达到一定数量,没有对公开的比例作要求。

    3.2014年裁定书的类型分布

    中国法院所使用的裁定书具体种类繁多。根据我们统计,在各种审判程序至少存在144种裁定书。但除了民事、刑事、行政、执行之别,裁定书一般不再标明裁定书的具体类型,而只笼统地使用“裁定书”作为名称。由于无法从裁定书的名称或者字号中识别裁定书的具体类型,我们只能通过人工抽取的方式判断。具体的做法是,对裁定书的尾段进行关键字提取,以确定其所处的审判程序与裁定类型。这种方法有较大误差,但在没有其他路径的情况下,统计结果仍然为我们提供了关于裁定书具体类型的有益信息。

    有必要说明的是,表14中各项裁定书总数相加为2,299,106份,相比于上文的2014年共公开2,793,281份的裁定书,覆盖率为82%左右。导致这一结果的原因是,裁判文书表达方式的多样化和技术能力限制。我们按照法院级别、结案方式、审判程序、案件类型、文书类别五个指标来确定一份裁定书的具体属性;五个指标中,单个指标的裁定书提取覆盖率均在96%以上,但由于各个指标的覆盖范围呈交叉状态,综合覆盖率在现有技术条件下只能做到82%。我们已经根据需求多次修改算法与程序,但限于目前的文书规范化程度不高与文本挖掘技术的水平有限,目前这已经是努力之后的结果。但我们认为对这一数据在相当程度上仍然是有参考价值的。观察表14,有几点现象值得关注:在民事案件中,一审裁定总数占去民事总裁定书数量的80%左右,其中一审撤诉裁定占去总数的60%以上。

    可见,民事一审中调解结案仍然是主要的结案方式。在刑事案件中,与民事案件不同,行使二审的裁定书数量占去刑事总裁定数的90%以上,其中二审维持裁定占去总数的近三分之二。但应当提醒的是,这一数字不能完全说明全国刑事案件的维持率较高,因为刑事案件如果二审改判,一般是以判决形式作出的,不会计入表14中。在行政案件中,非诉执行裁定占去行政总裁定数的70%以上,其中准予执行裁定占去总数的60%以上,占去所有非诉审查执行裁定的85%以上。由于非诉审查执行案件的结果一般均以裁定书的形式作出,这一数据是可以反映现实问题的。这一数据表明,法院对行政机关的执行申请审查有“走过场”之嫌。

    此外,由于最高法院在裁定书的公开问题上语焉不详,赋予了地方法院一定的公开裁量权,我们按照裁定书是否会导致案件程序的终结,将其分为结案裁定13与非结案裁定。统计结果显示,在目前公开的裁定书中,结案裁定比率均占据绝对比重。尤其是在公开的刑事裁定书中,结案裁定占比接近97%。以此推知,各级法院对《理解与适用》中所言的“与当事人实体权益密切相关的裁定书”14时,一般均将是否导致案件程序结束作为衡量的主要标准。但我们认为,这一理解是有失偏颇的。一方面,实体利益与程序利益在审判实践中本来就存在界限模糊、相互交叉的问题;另一方面,实体利益概念与是否导致案件程序终结并不处于同一层面。如关于财产扣押、解封的裁定必然涉及当事人实体利益,但一般并不导致案件的终结。最高法院有必要在未来进一步明确裁定书的公开种类问题。

    4.2014年裁判文书的审判程序分布

    需要交代的是,我们没有在这里使用“审级”的概念,主要是一些特殊程序案件很难被审级的概念所囊括。此外,还有一些类型的文书因为数量太少,我们没有列入其中,如强制医疗决定书只公开了3份。从表19来看,一审案件中判决书和裁定书是占绝对多数的,这符合法院的实际审理情况。值得关注的是,在一审、二审、再审中判决书的数量都是裁定书的2-3倍左右。关于全国范围内判决书与裁定书的比例我们缺乏公开的数据可以进行比较,很难断定实际审判中何者的比例更高。

    同时,一些地方也存在明确将一些种类的裁定书排除出公开范围的情况。15但无论如何,裁定书的公开数量都相对较低。可能正如上文所言,法院在对裁定书有选择公开权的情况下,执行力度相对于判决书较弱。

    5.2014年裁判文书法院层级分布

    表20展示了2014年裁判文书的法院层级分布。基层法院发布的文书占据了全国法院文书公开量的79.84%,中级法院占去18.52%,高级法院与最高法院总共只占了0.2%。从上到下金字塔形的文书发布量符合我国目前四级法院的审判实情,但也从侧面再一次印证了基层法院面临的审判重压。有兴趣的学者可以使用表中的层级案件类型文书发布量做进一步的研究。

    6.2014年执行文书法院层级分布

    表21是全国公开执行文书在各级法院的分布。由表21可以看出执行案件绝大多数还是出现在基层。与2014年全国各级法院共执结2,906,861件执行案件相比,四分之一左右的文书案件比是明显偏低的。

    7.2014年调解文书在审判程序与法院层级中的分布

    2014年调解文书中公开的共5065份。按照最高法院的有关规定,调解书是明确的公开排除事项,理论上这些文书是不应该出现在数据库中的。根据数据库统计,这些调解文书中广东法院的公开量占据了近一半。今后调解书是否一律不公开,值得讨论。

    8.2014年裁判文书的区域分布

    总体上,2014年公开裁判文书的省级分布基本与总量上的文书分布相差不大。虽然我们没有统计2015年的数据,但与总量对比,我们依然可以发现一些省份的进步非常显著;比如浙江2014年的文书结案比尚不到40%,但总量在65%以上,可见2015年的进步幅度非常大。

    我们列出了各省不同类型案件文书的公布量,并计算了其在全国同类型文书中的比重,可以供有兴趣的学者进行比较研究。

    9.2014年最高法院裁判文书概况

    我们将最高法院在2014年制作的文书单独提取出来进行了分析。在最高法院公开的所有文书中有3809份是制作于2014年的。在案件类型上,绝大部分是民事案件文书,行政案件文书与刑事案件文书都在300份左右。另外,最高法院公布的其他案件文书为全国最多的,通过提取后人工阅读,这一部分绝大多数是驳回申诉通知书。在审判程序上,最高法院发布的再审复查和审判监督案件文书也占绝大多数,这是最高法院作为我国法院系统内的最高司法监督机关的地位体现。值得注意的是,其中有253份复核文书,与表25的刑事案件文书接近,通过人工阅读,证明这一部分主要是死刑复核文书。在文书类型上,裁定书占据了压倒性的多数。我们分析认为,这是因为最高法院作为最高司法监督机关,在再审案件、再审复查案件,以及审判监督案件中,多以纠正下级法院审判错误为主,多采用裁定书的形式,很少直接判决。此外,复核文书也是以裁定书的形式作出。因此,裁定书占据绝大多数是可以理解的。但是,审判职能毕竟是最高法院的基本职能之一,如此多的案件“审而不判”是值得注意的。

    (三)社会热点案件的文书公布考察

    在对中国裁判文书网公开的裁判文书进行数据归纳整理之后,我们对裁判文书网的文书公开情况已经有了一个初步的了解。但仍有一个问题是我们无法仅通过上文数据回答的,即法院裁判文书的公开是否有选择性?这个问题无法从公开文书的数量和比例中得到回答。所以,我们采用抽样调查的方式选择一些社会热点案件在中国裁判文书网进行检索,来回答这一问题。我们收集了2014年、2015年社会关注度比较高的一些案件,这些案件广泛来自媒体、网络、法学会评选等渠道。我们共收集到近百件热点案件,然后对这些案件进行了初步筛选。筛选原则为:该案件在2014年、2015年内确定进入了诉讼程序,产生了相应的裁判文书,并且按照要求这些裁判文书应当在中国裁判文书网公开。在我们收集到的案件中,其中一些没有进入诉讼程序,或出于特殊原因进入诉讼程序但没有裁判文书产生,如徐才厚案虽然进入了诉讼程序,但由于当事人在审查起诉阶段因病死亡,所以没有相应的裁判文书产生。最终我们确定了有65件案件符合我们的标准。其中,民事案件24件,刑事案件29件,行政案件8件,赔偿案件3件,执行案件1件。我们对这65件案件根据收集到的案件信息在裁判文书网进行了检索。

    需要说明的几点是:1.由于案件事实与审判过程的复杂情况,部分案件在一个诉讼程序中不止有一份裁判文书,一些案件在一个审判程序中既有裁定书也有判决书,出于考察目的的需要,我们将这些裁判文书计为1件。2.一些案件虽然社会公众将其视为一个案件,但实际上在法律程序为却表现为数个案件。如江苏昆山“8·2”特大爆炸事故案,该案中有数名犯罪嫌疑人,法院根据犯罪事实将其按照多个案件分别处理。我们将这一类案件也计为1件。3.部分案件根据目前有限的公开资料,我们无法判断其是否存在相应的审判程序,我们将其视为没有此审判程序。

    在我们进行检索的65起案件中,有26起案件的裁判文书完全未公开,19起案件的裁判文书一、二审均有公开,30起案件的文书部分公开18.在案件一审中,有24起案件公开了裁判文书,占比约为37%,超过三分之一。27起案件公布了二审文书,10起案件公布了再审文书。在我们确定存在的117个审判程序中,共公开文书61件,比例约为50%。在确定存在的50个民事审判程序中,公布了26件裁判文书,占比约为50%;在确定存在的48个刑事审判程中,公开了22件裁判文书,占比约为45%;在确定存在的13个行政审判程序中,公开了11件裁判文书,占比85%。综合而言,在我们所查询的热点案件中,能够查到裁判文书的审判程序仅占全部总量的一半不到。有一些案件完全没有裁判文书公开,如蒋洁敏受贿案、张海违法减刑案等;还有一些只公开了部分裁判文书,如无锡冷冻胚胎案仅公布了二审裁判文书。这表明不同法院在对热点案件、敏感案件的拿捏上还存在尺度上的差异。详细地给出典型案件的公开比例并非我们的目的,抽样调查也只能在一定程度上呈现社会热点案例的公开情况。真正值得我们关注的是,司法公开是否回应了民众的诉求?社会热点案例在一定程度上代表了民众的关心所在,它承载了社会公众对法律实施的良好期望,它的处理结果是公众了解司法运行的直接窗口,它能够最直观地展示社会主义法治公平、公正、透明的形象。因此,社会热点案例理应得到全方位的公开。这一公开不仅应当是某些案件庭审过程的直播,还必须全面、详细地向公众展示最终的司法裁判结果。这些案件裁判文书的公开既是民众知情权的应得保障,也是法院塑造司法公信力的重要机遇。对于司法公开来说,这些案件裁判文书公开的意义要胜过成千上万份普通文书的公开。但实际上,像蒋洁敏案、刘铁男案等案件,我们至今无法查找到全面的司法文书,无法看到裁判文书中所确认的法律事实和司法机关的裁判依据。因此,全面的司法公开仍然任重道远。

    三、裁判文书公开的及时性考察

    在2010年版的上网规定中最高法院要求裁判文书应当在生效后30日内上网,但在2013年版的规定中最高法院将这一时间限缩为生效后7日内。可见,最高法院对裁判文书上网的及时性要求大大提高。尽管可以理解最高法院紧迫的心情,但这一要求的可操作性与实效性是需要慎重考察的。这也是我们本部分主要关注的问题之一。在使用数据进行分析之前,我们必须提前交代两个问题。第一,我们在本部分仍然是以2014年的数据为主进行分析。原因是2015年的裁判文书仍在裁判文书网陆续上传中,我们数据库中的数据是截至2015年12月31日。如果用不完全的2015年数据进行分析研究,一些结论可能是有失偏颇的。比如在下文我们将计算文书公开所需要的平均时间,这一结果受极值影响很大,我们目前缺乏在2016年上传的制作于2015年的文书,而这一部分文书对平均值的结果是影响最大的。第二,限于技术水平,我们目前还无法仅仅通过裁判文书的内容来判断其生效时间。实际上,这一问题即便在现实中对法官来说也是一个难题。因此,我们选择了忽略“生效后”这一条件。直接观察裁判文书上网所需要的时间。尽管我们无法判断文书上网时间与生效时间的间隔,但通过上网时间与制作时间的对比,我们仍然可以依靠经验得出一定的结论。我们采用的具体方法是由小到大划分出时间区间,然后统计在特定时间段内上传的文书数量,并计算出上传文书数所需时间的平均数与中位数。19我们主要将间隔区间分为0天、1-10天、11-30天、11-90天、91-180天、181-365天、366-730天7个时间段,其中0天表示文书当日上传,最长730天是两年时间。使用这种方法,在分析时再结合诉讼法相关规定与上文的一些数据,尽管有不可避免的缺陷,但大致可以对这一问题给出一幅比较清晰的素描图。

    (一)裁判文书的上传时间概况综合以下各表来看,有几点值得注意。

    第一,2014年的裁判文书有近30%是2015年上传的。前文已经指出,这一比例偏高。

    第二,30日内上传量较低。按照三大诉讼法有关文书送达和上诉的规定计算,一审裁判在当事人不上诉的情况下,刑事判决书与裁定书在作出后的最长生效时间为20日与15日;民事、行政判决书与民事、行政裁定书在作出后的最长生效时间为25日与20日。把这一时间再加上最高法院规定的7日内上传,从制作到上传的最长间隔应该在30日左右。二审裁判一经送达立即生效,更是应当在7日内上传。按照表30给出的统计数据,2014年文书在30日内上传的不足20%,2015年文书不足30%。考虑到2015年的文书目前并不完整,参考2014年文书的上传情况,2015年文书被后一年上传量稀释之后,实际在30日内的上传比例应当与2014年接近。尽管我们无法获得全国总体的案件上诉率,但无论如何,20%的30日内上传率都明显偏低。

    第三,文书上传延迟情况较严重。从表30的统计数据可以看出,文书上传的高峰期为文书制作后的1个月至3个月内。而3个月至6个月内的上传率在2014年与2015年均在20%左右,尤其是2014年,6个月至1年内的上传文书占比仍接近20%,1年后上传的还有7%。即便考虑到二审与再审中的对原审的维持等复杂的审理情况,这一比例也难以得到合理解释。综上,我们分析认为,文书上网规定第八条的“生效后7日内”上传的规定根本没有得到落实。

    (二)2014年裁判文书上传时间的案件类型分布

    综合表33、表34来看,刑事案件的文书上传效率是相对最高的,1个月内的上传率接近30%,1个月至3个月内的上传率接近40%,高于民事案件与行政案件;平均数与中位数的表现更是明显好于其他类型案件。我们认为,这是因为刑事案件涉及的是比较严厉犯罪制裁问题,一般情况下,被告作为犯罪嫌疑人在押比例较高,原告作为受害人的出庭比例也较高,易于确定文书的送达,因此也较易判断文书的生效时间。同时,刑事文书的法定送达时间相对较短,也是一种影响因素。相对而言,民事案件与行政案件的表现则较差,尤其是民事案件1个月内的上传率还不到15%,有待进一步提高。

    (三)2014年裁判文书上传时间的审判程序分布

    从审判程序的视角来看,二审案件与刑罚变更案件的上传效率是相对最高的,1个月内的文书上传率都在30%左右,中位数也表现较好。这是因为,在二审终审制的背景下,二审法院已经可以在判决书结尾宣告“本判决为终审判决”,因此也更易确定生效时间。而刑罚变更案件的裁定书根据《刑事诉讼法》的相关规定,是作出即生效的,生效时间的确定较为清晰。相对而言,一审案件的生效情况则较为复杂,在存在上诉的情况下,生效时间的确定受制于上级法院的审理结果,因此在数据上偏低,1个月内的上传率尚不足15%,中位数的表现相对来说也中规中矩。再审案件则表现不佳,一般而言,再审文书的生效时间确定应该是较为容易的,但1个月内的上传率也只在20%左右,1个月至3个月内的上传率约在30%,中位数也不及二审文书。其余审判程序中,值得注意的是复核文书,这部分文书多为死刑复核文书,生效时间应当是较为清晰的,但1个月内的上传率尚不足8%。

    (四)2014年裁判文书上传时间的法院层级分布

    裁判文书上传时间的法院层级分布情况与上文的总体概况基本一致。各级法院文书发布时间仍然集中在制作后1个月到3个月内,四级法院在这一区间的占比都在30%-40%。如果详加对比的话,可以发现中级法院在文书发布上相对更快一些。一方面,中级法院在文书制作完成的30天内的发布率最高,接近30%,其他各级法院均未超过20%;另一方面,中级法院在90天至1年内的发布率最低,比例为30%左右,而其他各级法院的在这一时间段内的发布率均超过40%。这一点我们从表38中的平均数与中位数对比中也可以证明。无论是平均数还是中位数,中级法院的数值都是其中最低的。尤其是中位数,相比其他各家法院,优势明显。这一情况需要与前文的审判程序数据结合来看,正如前文已经证明的,二审文书的公开在各种审判程序中是表现相对最好的。而中级法院作为绝大对数二审案件的审判机构,其文书发布相对较好是自然而然的。基层法院的文书发布情况也和上文的一审案件与执行案件文书发布相一致,二者之间显然存在因果联系。

    高级法院和最高法院的表现则不甚理想。如果说其他法院还存在各种影响发布的案件不确定因素的话,那么高级法院与最高法院一般审理的都是二审、再审案件,文书生效时间的确定相对来说是较为简单的,但实际上二者1个月内的发布率都只是在15%左右,值得反思。我们特意抽取了最高法院在制作1年后公布的81份文书进行人工阅读,这部分文书中并没有比较特殊的案件,均为普通的裁定书或判决书,也未发现其中有特别影响文书公开的因素。

    (五)2014年裁判文书上传时间的区域分布

    各省级的公开及时性与全国总体所表现出的数据一样,都存在普遍的延迟发布问题。在30天公开量占比达到30%以上的只有青海、上海、宁夏三个省市。但这并不能说明普遍状况,这三个省市中上海市全年结案量约55万件,在全国排名中游,青海和宁夏结案量在全国更是属于比较低的省份。除此之外的省份中,在30天内文书发布率最高的是浙江,但也只有26%左右。其余省份的数据更是堪忧,末尾的西藏30天内上传率仅有1%左右。

    在30天至90天的时间段内,文书发布率超过40%的有海南、贵州、甘肃、福建、湖南、重庆、上海、宁夏、陕西9个省市,但这些省市的结案量在全国都不占有主要地位。浙江、广东、江苏、山东等省份在这一区间内的文书发布比均在30%左右。在90天以上的时间段内,文书发布率超过50%的省份居然超过全国一半。排名前三位的西藏、北京、内蒙古公开率分别为95.54%、73.28%,67.89%。如果说西藏略显夸张的数据是因为偏远地区信息化基础建设不足,那么基础设施相对较为发达的北京市就实在无法从外在硬件上归因了。北京的中位数为187天,已经离排名倒数第一的西藏210天相去不远。山东、江苏、广东等省份的发布率均在50%左右。浙江情况稍好,90天以上发布率在38%左右,但也超过三分之一。

    综合来看,各省市之间表现相对差异较大,不能够单纯用地区经济发达与否进行解释。尤其是从最有代表意义的中位数来看,虽然东部发达地区有福建、浙江这样表现优秀的省份,但也有北京、江苏等表现一般的省市。而西部欠发达地区虽然有西藏这样的极端情况,但青海、宁夏的表现都让人眼前一亮。因此,仅从我们所统计的数据来看,硬件方面的信息基础设施虽然是重要的影响因素,但并非决定因素。我们更倾向于认为各省高院的重视程度和执行力度是更关键的影响因素。

    四、裁判文书公开的内容妥当性考察

    本部分我们主要关注裁判文书公开内容的妥当性,涉及裁判文书公开内容的质量问题,也涉及部分裁判文书网公开的方式和效果的考察。我们将本节分为两大部分:第一部分主要关注公开的裁判文书的隐名情况,主要以2013年版文书上网规定第6条与第7条的落实情况为考察中心;第二部分主要列举说明几类目前裁判文书网运行中以及公开裁判文书中出现的一些有代表性的错误类型。

    (一)裁判文书的隐名情况

    2013年版文书上网规定第6条规定了在互联网公布裁判文书应当实名公开的原则及其例外情形;第7条则是有关信息保护的规定。我们主要考察的问题有二:第一,裁判文书对不宜公开信息的处理现状如何?第二,隐名等信息处理的程度如何把握?具体的研究对象包括两类:普通案件的裁判文书和敏感案件的裁判文书。敏感案件的裁判文书以未成年人犯罪和强奸罪为例。

    1.普通案件中的匿名处理

    我们从裁判文书网随机抽取100份裁判文书,抽样原则为:

    (1)覆盖每一省、直辖市、自治区;

    (2)民事案件、刑事案件、行政案件各占比例与总样本中的相应占比近似;

    (3)分别由基层法院、中级法院和高级法院审理的案件各占比例与总样本中的相应占比近似;

    (4)判决书、裁定书、决定书和调解书各占比例与总样本中的相应占比近似。

    最终100份样本中包含:52起民事案件、28起刑事案件和20起行政案件;82起由基层法院审理的案件,12起由中级法院审理的案件,6起由高级法院审理的案件;70份判决书、17份裁定书、5份决定书和2份调解书。

    2013年版文书上网规定第6条共列举了三类必须采取符号替代方式对下列当事人及诉讼参与人的姓名进行匿名处理的情形,包括:(一)婚姻家庭、继承纠纷案件中的当事人及其法定代理人;(二)刑事案件中被害人及其法定代理人、证人、鉴定人;(三)被判处三年有期徒刑以下刑罚以及免予刑事处罚,且不属于累犯或者惯犯的被告人。22在100份样本中,共有8份属婚姻家庭、继承纠纷案件。其中,有6份裁判文书依规定对当事人及诉讼参与人姓名进行隐名处理,但有2份保留了全名。共有24份文书涉及被害人及其法定代理人、证人、鉴定人信息的刑事案件。这24份裁判文书均依规定对被害人的法定代理人、证人、鉴定人等人员的姓名进行了隐名处理,但有2份保留了被害人的全名,其中1份特别指出这样做是为了与被告人(隐名处理后)的姓名加以区分。在100份样本中,共有20份属被告人被判处三年有期徒刑以下刑罚以及免予刑事处罚,且不属于累犯或者惯犯的刑事案件。其中,有17份裁判文书依规定进行隐名处理,但有3份保留了全名。

    整体而言,法定隐名在实践中落实情况良好。但我们在阅读文书的过程中,发现不同法院采取的隐名方式存在多种形式,有必要进一步考察实践中存在不同“符号替代方式”。

    在100份样本中,采取符号替代方式对案件当事人及诉讼参与人的姓名进行匿名处理的共有34份。其中,被采用最多的符号替代方式是保留姓氏,后面其他字以“某”代替,共20份,占59%。此外,有6份采用了保留姓氏,后面其他字以“某某”代替的方式;4份采用了保留姓氏,后面其他字以“某”和“一/二/三……”或“甲/乙/丙……”组合代替的方式;2份采用了保留姓氏,后面其他字以“××”代替的方式;1份采用了保留姓氏,后面其他字以“甲/乙/丙……”代替的方式;1份采用了保留姓氏,后面其他字中的一部分以“一/二/三……”代替的方式

    所采用的“符号替代方式”尚处于比较分散、多样的状态,需要进一步的统一。值得指出的是,最高法院在《理解与适用》中推荐采用的隐名方式为“姓+某某”,同一文书中有姓氏重复的则采用“姓+某+甲/乙/丙”。24我们认为,以“×”“*”等其他形式的文字或符号代替可能对当事人及诉讼参与人的姓名不够尊重,且在不同网络系统、输入法系统之下格式可能难以保持一致。最高法院推荐的隐名方式是较为妥当的。

    2.普通案件中的信息删除

    2013年版文书上网规定第6条共列举了四种在互联网公布裁判文书时应当删除的信息,包括:

    (一)自然人的家庭住址、通讯方式、身份证号码、银行账号、健康状况等个人信息;(二)未成年人的相关信息;(三)法人以及其他组织的银行账号;(四)商业秘密。此外,第5项“其他不宜公开的内容”为兜底条款。我们仍以上一部分中抽取的100份裁判文书为样本,对明确列举的四类情形分别进行考察。

    第一,自然人的个人信息。本文所选取的100份样本均涉及自然人。但是,有7份所涉及的自然人为非当事人的其他案件参与人员(多为诉讼代理人),这7份裁判文书均未提及自然人的家庭住址25、通讯方式、身份证号码、银行账号、健康状况等个人信息。剩余的93份所涉及自然人为当事人的样本中:在家庭住址上,45份未公开家庭住址,37份给出区域性地址,4份给出具体到乡镇街道的简略住址,7份给出具体到门牌号的详细住址;在身份证号码上,90份未公开身份证号码,3份完全公开了自然人的身份证号码;在通讯方式上,92份未公开通讯方式,1份公开了自然人的手机号码;在银行账号上,93份均未公开银行账号;在健康状况上,90份未公开健康状况,3份公开了自然人的健康状况。整体而言,法院比较注意对自然人个人信息的保护情况,但仍有少量裁判文书不适当地披露了个人敏感信息。

    第二,未成年人的相关信息。《理解与适用》指出,此处的“相关信息”是指任何足以识别该未成年个人的信息。但“相关信息”的内涵与外延仍不明朗,本文暂且类比2013年版规定第6条与第7条第1项,以姓名、性别、年龄、民族、家庭住址、身份证号、通讯方式等作为指标进行观察。

    本文所选取的100份样本中有4份裁判文书涉及未成年人,均对未成年人姓名进行了隐名处理,也未公开其身份证号、区域性地址以下的家庭住址及通讯方式;4份裁判文书均公开了未成年人的民族以及具体到出生年月日的年龄信息;3份公开了未成年的性别,1份未公开;2份公开了未成年人的法定代理人的全名,2份对此作了隐名处理。

    对案件中所涉及的未成年人的保护是否到位,标准在于公开的信息是否足以识别该未成年人个人。因此,需要警惕在裁判文书中公开未成年人详细出生信息、法定代理人全名的现象。在如离婚等特定类型的案件中,删去未成年人的出生信息可能影响读者对案情的理解,且这些信息单独出现时尚不足以被用来确定个人。但若未成年人所居住地区、法定代理人姓名、出生年月日等组合出现在同一份裁判文书中,仍极有可能暴露该未成年个人。

    第三,法人以及其他组织的银行账号与商业秘密。本文所选取的100份样本中,一方面,案内人包含法人以及其他组织的有52份,所涉及的银行账号与商业秘密等信息均未被公开;另一方面,部分裁判文书中对法人以及其他组织的名称、企业法人住所与经营场所、法定代表人姓名等信息亦作隐匿处理,其必要性与妥当性存疑。在52份裁判文书中,3份完全隐去了法人及其他组织的名称,49份公开了法人及其他组织的完整名称;16份未公开企业法人住址与经营场所,9份给出区域性地址,5份给出具体到乡镇街道的简略住址,22份给出具体到门牌号的详细住址;6份对法定代表人姓名作了部分隐匿或全部删去的处理,46份公开了法定代表人姓名。上述对信息的过度隐匿表明,部分法院混淆了对不同类信息进行保护的合理界限。2013年版文书上网规定第6条及第7条第1、2项对自然人信息进行处理的目的主要在于保护其隐私权,并使本人不易被识别从而保护其人身安全。与此不同,2013年版规定第7条第3、4项对法人以及其他组织信息进行处理的目的主要在于避免有盈利价值的信息泄露后被用于不正当竞争,保护其经济安全。国务院颁布的《征信业管理条例》也印证了这一点,该条例第3条规定,“从事征信业务及相关活动……不得侵犯商业秘密和个人隐私”。因此,法院将删除的信息范围扩大至银行账号和商业秘密之外的经营场所、法定代表人姓名等信息项上是值得商榷的。

    从司法公开的功能上来看,对法人以及其他组织信息的过度隐匿有可能妨碍司法公开价值的实现。司法公开的根本价值之一是为了保证公众知情权与监督权的实现。在民、刑案件中,充分披露法人信息有助于公众辨识出涉案法人,从而进一步了解并监督其有无完全民事权利能力和民事行为能力以及其商业信誉如何等。尤其是我国《民法通则》第37条还规定了企业名称、经营场所、法定代表人姓名等信息是构成法人资格的必要条件。而在行政案件中,行政机关的全名公开应当是公众监督行政职权行使的题中应有之义,对行政机关的名称与法定代表人姓名等信息不应当有任何隐匿。但案号为“(2012)鄂洪山行初字第00041号”的裁判文书中,法官却将当地房屋管理局全称和房屋管理局法定代表人姓名均作隐名处理,应予纠正。

    第四,其他不宜公开的内容。《理解与适用》指出,刑事裁判文书中血腥暴力和恐怖事实的描述、认定,犯罪方法的解释以及具体侦查方法和措施的披露等,均应作删除处理。

    除此之外,为了进一步填补“其他不宜公开的内容”之内涵,本文对100份样本中法院的非法定隐藏、删除信息进行了总结。在93份当事人(之一)为自然人的裁判文书中,56份公开了自然人的性别,37份未公开该信息;43份公开了自然人具体到年月日的出生信息,6份公开了自然人的出生年份或年龄,44份未公开该信息;49份公开了自然人的民族,44份未公开该信息。共15份裁判文书涉及自然人的机动车车牌号,其中13份对该信息进行了部分符号代替处理。共12份裁判文书涉及自然人的房产信息(房产地址、产权证号),并且都对此进行了部分符号代替处理。共3份裁判文书涉及自然人的婚姻状况,其中1份对自然人的婚龄进行了隐匿处理,2份公开了自然人的结婚证号。共47起案件的委托代理人是律师,47份裁判文书均标明了代理律师执业的事务所名称,但其中有2份裁判文书对代理律师作了隐名处理;共2起案件的委托代理人是律师以外的人员,2份裁判文书均标明了该代理人与当事人的关系。

    以上统计表明,不同法院、不同法官之间对裁判文书的隐名类项与隐名程度上还存在把握不一致的情况。如当事人的性别一项,2013年版规定第7条并未明确将其列为应当删除信息。且性别信息的特殊性一般较低,几乎没有可能通过性别来确定具体的案件当事人,但在部分案件中性别却可能是法官作出具体判决的影响因素之一。因此,删除性别信息是不必要的。综合来看,实践中对上网规定中未明确是否应当删除的信息项处理较为混乱,应当进一步规范。

    3.敏感案件的隐名处理

    裁判文书在互联网公布前需对部分信息作隐匿、替代、删除处理的主要原因在于,保护案件当事人及诉讼参与人的个人隐私和具有经济价值的信息,同时维护社会的稳定与和谐。在这一类案件中,比较典型的是未成年人犯罪案件与强奸罪案件。前者是第7条中的明确规定,后者则常涉及被害人重要的隐私信息。因此,我们以未成年人犯罪和强奸罪为例,观察目前对于敏感案件的文书处理现状。

    第一,未成年人犯罪。我们从裁判文书网中随机抽取100份涉及未成年人犯罪的案件,抽样原则为:(1)覆盖每一省、直辖市、自治区;(2)分别由基层法院、中级法院和高级法院审理的案件各占比例与总样本中的相应占比近似;(3)判决书和裁定书各占比例与总样本中的相应占比近似。最终100份样本中包含:67起由基层法院审理的案件,28起由中级法院审理的案件,5起由高级法院审理的案件;81份判决书和19份裁定书。

    对未成年人犯罪案件的裁判文书进行信息处理,其主要依据仍在第7条第2项对“未成年人相关信息”的保护,因此应当隐匿、代替或删除的信息也就包括姓名、详细家庭住址、身份证号等。在100份样本中,有27份裁判文书未对未成年被告人的姓名作隐名处理,案件所涉及的犯罪类型包括运输毒品罪、贩卖毒品罪、抢劫罪;有48份裁判文书标明了未成年被告人的出生年月日,这主要是便于理解被告人在实施犯罪行为和被起诉时分别出于哪一年龄段;6份裁判文书公布了未成年被告人具体到门牌号的详细家庭住址;有39份裁判文书标明了未成年被告人的法定代理人及其与被告人的关系,其中21份将法定代理人的姓名也作了隐名处理。本文所选取的100份裁判文书均未公开未成年被告人的身份证号和通讯方式,这是值得肯定的。但仍有27份文书未对未成年人姓名作隐匿处理,是需要进一步提高的。另外,法定代理人一般为未成年人的直系亲属,属于“足以识别该未成年人个人的信息”,其相关信息也应当作隐匿处理。

    第二,强奸罪。本文从裁判文书网中随机抽取100份涉及强奸罪的案件文书,抽样原则为:

    (1)覆盖每一省、直辖市、自治区;(2)分别由基层法院、中级法院和高级法院审理的案件各占比例与总样本中的相应占比近似;(3)判决书和裁定书各占比例与总样本中的相应占比近似。最终100份样本中包含:14起由基层法院审理的案件,81起由中级法院审理的案件,5起由高级法院审理的案件;14份判决书和86份裁定书。对涉及强奸罪的案件的裁判文书进行信息处理,关键在于依据2013年版第6条第2项保护被害人的个人隐私。本文所选取的100份样本全部对被害人的信息进行了较恰当的处理,主要方法是以“妇女”代指被害人,或对被害人姓名进行符号替代。值得肯定。

    (二)裁判文书公开错误现象考察

    前文已经提到,我们在通过系统整理文书的过程中发现,裁判文书网的公开存在一些错误现象,这些错误现象给裁判文书的整理带来了相当大的难度。在我们整理文书的过程中,发现的各类错误现象,约占文书总量的5%左右。由于系统复杂性和人力有限等原因,我们难以给出全部的错误类型和所占比例。但我们尽力在本节对研究过程中发现的比较有代表性的错误现象进行简要的整理和归类,提醒以后的研究者在使用裁判文书网时予以注意。

    我们将这些错误主要分为两大类:一类为裁判文书的“公开”错误,主要是裁判文书网在公开过程中出现的错误现象。这些现象既有各级法院在上传中出现的错误,也有文书网架构不够完善的原因。另一类为裁判文书的写作问题。这种问题尤其给我们识别文书带来了比较大的困扰。它主要是由各级法院法官在书写文书时的笔误和表达差异导致的。

    1.裁判文书的公开问题

    裁判文书网的公开错误比较有代表性的是统计数据错误与裁判文书分类错误。

    第一,统计数据错误。统计数据错误是指在裁判文书网中以某一限定条件进行搜索,得到的各项数字之间存在矛盾或难以自洽的情况。在裁判文书网高级检索中,在设定的特定检索条件下,裁判文书网左侧栏的各项统计数据应当是自洽的。但实际检索中我们发现,这些数据常常有“打架”的现象发生。比如我们将法院名称设定为“北京市第一中级人民法院”进行检索27,右上角红字显示共找到31,200个结果。但是将左侧的分类结果相加,数字却相差甚大。按裁判年份筛选的结果相加所得为25,869份文书,按文书类型筛选的结果相加为27,199份文书。实际上,我们计算了每个分栏目文书相加的结果,没有一个最终数字是相同的。一般而言,在设定的检索条件下,文书的筛选实际上是被限定在了一个区间之内,这个区间应该是明确的。各项统计数据在区间内再按照细分条目进行筛选,并对所得结果进行加减即可。即便考虑到审判程序分类繁多等复杂情况,各项数据有存在误差的可能性,但误差量也应该是极小的。而上述统计数字接近20%的误差,实在难以用常理解释。只能说明裁判文书网的后台算法仍然存在较大的问题。对于使用者而言,这样带来的一个不利后果是,使用者一般没有能力对这些数据进行甄别,选择不同的数据作为研究依据可能带来不同的研究结果。这显然是存在问题的。

    第二,文书分类错误。网站进行文书分类的基本原理是对文书的案号进行提取和判断,以此确定文书所属于的案件类型。目前裁判文书网在检索文书时均是在案件左上方以红底白字标示出案件所属类型和所属程序。应当说,这样是有利于检索人尽快了解案件信息、节省信息筛选时间的。但是我们在研究过程中发现,裁判文书网有大量的案件类型分类错误,在一定程度上影响了各种案件类型的数据统计。例如,我们在高级检索中设置案件类型为“刑事案件”,案件名称为“合同纠纷”,居然仍有数百份的检索结果。仔细检查检索结果,我们发现这些裁判文书绝大多数为执行裁定书和民事裁定书,与刑事案件相去甚远。如案号为“(2013)武海法执字第00421号”的“中国民生银行股份有限公司武汉分行金融借款合同纠纷执行案裁定书”,被标为刑事案件;再如案号为“(2014)深中法商终字第1106号”的“深圳市华莱士齿轮有限公司与深圳市兴龙辉科技有限公司定作合同纠纷二审民事判决书”,被标为刑事二审。我们将各种案件类型与其他案件类型中的不同案由进行组合检索,发现这一类错误比比皆是,难以穷尽。可以想象,裁判文书网给出的各项统计数据必然受到了这些分类错误的影响。

    以上两种错误类型,是裁判文书网公开过程中比较有代表性的两种错误,但并非全部。我们在系统架构和数据统计的过程中发现了不少类似的错误。但由于各种错误繁多,我们限于研究能力,无法对其进行全面的列举和分类。我们提醒后来的研究者在使用过程中注意这些明显的错误,尤其是裁判文书网提供的各种统计数据,应当谨慎使用。

    2.裁判文书的写作问题

    我们在研究过程中,由于需要确定裁判文书的制作时间、上传时间、当事人、案件类型、法院级别等信息,所以也需要通过电脑系统对裁判文书的基本内容进行读取。在读取过程中,我们发现,一部分裁判文书在系统整理过程中总是会出现无法识别的情况,也就是属性缺失的情况。我们通过人工阅读发现,这些属性缺失主要是由裁判文书的写作错误或写作差异导致的。我们将其分为两种:一种是文书标识性信息的写作错误;另一种是文书内容的表达多样化问题。

    第一,标识性信息错误。我们所指的标识性信息主要是指文书的标题、案号、时间、地点、法院级别、审判程序、文书类型等信息,这些信息综合定义了一份文书的基本属性。一般而言,这些信息在裁判文书中格式化程度较高,出错的概率也较小。但实际上,还是有相当数量的文书存在这样或那样的写作错误。以文书标题的编写为例,我们在研究过程中发现,部分法官编写的文书标题存在错误,甚至个别案件的标题与文书内容毫无关系。例如,在一份案号为“(2015)二中民(商)终字第08055号”的裁判文书中,原标题为“北京市第二中级人民法院民事裁定书”,案件上诉人与被上诉人分别为“陈国奎”与“吴志军”,均为自然人。该案是一起普通的合同纠纷上诉案件,该文书为法院对上诉人的准许撤诉裁定。此案本身是一起非常简单的民事案件,文书中各项内容也书写清楚,没有发现明显错误。但该文书标题却写为“姜莉莉诉北京市东城区发展和改革委员会政府信息公开案二审行政裁定书”。双方当事人姓名、案由、案件类型等信息无一项正确。类似的还有案号为“(2015)海民(知)初字第22075号”的北京市海淀区法院民事判决书,标题却为“王敬民与北京市丰台区人民政府房屋征收办公室信息公开一审行政判决书”。还有案号为“(2013)陕民一终字第00126号”的案件,标题写为“……民事二审裁定判决书”。“裁定判决书”一词显然是该案法官的笔误了。再以最容易确定的时间信息为例。一般制作时间注明在文书末尾,采用中文大写数字。但在实际中,文书时间出现中文大写与阿拉伯数字夹杂的情况仍然不少,还有一些文书时间存在缺字、多字、年份缺失、月份缺失、日期缺失等情况。我们在前文计算2014年裁判文书的时候曾经按照两种条件进行提取,一种是只筛选年份,只要文书制作时间开头为2014年的即列入统计;另一种是筛选年、月、日,只有制作时间可识别为“2014年××月××日”的文书,我们才列入统计。所得结果显示,前者比后者多出了8000多份文书。而这还是在我们已经对时间错误进行部分修正以后的结果。可见,这种时间写作错误不仅是个别案件的问题。这一类错误还有很多,限于篇幅,我们不再一一举例。对于依靠裁判文书网进行的研究,特别是数据研究,这一类错误需要注意。

    第二,文书内容的表达多样化问题。文书内容的表达多样化是指文书的在案情陈述、裁判依据、裁判结果存在文字表达上的差异。应当说,这一问题不是在文书上网中出现的,而是长期以来一直存在的;甚至这一问题也并非错误,出于法官个体之间表达习惯的差异,对同一个问题存在不同的表达方式是正常的。我们之所以在这里提及这一问题,是因为在文书上网之后,为了处理大批量的文书,机器读取将在以后成为常态;为了适应这一趋势,文书表达的格式化、规范化将是必然的发展趋势。因此,有必要对这一问题进行说明。

    在文书内容的表达上,由于人言人殊,对于相近问题的不同表达给机器读取带来了很大的识别难度。我们这里以行政诉讼中判决被告履行法定职责的表述为例,该判决一般是为了表达被告有义务在在一定期限内对原告作出某种行政行为。其中就单单祈使动词就有表述成“责令/责成/判令/限”等多种情况,在时间限期上也可以表述为“在/于/自×××天/日/月/年内”多种情况,在要求行政机关履行行为上也存在“对/就/向/履行/受理/×××依按/照/受理×××作出/做出/给予/进行/法定职责/予以/处理/申请/履行”多种表述。这些表述之间又相互组合,衍生出更多的表达形式。而且在同一个判决之内,往往又存在多种不同的裁判结果,这些结果根据案情又可以进行海量的表达组合。尤其是在复杂的民事案件中,这些组合的数量相对其他案件又呈指数级提高。对于人工阅读至为简单的事情,在机器这里却异常复杂。我们在研究中尽量少的涉及文书内容方面的数据统计,正是因为在与人工阅读比对后,发现这种手段目前并没有十分成熟,结果的精确性有待提高。这种文字表达多样化的问题几乎存在于文书的每一个角落。上文的标识性错误还可以通过一定的手段予以校正,表达的多样性问题则只有依赖于深度学习技术的进一步发展。但是,我们认为,裁判文书内容的表达规范化和格式化应当由最高法院尽快予以推动。

    五、报告总结

    (一)进步与成果

    本报告力图在现有的技术水平上,对正在如火如荼推进的裁判文书上网的总体情况提供一幅比较清晰的全景图。总体上来看,中国裁判文书公开取得了巨大的、在几年前甚至还是难以想象的进步,令人欣喜和鼓舞。它突出表现为以下几点:

    第一,它实现了司法公开理念的突破。多年来,各级法院往往将裁判文书看作是自己的私有物,不仅当事人以外的公众难以见到,连律师复印案卷也时常遇到不正当的阻挠。以往通过最高法院公报与《人民法院案例选》等媒介公布的案例,不仅数量极其有限,而且都经过遴选和修饰,带有鲜明的目的性和倾向性。裁判文书网这种全范围、大批量的公开方式,代表了司法公开理念实现了一个质的飞跃,是司法公开的一个里程碑式事件。在推进过程中,许多法官有不适应,一些当事人也有抵触,但总的来说,还是比较平稳、顺利。打造“透明法院”、实行“阳光司法”,提升司法公信力,获得了越来越多的共识。

    第二,建立了全国统一、运转良好的文书发布平台。裁判文书网的建立使得裁判文书的公开有了统一、稳定、高效、可预期的发布渠道。在异较大的国度,如果没有一个全国性的平台作为统一的发布渠道,信息的公开必然是零散、琐碎、低效率的。2010年版的上网规定没有引起较大的反响,缺乏统一的发布平台就是原因之一。而中国裁判文书网的出现在相当大程度上避免了上述问题。同时,裁判文书网在两年多的时间里,已经经历了数次改版,不断完善。尽管它也存在网站不稳定、链接速度较慢等常见问题,但相比较于绝大多数政务性网站,它的进步是明显的。我们在与华宇公司合作搭建数据库的过程中,也不断遇到各种各样的技术难题,深感法律与技术的结合确非一件简单的事情,建立这样一个分类复杂、数据量庞大的网站,是需要付出相当努力的。

    第三,文书公开制度化。最高法院在2010年、2013年、2016年连续发布裁判文书上网规定,由粗到精,由易及难,步步推进。文书公开范围越来越明确的界定,体现了以公开为常态、不公开为例外的原则。不同层级法院、法院内部不同机构和人员在裁判文书公开责任上的明确,更是强化了公开原则的落实。以往小批量、运动式的文书公开将成为过去式,公开将成为司法文书的内在属性和人民法院的常态工作。打造“透明法院”、实行“阳光司法”的目标,至少在裁判文书公开领域,正在快速接近。

    裁判文书发布量的突飞猛进,不但提升了司法的透明度和公信力,也为法律大数据技术开发建立了良好的基础。从前文的数据来看,2014年作为裁判文书公开的第一年,即发布了550多万份裁判文书,2015年又将总发布量相比14年提高了60%以上。合理推测,目前所公布的文书应该占到全国总文书量的近一半。如此多的文书,无论是对于学术研究还是商业开发,都蕴含了非凡的潜力。在法学研究上,它甚至可能一定程度地改变中国法学的研究走向。过往的法学研究以思辨和经验取向为主,缺乏可以依靠的实证数据作为分析基础。但现在通过对大规模文书的技术处理,我们可以精确地验证以往的研究猜想,甚至发现新的学术课题。在商业上,最近几年的法律互联网服务市场日渐火爆,催生了不少创新性的法律服务模式,产生了巨大的商业价值与社会影响,这与裁判文书网海量的司法文书公布不无关系。更长远来说,裁判文书上网未来将在国家“数据强国”与“信息社会”的战略中展现出更大的价值。

    (二)存在的问题

    尽管裁判文书的公开已经取得了重大成果,但其中仍然存在一些不可忽视的问题。我们希望,指出这些问题有利于进一步落实和完善裁判文书的公开。

    第一,文书公开量仍然有待提升。按照前文计算,一半以上的文书仍未公布在裁判文书网。一些具有重大社会影响、公众关心的案件,无法在网上找到。更重要的是,这些未公开的文书未能说明不公开的具体理由。2013年版规定第4条第4项的“其他不宜在互联网公布的”文书,含义太过宽泛,也未能给出更细致的操作细则。

    第二,公开的及时性有待提高。依照2013年版规定的第8条,有关文书生效后7日内即应当发布。这一条在现实中基本没有得到落实,连最高法院自身执行得也不够理想。7日内发布的规定(特别是一审判决发布的时限)有待澄清,可操作性更有待加强。

    第三,已发布裁判文书的撤回需要规范。文书撤回制度充分考虑了当事人隐私与社会和谐等价值,有积极意义。但规定中只指出撤回的标准是法定理由或特殊原因。这一规定基本不具有实操性,赋予了法院过大的裁量权。在现实中,法院目前遇到申请撤回的情况,基本都是不作审查,一撤了之,导致该条款形同虚设。第四,法院文书发布管理体系有待重构。最高法院在规定中确立了“谁的文书谁公布,谁公布谁负责”的原则。但在实践中,基本上由基层法院和中级法院打包传输给高级法院,高级法院负责传输到裁判文书网;文书撤回也由高级法院说了算。

    由于各级法院的系统都是初建,存在许多技术问题尚待解决,如数据格式不统一、智能隐名不够准确等。这些问题各级法院都在文书上网的工作中时常碰到,由此导致的错误文书只能向高级法院申请撤回。在这种情况下,许多基层法院的法官限于时间和精力以及对抽查的侥幸心理,干脆选择对错误视而不见。

    裁判文书上网规定对文书公布管理中各级法院的职责分配有待完善。

    第五,文书公开监督有待进一步深化。在监督体系上,按照第13条的规定,目前的监督体系是最高法院监督全国各级法院,高级法院监督辖区内各级法院。这种监督只限于内部监督,缺乏有效的外部监督路径。考虑到裁判文书公开面向广泛的社会公众,可以考虑引入一定程度的社会监督。从监督内容上来看,目前的监督主要集中于文书上网数量,对文书公布的及时性基本没有列入考核。各省比较通行的方式是,高级法院在每季度末和每年末将各级法院在裁判文书网的公开量通报全省法院,并作为考核评比的依据。这就造成了前文数据所证明的季末突击上传与年末突击上传现象普遍存在。而对文书公开的质量监督,目前主要是以对各级法院进行文书抽查为主,这种方式工作量大,执行力度明显逊于对公开量的考核。

    第六,法院内部各系统之间有待进一步协调。统一的发布平台运行顺畅的基础是,法院上下级之间的软件系统能够协调统一。但出于多方面原因,目前全国法院后台办公系统是由各省自主招标建设。由此就导致了各省之间、各省与裁判文书网之间的系统对接问题。我们调研的数个省市法官都反映,他们自我记录的文书公开量与裁判文书网每季度的通报量存在不一致。由于技术标准存在差异,一些省市上传的文书需要经过文书网的运维方转换格式后再传入文书网,因此,数据延迟是常有的现象。这些问题都反映了目前的内部系统协调还存在较大的问题。除此之外,目前各省内部上下级法院之间系统的协作程度也普遍不高。以上下级法院之间的卷宗移送问题为例,如果上下级法院系统能够统一协调,下级法院或法官能够通过内部网络提醒知悉该案件的裁判结果,那么文书上网根本不用等到卷宗送达,可以做到即时公开。在我们调研中,许多基层法院与中级法院法官反映虽然法院内部实现了办公自动化,但上下级法院沟通基本还是依靠传统的方式,制约了法院内部效率的提高。

    第七,文书公开的地区差异有待进一步消除。前文的数据已经指出,在裁判文书公开的地域分布中,“西低东高”的现象较为明显。我国中东西部的地域差异与经济差异,是一个不争的事实。最高法院在文书上网规定发布时,其实也已对此有所考虑。第14条规定:“中西部地区基层人民法院在互联网公布裁判文书的时间进度由高级人民法院决定,并报最高人民法院备案。”该规定显然是考虑到了地区差异的结果。《理解与适用》中则提到会尽快确定“中西部地区三级法院生效裁判文书实现全面上网的‘时间表’与‘路线图’”。尽管有这些提前考虑,但综合近两年的数据来看,东西部地区在文书上网的步伐仍然差距较大。西部地区文书上网,不仅数量少,而且及时性差。西藏自治区210天的文书发布时间中位数就是一个极端情况。这些差距应当是在以后推进文书全面上网的过程中逐渐弥合的。

    (三)我们的建议

    考虑到裁判文书上网在我国法院全面推行不过两年多的时间,硬件架设和制度建构都在草创阶段,存在上面这些问题是完全可以理解的。最高法院新近发布的2016年版裁判文书上网规定,对其中的部分问题已作了回应。但是也有一些我们所关注的问题仍然没有得到很好的解决。我们愿意把我们的一些思考和设想继续贡献出来,为未来的持续改进提供有启发性的建议。

    首先,在现行规定的基础上,进一步构建责任分配合理的管理与监督机制。这一机制既包括法院外部,各级法院之间责任的良性分配,也包括法院内部业务庭与专责机构的良性分工。在各级法院之间,前文已经说明,目前的管理与监督方式是最高法院监督与指导全国各级法院,高级法院监督与指导辖区内各级法院。在这种机制下,中级法院与基层法院只有发布的责任,没有管理与监督的责任。我们在调研中,曾有高级法院审管办的法官向我们透露,下面各级法院的文书上传问题都要汇报到高院审管办来,他们的担子很重,事多人少的矛盾非常突出。而中级法院和基层法院审管办的法官则反映他们主要负责督促各业务庭上传文书和统计数据,问题还是都交给高级法院处理。这显然不是一个良性的机制。我们认为,各级法院应当重新划分责任机制。具体方案是“高院适当放权,各级法院自担发布责任,中院承担主要监督责任,建立完善的系统行为记录”。更详细地说,高级法院将文书撤回权下放给下级法院,由各级法院自行决定文书的删除、更换与撤回,但建立起完善的系统行为记录,每月、每季度、每年的撤改率都由系统记录在案,作为公开考核的主要指标之一。中级法院承担起监督基层法院的责任,高级法院主要负责监督中级法院,形成层次分明的逐级监督机制。前文的数据表明,文书发布量的最大贡献者仍然是基层法院,占据了文书公开量的80%。由高级法院去监督基层法院的文书发布,体制上毕竟隔了一层,既拉高了监督成本,也难收实效。在法院内部各部门之间,目前各省法院文书上传工作机制并不统一。有些法院是由业务庭的办案法官个人发布,审管办负责督促与统计;有些法院是办案法官将裁判文书交至审管办,由审管办统一进行技术处理,并打包上传;有些法院是审管办负责隐名技术处理,处理后的文书再由办案法官各自上传。我们建议,在员额制推行以后,案件的隐名处理与上传发布采用法官负责制,但可以由法官助理负责具体操作;对于不在排除事项之内,而法官又认为不宜上网的文书,法官必须给出书面意见进行说明。审管办主要负责审核文书形式错误与统计公开数据,并负责与上级法院审管办对接具体的技术问题。同时,审管办还负有对法官文书不公开意见审查的义务,并向分管副院长提出处理意见。

    除了以上两点,在对文书公开的监督中,在上级监督与自我监督外,我们还建议引入社会监督机制。各级法院应当定期对外发布文书公开工作报告,并在年度工作报告中列出每年的文书公布量与案件公布占比。这是文书公开接受社会监督的重要途径。其次,在文书上网规定上,进一步强化可操作性。

    在公开文书种类上,进一步区分各种裁判文书的差异,明确界定应该公开的文书。判决书除法定事由外,一律公开。裁定书与决定书需要进一步细化。尤其是裁定文书的种类多种多样,在审判中的作用也差异极大,有些裁定书可以导致法律程序的终结,如驳回起诉的裁定书;有些只起到程序性作用,如财产保全裁定书。目前的规定仍然较为笼统,下级法院对裁定书的公开有一定的裁量权。应当由最高法院对各种裁定书仔细权衡,列出详细的公开类目,并明确不公开的具体情况和标准,限缩下级法院在裁定书公开上的裁量权。我们建议对于能够导致结案的裁定,除法定理由外,必须一律公开;非结案性裁定书,可以区别不同种类对待,对于案件裁判结果有实质性影响的必须公开,纯粹程序性的可以由法官自己决定是否公开。但这仍然是一个过于主观的标准。更简易的操作办法是,最高法院和高级法院的裁判由于具有一定的示范意义,裁定书和决定书应当全部公开;中级法院和基层法院的结案性裁定书必须一律公开,非结案性裁定自行决定。决定书也采用这种区分方法。同时,对于不公开的文书,应当在裁判文书网公开案号与文书类型,并注明不公开原因。

    在文书生效问题上,主要涉及文书上传的时间问题。我们有两种建议方案:一是继续沿用“生效后”的规定,但放宽上传时效,重新启用2010年版规定中的生效后30日内上传规定;二是弃用“生效后”这一限制条件。规定文书送达当事人后,必须在一定的期间内上传,建议设置期限为30日。对于需要公布但又未生效的文书,应当在网页显眼处注明该文书尚未生效;待上级法院审理结果作出以后,再标注其效力。我们更推荐后一种方案。这些建议在技术上实现起来并不困难。在文书格式上,目前裁判文书格式化程度不高,对于进一步利用大数据技术进行文本挖掘,带来了很大困难。我们认为,最高法院应当对各类文书给出基本的格式规范。这种格式规范包括两个方面:一是我们通常所讲的格式化裁判文书,即文书的写作应当符合特定的格式要求。这一措施据我们了解最高法院目前已经在酝酿当中。

    二是一种技术规范,是指利用网络技术对文书特定段落进行标记。比如对于文书中的证据,由法官在写作或上传时在法院的内部文档处理系统中点击特定按钮在后台进行技术标记,对于案情介绍、裁判说理、判决结果的段落也进行相应的标记。这样就可以方便地实现同类段落的文本聚类,也不会再出现前文那种将证据日期识别为结案日期的低级错误。这种文本标记技术才是对信息技术的深度利用。对数据在制作阶段就进行初步分类,才有利于各种大数据处理技术的后期开发。最后,在系统上,最高法院应当进行协调统筹。各省法院自建系统的权力应当得到保留,这既是适应地区多样化的客观需要,也是促进技术创新的最好方法。但是最高法院应当在系统的基础方面给出统一的技术标准。

    在文书的上传、储存、发布格式与流程上,最高法院应当给出全国通用的技术标准。我们在调研中,遇到很多法院反映格式不统一带来的困扰,严重地影响了文书的发布与统计。我们也了解到,最高法院现在已经开始进行这方面的工作我们期待这些工作能够尽快取得实质性成果。在信息化建设中,最高法院可以提供文书发布网站的基本技术架构,或者提供可以通用的技术架构。各省通过招投标寻找相应的服务提供方对这种技术架构按照自己的需求再进行改造,实现技术在统一基础上的多样化。这种办法尤其有利于目前信息化建设较为落后的中、西部省份,可以节省一定的信息化建设资金。在数据流通上,最高法院应当建立不同法院之间的信息共享机制。

    目前各个法院的办公系统犹如一个个密封的堡垒,只有一两个数据统计出口与其他法院进行信息对接,很难实现信息的即时流通,无法发挥出信息化的优势。我们认为在关联案件中,各个法院应该建立信息共享机制构建一套能够共享关联案件信息的内部系统。比如上诉案件的一审法官应当能够看到二审法官对案件的审判流程。这样方便一审法官尽快知悉自己一审裁判文书的效力状态。尽管我们不赞成各个法院之间完全相互公开审判系统,但关联案件是应当互相公开知悉的。这一目标的达成,由于可能牵扯到不同法院之间、不同级别法院之间、不同序列法院之间的信息互传问题,必须由最高法院进行全局统筹,开发各法院之间能够有条件信息共享的软件系统。

    在文书发布系统上,从技术上持续改进中国裁判文书网。这些技术改进包括但不限于:完善文书的纠正、撤回机制,建立文书变更记录。文书的撤回应当网上留痕,并保留撤回说明;建立关联案件文书链接,如同一贿赂事实中的受贿案件文书与行贿案件文书关联等33;同一案件的多份文书在裁判文书网建立文书群或文书链,并以时间线上可视化的形式展现;建立裁判文书与庭审视频关联。目前最高法院已经建立了中国法院庭审直播网,积累了一部分的审理录像,可以将裁判文书与相对应的庭审视频进行关联提示;设置热点案件文书公开首页置顶;提供PDF格式文书;增加“当事人”检索项等。

    最后想强调的是,司法公开应当是全面的公开。除了本文所考察的裁判文书公开,还有诉讼流程的公开、法庭审理的公开、诉讼档案的公开、司法统计数据的公开。在不违反法定理由的情况下,诉讼档案也应当分层级、有步骤地向社会公众开放。一些法院以“能够上网的裁判文书都已经上网”为由,拒绝公众甚至案件当事人、利害关系人查询诉讼档案。这不是进步,是倒退。我们在研究过程中,需要将我们收集的数据与全国的审判数据进行比较,确定与衡量公开文书的定位与态势。但我们发现各级法院公布的司法统计数据存在严重的数据公开不全面、数据标准不一致、数据前后不连贯、数据公布时间随意化等现象。这对我们的研究造成了很大的障碍。我们曾向最高法院有关部门申请数据公开,但没有获得相关数据。我们期望最高法院以推进裁判文书公开的精神和魄力,推进全国司法统计数据的主动、及时、全面公开。

【注释】
本报告系何海波、于晓虹主持的“清华大学司法改革与大数据研究课题”的部分成果。清华大学法学院博士生马超具体负责并执笔,清华大学的俞黎芳、谢智洁、许星源、易霏霏、张兆函、黄敏达、周小琪等同学参与了文献收集、数据整理等工作。
许星源、易霏霏还参与了本报告部分章节的写作。课题组成员感谢北京华宇信息技术有限公司为课题研究提供的资金和技术支持。
1.周蔚:《大数据解读2014年裁判文书公开》,载http://oicwx.com/detail/314889,上传日期:2015年4月13日。
2.高荣英:《北京市专利侵权案件数据分析报告》,载http://www.zhichanli.com/article/22454,上传日期:2016年1月8日。
3.王丽娜:《公开判决书中贿赂案件大数据分析》,
载http://xbxsf.nwupl.cn/Article/llqy/201407/17171.html,上传日期:2014年7月25日。
4.对于现有报告常常重点关注的文本分析,如案由分析、裁判说理分析等,我们较少涉及。一方面,是受限于本报告的研究主旨;另一方面,是受限于现有的技术水平。我们通过文本挖掘软件和人工抽检进行比对,发现其精确度难以达到我们的要求。
5.需要说明的是,在《〈关于人民法院在互联网公布裁判文书的规定〉的理解与适用》中,最高法院要求各级法院开始上传裁判文书的时间为2014年1月1日。但在此之前裁判文书网已经上线。根据我们统计,自2013年从7月1日开始到2013年年底已经有上万份文书发布在裁判文书网。这部分数据虽然可能是系统内测时的遗留数据,但我们为了保证数据的完整性,依然自2013年7月1日开始算起。
6.需要说明的是,我们的总数高于裁判文书网总数是正常的。至少存在以下两个原因可供解释:一是裁判文书网存在文书撤回机制。在实际运作中,文书撤回的权限在各高级法院,自裁判文书网上线以来,由于影响力日渐扩大,不少案件当事人出于对隐私泄露的担心,向法院申请撤回个人涉案文书,而由于没有明确的撤回标准和监督机制,各高院为了息事宁人,往往不经审查,一撤了之。比如,课题组在西南某省调研时,得知该省2015年就撤回了一千多份文书。而我们的数据库是在不同时间段内逐步提取的,其中包含了一些被撤回的文书。二是裁判文书网自身的技术问题。比如我们发现广东某市将一些系列案件都归入一个案号下操作。这样如果以案号为准进行判断,这一批系列案件在系统总数上只会显示为一份文书。我们的系统采取了不同的识别方法,将这些案件都视为单独的裁判文书。这样在总数上稍高于裁判文书网总数是完全正常的。我们分析有两个原因可能导致这种情况:1.主审法官可能基于某种考虑故意将落款时间后移,保留较为充裕的宣判时间,却
裁判不慎被“提前”发布了;2.主审法官笔误写错了。
7.本报告所指时间如无特别说明,一般所列时间为文书制作时间。
8.如所指为文书发布时间,将会特别说明。
9.参见贺小荣、刘树德、杨建文:《〈关于人民法院在互联网公布裁判文书的规定〉的理解与适用》,载《人民司法(应用)》2014年第1期。
10.必须指出的是,在各省的司法数据公开中,存在统计口径不一致、统计标准不统一等问题。我们在后文的附随报告中专门有一份报告考察司法数据的公开问题。但就目前而言,各省高院的工作报告已经是我们能够找到的最权威数据。同时在表10数据中还有有两点要予以说明:1.部分省份公布的结案量是以“万(件)”计,没有精确到个位,我们对其省略的位数直接按零计;2.宁夏回族自治区的工作报告没有透露2015年度的总结案量,我们按照其工作报告中给出的单项数据进行了汇总,得出的数据与往年对比,相差不大,应该比较准确。
11.需要说明的是,由于部分裁判文书书写错误,在数据库中以2014年作为检索对象和以2014年××月××日作为检索对象,结果是不一致的。前者比后者多出5万份左右,即这5万份文书只能识别出制作于2014年,却无法判断具体日期,出于数据一致性和精确性的考虑,我们采用了后一份数据。
12.贺小荣、刘树德、杨建文:《〈关于人民法院在互联网公布裁判文书的规定〉的理解与适用》,载《人民司法(应用)》2014年第1期。
13.我们认可的结案裁定主要有以下几项:在民事案件中,一审案件中的调解;终结;按撤诉处理;撤诉。二审案件中的终结;驳回起诉;按撤诉处理;撤诉;发回重审;维持;撤销变更原裁定。再审复查案件中的不予受理;终结;按撤回申诉、再审申请或抗诉处理;指定原审外其他法院再审;撤回申诉、再审申请或抗诉;指令原审法院再审;驳回申诉、再审申请或抗诉。特别程序案件中的终结;按撤回申请处理;准予申请;撤回申请;驳回申请。破产案件中的撤回申请;重整;宣告破产;终结破产程序。在刑事案件中,一审案件中的按撤诉处理;撤诉。二审案件中的按撤诉处理;终止;撤诉;调解;撤销变更原裁定;改判;发回重审;维持。再审案件中的按撤诉处理;终止;撤诉;撤销变更原裁定;改判;发回重审;维持;指令原审法院再审。再审复查案件中的指令原审法院再审;驳回申诉、再审申请或抗诉;指定原审外其他法院再审。复核案件中的终止;改判;发回重审;核准(或同意原判)。强制医疗案件中的终止。在行政案件中,一审案件中的按撤诉处理;终结;调解;撤诉。二审案件中的按撤诉处理;驳回起诉;终结;调解;撤诉;改判;维持;发回重审;撤销变更原裁定;维持原裁定。再审案件中的按撤诉处理;驳回起诉;终结;撤诉;维持;发回重审;撤销变更原裁定。再审复查与审判监督案件中的终结;不予受理;按撤回申诉、再审申请或抗诉处理;指定原审外其他法院再审;撤回申诉、再审申请或抗诉;指令原审法院再审;驳回申诉、再审申请或抗诉。非诉执行审查案件中的终结;撤回申请。非诉执行审查复议中的驳回申请;裁定不予执行;裁定准予执行。在执行案件中,和解并履行完毕;维持(驳回复议申请);执行完毕;终结;未完成送达或调查;撤销或改正;撤回申请。共95种。
14.贺小荣、刘树德、杨建文:《〈关于人民法院在互联网公布裁判文书的规定〉的理解与适用》,载《人民司法(应用)》2014年第1期。
15.如山东省高级人民法院在《山东省高级人民法院关于在互联网公布裁判文书的实施办法(试行)》中,明确将于撤诉有关的裁定书排除出公开范围;浙江省高级人民法院则在《浙江省高级人民法院关于在互联网公布裁判文书的实施细则》中,将确认人民调解协议效力的裁定排除出公开范围。
16.总量占比是指某省特定的案件类型文书数量在该案件类型全国总量中的占比。
17.限于篇幅,我们无法在此全文展示该表。有兴趣的读者可以到以下网址下载该表,http://pan.baidu.com/s/1mio8ehi.需要提醒的是,由于有部分案件我们无法确定是否存在相应的诉讼程序,该统计结果仅供参考。
19.出于这两种数据的特性,我们在本报告中推荐采用中位数进行比较。以下各表我们在计算总都排除掉了上传时间先于制作时间的错误文书,这一点前面已经有过介绍。
20.这部分数量虽然极少,但是可能对下文某些数值计算影响极大。
21.在上诉案件中,当事人上诉,一审法院向上级法院移交卷宗移交,二审结案并给一审法院寄回卷宗。如果维持原判,一审裁判文书生效;如果撤销原判,一审文书并不生效。这一点减少了文书上传(一审法院通常不会上传被二审法院撤销的文书),更是拖延了上传时间。
22.后两类情形在本文所抽取的刑事案件样本中经常同时存在。此处为了更加清晰地与第6条相对应,仍区别计算。
23.一个值得探讨的问题是,假如案件类型本身不属于婚姻家庭、继承纠纷,但案情叙述或判决说理中涉及该类法律关系或相关案外人的情况,是否应当进行相应的隐名处理。我们认为,从保护个人隐私的立法目的出发,案件中所涉婚姻家庭、继承信息均应予以隐匿。
24.贺小荣、刘树德、杨建文:《〈关于人民法院在互联网公布裁判文书的规定〉的理解与适用》,载《人民司法(应用)》2014年第1期。需要说明的是,根据《理解与适用》的解释,“家庭住址”是指家庭住址中可识别的相关信息,即自然人县级(直辖市及副省级城市区级)行政区划以下的具体住所地,县级(直辖市及副省级城市区级)行政区划以上区域性地址一般应予保留。“通讯方式”除传统的书信、电话通讯方式外,还包括自然人在网络所注册的各种地址和各类账号。
25.参见贺小荣、刘树德、杨建文:《〈关于人民法院在互联网公布裁判文书的规定〉的理解与适用》,载《人民司法(应用)》2014年第1期。
26.贺小荣、刘树德、杨建文:《〈关于人民法院在互联网公布裁判文书的规定〉的理解与适用》,载《人民司法(应用)》2014年第1期。
27.检索时间为2016年8月23日。
28.有文献将“特殊原因”解释为“足以导致撤回该裁判文书的价值已经大于继续公布该裁判文书的价值”。
29.贺小荣、刘树德、杨建文:《〈关于人民法院在互联网公布裁判文书的规定〉的理解与适用》,载《人民司法(应用)》2014年第1期。
30.2013年版规定第11条规定,“……需要撤回的,应当由高级人民法院以上负责互联网公布裁判文书的专门机构审查决定,并在中国裁判文书网办理撤回及登记备案手续”。如我们在系统中发现了一份案号为“(2012)鱼民初(一)字第730号”的民事判决书,其标题为“广某壮族自治区柳州市鱼某区人民法院”。这种荒诞可笑的隐名方式,无疑是自动隐名软件造成的。但这种一望而知的错误却没有得到撤回,只能说明撤回的成本对于基层法官来说实在太高。
31.值得提及的是,2015年5月最高法院发布了《关于人民法院案件案号的若干规定》及配套标准,这是最高法院在文书格式化方面一个可喜的进步。
32.2015年,最高法院出台了《人民法院数据集中管理技术规范》,提出对全国审判数据、司法人事数据和政务数据进行集中管理,确保全国法院数据上下联动、互联互通。但这一技术规范文本并未对外公布,具体内容外界不得而知。参见中国社会科学院法学研究所法治指数创新工程项目组:《中国司法透明度指数报告(2015)》。
33.我们注意到,在近期的裁判文书网改版中已经添加了这一功能,部分案件在查询结果中已经给出了关联文书的提示。这值得肯定。
        
        
      首都法学网       北京市高级人民法院       中美法律信息与图书馆论坛(CAFLL)
      国家图书馆       美国法律图书馆学会(AALL)       国家检察官学院
      中国社科院法学所图书馆       国际法律图书馆协会(IALL)       最高人民法院图书馆

主管单位:中国法学会  主办单位:中国法学法律网合作机制 技术支持:北大英华科技有限公司(北大法宝)
电话:010-82668266-152 传真:010-82668268
加入收藏 | 本站首页 | 联系我们
go