本站首页 关于我们 法律图书馆与法律信息研究会 法律信息研究 中外法律图书馆 法学文献与检索 政府信息公开 法律图书馆导航 法律法学网导航
法律信息资源
法律信息服务
数字信息检索
数字技术发展
专业网站建设
澳门法律信息
  当前位置:首页 > 法律信息研究 > 数字技术发展
数字技术发展
暂无下载资料

 小律所、大数据:诉讼的数据化时代
            天同律所诉讼技术研发中心 点击量:1776
    

    当前,大数据的概念被各个行业广泛讨论,在这样的语境下,中国的律师事务所也开始谈论大数据,一时间“大数据”概念风靡法律服务行业,法律服务业大数据的时代似乎已悄然到来。

    一、大数据对律所有何作用?

    新技术观察作家Derrick Harris对律师事务所基于大数据如何进行流程优化提出了三方面的见解:

    一是文档检索可能是大数据对法律工作影响最大的领域。律所通常存储海量的非结构化电子文档,包括电子邮件、Office文档、PDF文档等等,从数以TB计的数据中检索案件相关文档简直就是律师的噩梦,费时、费力而且准确性差。通过大数据智能分析软件,律所能够大大提高文档检索效率。例如大数据创业公司Recommind开发的大数据软件能通过机器学习算法进行“预测编码”,大大提高法律文档的检索效率。另外一家值得关注的企业--PureDiscovery的语义分析技术也有大幅提高文档检索效率的功用。

    二是诉讼案件中会产生大量文档,而这些文档“蕴藏”的数据对后来的代理和审判具有很高的参考价值。大数据创业公司LexMachina的目标客户是知识产权律师,为他们提供决策支撑数据统计服务。LexMachina数据分析的数据源主要来自公开的PACER(联邦法庭数据库),PACER的数据一直存在,但是LexMachina是第一家通过机器学习和自然语言处理等技术从中“淘宝”的公司。值得注意的是,Recommind也在不断开发新的产品Hypergraph(超级图谱),用来帮助律师发现人、话题、时间线、非结构化数据之间关联关系等。

    三是律师们需要自己动手,创造性地利用各种现成的大数据工具和数据源。例如律师可以使用类似ScraperWiki这样的工具分析证人的Twitter联系人网络和活动记录。律师还可以使用类似etcML这样的免费工具(对应的付费服务如AlchemyAPI)分析各种文本,包括推文和电子邮件,来发现关键观念或进行倾向性判断。零用import.io这样的工具从网站抽取数据(例如房产价格历史数据),并制作成图表。

    在美国,法律行业就大数据的工具和方法已经展开实质性探讨,创业型的IT公司纷纷将目光投向传统的法律服务行业。当中国还没有针对法律行业的大数据分析工具时,天同律师事务所已提出大数据分析方法要与自身核心业务结合,向IT服务市场明确提出自身大数据运用需求,待时机成熟时在自身的核心业务中高效运用大数据工具。

    二、天同律师事务所的大数据战略

    天同诉讼大数据战略,其目的在于建构对法律大数据进行分析、提炼、加工、推荐的大数据分析体系,而非存储庞大数据信息仅仅用于信息检索。换言之,如果把诉讼大数据比作一种投资,那么这笔投资实现盈利的关键,在于提高对各类法律大数据的“加工能力”,通过“加工”实现信息的“增值”.对于天同的核心业务诉讼而言,“增值”服务的主要对象是天同律师,即天同的客户关系管理体系中的内部客户,大数据能够精准预测他们在案件代理过程中的需求,对于提高案件代理质量和服务效率是不言而喻的。

    通过实施诉讼大数据的战略,天同所希望能从更多的角度来分析、评价案件,提高法律检索的效率和全面性,为出庭律师提供更多有价值的信息,形成对案件的全面认知,以便构思最佳的代理策略。天同律师在诉讼过程中运用大数据分析,不仅在案件的办理阶段,而是覆盖整个业务流程,即便天同没有代理,但进行过分析论证的案件,也将提供大数据分析的阶段性结论供客户参考。具体来讲,天同律师在业务流程中进行大数据分析的一般过程如下:

    前期论证阶段,解决文档电子化和案件难度预判的问题,对案情宏观结构进行解构和初步标签化处理,为下阶段大数据分析进行准备工作。

    磋商代理阶段,解决案件胜率判断和律师费用计算问题,案件的胜率取决于外部司法环境、管辖地、对方律师等,还取决于案件内部主要争议证据材料的掌握情况、法律适用、代理经验等因素。例如,将证据材料与待证事实之间的关联关系作为标签,对这种关联关系是否成立进行大数据分析,故能够基于大数据分析,对证据与案件事实间的关联关系进行评估(大数据思想:只问关联关系,而不问因果关系),进而结合其他因素对案件胜率进行评估。律师费用的计算,不妨也采用大数据分析,对同类案件的市场平均价格快速获取并统计,结合案件难度为天同的诉讼代理寻求合理报价。

    案件办理阶段,随着案件信息的更新,事实争议和法律争议已经逐渐清楚,这一阶段的大数据分析集中在案外相关因素的分析上,为争议的本质提供新的洞见,或者新的证据,例如审理法官的相关观点、纠纷产生时所在行业的数据,最新商事审判的价值判断,以及相关的“天同码”。

    结案归档阶段,评估大数据分析的使用效果,并对标签及其逻辑结构的知识进行归档,完善案件标签化体系(元数据方法);将前期的预判结果与最后的裁判结果进行比对,进而对此类案件的标签化方法进行调整。

    天同诉讼大数据运行机制,在总体设计上,由一大流程、两大系统组成,即“标签判断流程、大数据检索系统、大数据统计分析系统”。每个流程或系统都具备信息输入和输出的功能,是大数据分析中信息处理加工的中间环节,最后形成的成果形式是“为案件提供更多有价值的知识”。

    天同诉讼大数据战略,最终目的在于为高端诉讼提供更多的理解视角,为诉讼案件提供更多的洞见和理解,在天同业务流程的每个阶段充分运用大数据分析的方法,使得天同“三大诉讼法宝”--诉讼可视化、模拟法庭、大数据与知识管理能够融会贯通、相互配合,确保“三大诉讼法宝”成为天同诉讼业务的核心竞争力。

    三、大数据在律所的应用

    第一,大数据能帮我们解决客户最关心的“能不能赢”的问题。

    为此,我们做了案件难度评估系统,根据事实、法律关系区分若干个一级、二级参数,再细致拆分成正向因素、反向因素等,然后为每一个参数赋值,据此得出1到10的难度系数。问题的关键是,这个参数是否科学,取决于赋值是否准确。那么,赋值的依据是什么?我们组成一个3人评估小组,根据这个评估小组成员的主观经验来判断数值大小,经过多年磨合及相互影响,目前3人的估值数已高度接近。但这毕竟是主观经验,缺乏客观数据的支持。过去我认为这个问题不可能彻底解决,但是近两年发现大数据可以帮助到我们。全国每年有千万量级的民事案件,类型不一,通过对海量案件进行大数据分析,可以为难度系数赋值找到一个不是靠经验、而是靠大数据的分析方法。

    第二,大数据能帮我们解决律师费报价的问题。

    以前当事人问我律师费是多少,为什么是这个数额,我难以回答。因为不知道竞争对手如何报价,也不知道当事人可以承受的报价是多少。解决的办法就是向市场要数据,找出市场平均价。但是天同每年接的案子很少,自身的数据不够支撑研究开展。惟有建立一个诚信的平台,以众包的方式来完成,让全国的律师和当事人自愿到这个平台来贡献自己的数据,这方面工作才能进行。所以,我们既要有搜集数据的办法,又要有处理数据的能力。

    第三,大数据能帮我们解决诉讼风险防范的问题。

    我们的当事人最不希望的是下次做生意时遭遇同样的诉讼问题,然而从来没有一种特定的交易方式,能避免所有的风险。于是我们想到了大数据的办法。不管社会生活有多少种类型,都可以依照一定的逻辑为其贴上标签,把同一类型的所有风险都归到一起。全国一年有千万量级的民事案件,意味着有如此大量发生风险的案例,根据这么多案例来倒推风险防范的问题,必须依靠大数据。

    人们常说,当前“互联网颠覆传统行业进入了深水区”,我理解的所谓深水区,就是要以互联网的思路结合对传统行业的深刻理解,这是难度很大的一件事。天同律师事务所专注于商事诉讼,深刻地理解这个行业。同时,天同是一个具有创新基因的律师事务所,近年得到很大发展的“三大诉讼法宝”就是一个佐证。我们需要自身在骨子里具有互联网、大数据的基因,用我们对行业的深刻理解,与各位大数据专家一起,共同迎接大数据给法律这个最古老传统的行业带来的巨大变革!

        
        
      首都法学网       北京市高级人民法院       中美法律信息与图书馆论坛(CAFLL)
      国家图书馆       美国法律图书馆学会(AALL)       国家检察官学院
      中国社科院法学所图书馆       国际法律图书馆协会(IALL)       最高人民法院图书馆

主管单位:中国法学会  主办单位:中国法学法律网合作机制 技术支持:北大英华科技有限公司(北大法宝)
电话:010-82668266-152 传真:010-82668268
加入收藏 | 本站首页 | 联系我们
go