本站首页 关于我们 法律图书馆与法律信息研究会 法律信息研究 中外法律图书馆 法学文献与检索 政府信息公开 法律图书馆导航 法律法学网导航
法律信息资源
法律信息服务
数字信息检索
数字技术发展
专业网站建设
澳门法律信息
  当前位置:首页 > 法律信息研究 > 数字技术发展
数字技术发展
暂无下载资料

 从“人工智能”到“智慧法务”
            吴晓如 点击量:3555
科大讯飞股份有限公司
    
  今天分享这个话题很有意义,昨天科大讯飞获批认知智能国家重点实验室,所以我想今天希望通过这个话题的分享我们可以更多建立和司法界的联系。
 
  实际上人工智能现在很受到整个社会各界的关注,讲一下人工智能实际上经过了三波浪潮,第一波、第二波起来之后很快下去了,为什么这一波人工智能的浪潮长盛不衰?主要有两个原因,一个是云计算、大数据,还有一个重要的原因,这一波人工智能已经在实际的应用中发挥重要的价值了。大家可能在看两边的大屏幕,实际上这两边大屏幕上是人工智能在后台录入所做的事情,所以现在整个第三波人工智能的特点,一个是技术快速突破,第二个是整个在应用界开始产生作用。应用界产生作用又带来更大数据推动技术更快的进步,所以我们讲第三波人工智能技术和应用双轮驱动,推动整个人工智能非常快速的进步。
 
  人工智能最近的过程中有很多社会学家,当然大家很多人了解人工智能是因为谷歌的围棋机器人,基本上谷歌的围棋机器人通过大量的学习现在到了人不可挑战的层次。另外一个层面现在整个人工智能也不仅仅是用在博弈的游戏上,现在在很多工作中,比如BBC和剑桥大学当时做了一个研究预测,未来几十年中可能我们有赵国一半的工作会被人工智能替代,可能不仅仅是工作岗位,还有大量工作中的一些技能可能被人工智能所替代,所以我想每个人都要关注人工智能,人工智能下一步是一个非常重要的工具,它可能重要程度不亚于互联网。
 
  讲一下人工智能发展最重要的三个技术,云计算是要有大规模的计算资源,当时谷歌为了训练他Alpha Go的围棋机器人,可能动用了成千上万的CPU。所以对于整个司法领域如何快速截取司法要的大数据是非常重要的。
 
  第三个方面是人工智能行业做的,我们要比机器赋予更好的算法,新一代神经网络算法的赋予,使得我们机器学习取得了非常快速的进步,所以一个单向的任务,比如司法领域我们要关注到底怎么定义一个任务,司法领域是人工智能以后特别可以发挥作用的,因为人工智能是规则清楚、边界清楚,司法领域规则是比较清楚的。讲一下人工智能里面的几个关键的技术,这一点上中国的相关技术一直现在也是处于国际上的绝对第一阵营,我们科大讯飞的语音识别技术在去年参加谷歌三大语音识别最关键的比赛,我们叫多通道的比赛上三个关键指标是全球最好的,所以现在语音识别在大家的日常工作中已经能够发挥非常重要的作用了。我今天来展示是因为在今年互联网大会上,互联网大会当时的麦克风接入问题效果不是很好,一定要给大家展示一下,大家可以看到虽然我带了比较重的口音,但是语音识别一点问题没有。
 
  第二个我们看一下图象识别,现在人工智能中的图象识别最近也取得重要的突破,这个比赛是国际上一个叫做肺部影像机器自动识别,现在机器自动识别可以做到94.1%,也就是说机器对于整个CT等等,相关的影像自动识别已经可以大家三甲医院放射医生的水平。所以以后基层医院的医生进行影像诊断可以人机器助手一起协同进行,如果把握不准最后再提供给专家,所以看到人工智能在图象识别上也取得非常大的技术。
 
  语音合成上很多人了解科大讯飞是通过语音合成,语音合成这几年已经取得了非常大的进步,科大讯飞在过去12年中,无论国际上是中文、英文还是其他语言,科大讯飞是全球最大的。给大家看一个比较有意思的演示,先看一段视频(视频)实际上这个是机器学习,用我们的机器插播学习特朗普半个消息的语音,我们可以用他的声音模型产生任何话,任何中文、英文把文字输进去,特朗普就可以说话。所以这个是大家可以看到现在机器学习非常强大。
 
  当我们今天在中间说到很多下一步涉及到司法领域的应用,国际上现在在认知智能上,刚才我说的是机器的看和听,还有是机器到底听到是什么,这个不仅仅是感知智能也需要认知智能。斯坦福在今年做了一个关于阅读理解的认知智能大赛,做法是让机器自动读一篇文章,读这个文章的时候是专家对这个文章设置一些问题,这些问题答案是由专家之前预设的,看机器读了文章以后能不能自动回答这些问题。现在机器回答问题的准确程度已经达到81%,所以科大讯飞非常高兴,我们在一系列重要的国际技术评测中,在斯坦福这个比赛中科大讯飞是全球最大的。刚才很多人提到图灵测试,就是后台当地做了一个机器还是人,如果分不清楚的话机器就是通过图灵测试。但是互联网的体系有时候通过搜索是可以通过图灵测试,所以现在国际上有一个是图灵测试的升级版的比赛,要做认知和推理,这个比赛叫做(英文),比如爸爸抱起他的儿子,谁重?那肯定是儿子,所以机器要理解本体的意思并且可以做出相关推理。也非常高兴去年全球认知推理大赛科大讯飞是最好的,虽然是最好的但是只达到60%,而且认知推理是题目不是很难的。
 
  可以提一个认知推理在实际应用中现在可以产生的价值,我们在今年国家医生资格证书考试中,这个考试像有些考试一样非常难,医学院学生毕业两到三年参加这个考试,600分总分,360分可以过关,这是完全的新题目,科大讯飞今年国际卫计委组织了一个非常严谨的考试,请了公证处公正,机器人参加考试获得超过分数线100分的成绩,所以认知智能在一些领域里面因为医学领域是很复杂的,在医学领域我们取得一些重要的进步。
 
  国家在新一代人工智能发展规划中明确提出要加强人工智能和各个行业的结合,其实中间有一个比较重要的要加强和司法的资源。因为中国的司法资源非常的稀缺,而且对每一个老百姓非常重要,所以下一步怎么通过人工智能应用能力提升我们司法资源的效率和效果。科大讯飞为了推动进一步解体数据,四年前我们就开放了科大讯飞的人工智能平台,所以今天大家在外面看到演示的时候其实有很多,是我们科大讯飞的技术在支撑。这个平台每天支撑的量是40亿人次,每天各种语言的合成识别自然语言图象非常大,现在累计在我这个平台上开发的开发者数目已经有48万家,所以有非常大的开发者的提升。
 
  这几年人工智能在很多行业、教育、医疗、安全、政务很多行业,比如像无锡最好的中学天一中学用科大讯飞人工智能技术做个性化的学习,所以很多方面都开始通过人工智能提高效率提高个性化。
 
  下面我再介绍一下人工智能现在在司法领域,今天结束之后我想跟刘总这边,现在公检法司,我们和司法下一步的结合还是偏少一点。
 
  我介绍一下,第一个是全球现在对整个人工智能在司法领域应用的非常广泛比如非洲的人权法院,协同伦敦大学这个宾夕法尼亚他们一起进行相关研究,最后通过机器计策审判结果,预测准确度差不多到80%,所以通过这个数据可以看到这584个卷宗的案例是比较复杂的,它更多的是希望机器是站在事实的角度而不是站在形式主义的角度,所以它的难度比较大。可以看到80%可以告诉我们两件事情,第一个以后在司法环节中可以对我们法律和司法人士起到很好的作用。第二机器不可能替代法官。
 
  第二刚才孙教授谈到最近非常热的叫Ross是IBM基于沃森做的司法机器人。我们科大讯飞是第一个全球通过医生资格证书考试的机器人,所以下一步我们认知机器人法律里面可以做更多的事。科大讯飞目前和最高院、最高检、公安部成立了联合实验室,由此以来唯一在体系外的实验室在科大讯飞。在法律中的应用几个重要的场景,第一个现在在整个法庭审判,现在法庭审判中已经大规模的包含最高院的自主庭使用科大讯飞的前审记录中,现在达到能达到95 %以上的准确度,让庭审效率提高30 %,因为原来书记员经常跟不上整个庭审记录的,现在有了这个机器人的帮忙以后,比如最高院现在推苏州模式,当时苏州是我们和苏州法院一起做的,差不多原来一下午审三到四个案子,现在有了这个可以多审一到两个案子。第二个像检察院等等相关的笔录过程,现在检察官和相关寻访人进行谈话,谈话结束基本上一份笔录大概形成,所以这个场景现在应用的非常好。我们在会议系统里面,今天我展示这个会议系统是中央财政部里面的,中办、国办都用这个系统,这个系统是一个保密性的,并不需要通过互联网大规模的机器,这个我们在中间做了大量的工作,所以任何因为司法工作中经常需要保密,这个非常好的能够满足保密性的需求。
 
  第三个大家之前还介绍了一些像12348,我们现在整个电话服务在非常多的行业,比如像国税总局,它通过电话分析中,每天电话录音在哪,用机器把它完全扫描一遍,自动通过整个的内容分析看一下今天有哪些热点事件,每天可以形成一个报表给领导。所以每天成千上万的电话机器在后台不需要人听,一遍扫描以后每天可以有一份分析报告。另外全场景的语音交互,下来法庭的法官只要一说马上案件就自动跳出来,现在叫自动找证据所以非常迅速,使整个法庭效率非常流畅。电子卷宗原来大家很痛苦的讲公检法里面有一个电子卷宗大家都在做花了很多时间,但是怎么用?电子卷宗不能得到很好的应用,现在看到有人工智能应用以后,电子卷宗除了满足必要信息的自动填写,到最后帮助法官生成初步的法官文书,首先在使用上可以解决问题,可以使得我们整个公检法体系办案方便。第二个在整个卷宗上来说,也大幅度的通过相关的技术提高了它的使用速度,比如现在机器是自动扫描生成计算机可以分析的文字,通过整个后台平台大家统一这个平台都可以使用,所以目前刚才孙教授也说了,去年孟书记在全国司法工作上说到上海,上海高院有一个专项,现在怎么把公检法里面的一些证据体系,通过人工智能和IT的手段规划起来,因为完全通过软件的东西大家不同的人仍然有不同的理解,做证据链的统一很困难,所以经常认为检察院认为可以把案件转到法院,法院认为不行又打回,这个使司法资源极大浪费。现在通过一些IT和人工智能把这些证据链一定意义上,也不能说做的非常完美,但是一定意义上做成相关的统一以后,使公检法整个体系能够更好协同工作。
 
  所有实际上在各个重要的场景中,法庭审判的场景,检察院询问的场景,包括以后司法中间还有其他的重要场景,这些场景化的数据都可以积累在统一的司法大数据平台里面。刚才讲司法的大数据从哪来?第一个从人的知识工程化里面来,第二个更重要是主要场景里面的行为数据里面来,所以现在越来越多的司法环节里面的一些关键数据都已经开始呈现结构化,因为原来大量视频、音频的数据虽然,但是处理很难,现在可以通过计算机把它变成计算机处理的结构数据,这样后面调用的时候非常方便,所以整个大数据下一步还会推动司法人工智能的进步。所以今天时间有限利用这个时间给大家汇报科大讯飞和在司法方面上的工作,谢谢大家!            (本文是在首届中国国无锡智慧法务发展大会上的发言)
 
        
        
      首都法学网       北京市高级人民法院       中美法律信息与图书馆论坛(CAFLL)
      国家图书馆       美国法律图书馆学会(AALL)       国家检察官学院
      中国社科院法学所图书馆       国际法律图书馆协会(IALL)       最高人民法院图书馆

主管单位:中国法学会  主办单位:中国法学法律网合作机制 技术支持:北大英华科技有限公司(北大法宝)
电话:010-82668266-152 传真:010-82668268
加入收藏 | 本站首页 | 联系我们
go