主讲嘉宾:贠(yun)亚基
主持人:中关村大数据产业联盟秘书长助理、亚信数据王维
承办:中关村大数据产业联盟
嘉宾介绍:
贠(yun)亚基,亚信数据公共安全解决方案部资深咨询顾问,8年公安行业从业经验。参与过公安大情报平台、情报研判、人口库等项目的建设及咨询规划工作,对公安刑侦、禁毒、情报警种均有研究。目前主要从事公安行业的大数据应用和行业发展动态研究,以及行业解决方案的设计与市场推广。
以下为分享实景全文:
大家好,简单的自我介绍下,我叫贠(yun)亚基,8年公安行业从业经验,从事过公安人口库、禁毒、刑侦、研判平台的开发、项目管理、产品设计、规划咨询等工作,目前专注于公安大数据应用的咨询研究。
感谢中关村大数据产业联盟提供的这次机会,也非常高兴能和各行业专家探讨公安行业大数据的应用方向。
我今天分享的主题是:利用大数据预防犯罪及辅助案件侦破—警务大数据探讨。
今天分享的内容分为三部分:
首先是国内外警务大数据应用的一些案例:介绍国外大数据应用于公共安全的方向及理念,以及国内警务大数据的实践。
第二部分如何应用运营商的数据进行犯罪预防及案件侦破
第三部分分享几个结合公安业务的应用场景
国外在公共安全行业大数据的应用案例,大家知道的就是“棱镜”,虽然“棱镜门”在国际范围内引起很大的争议,但是不可否认,它同时也发现和预防了多起恐怖事件,具美国军方称,棱镜成功的防范了数十起恐怖事件。
今天重点分享美国在维护社会安全和预防犯罪案件方面的两个大数据应用案例。
计算机辅助乘客预审系统(简称CAPPS II),在旅客预订航班时,该系统要求旅客提供更多的个人信息,并通过各种渠道收集旅客的所有相关信息,如购票的时间、地点、付款方式;通过政府掌握的旅客信息及其社交网络信息分析其行为、社会关系等。并由此生成一个包含无危险、未知危险、较高危险或高危险的危险评估结果。这些资料确定旅客是否需要做进一步安检,被认为有危险的旅客将要接受进一步的审查,而加快无危险的普通旅客的安检速度。
在大数据预防犯罪案件方面,美国圣克鲁斯警察局通过城市大数据预测犯罪地点和时间。利用大数据技术对历史案件进行分析,发现犯罪趋势和犯罪模式,找出共同点和相关性,同时结合城市数据源(各种实名制登记信息)和社交网络数据,甚至能预测犯罪。
警方利用IBM Blue CRUSH以及SPSS预测分析软件以及i2 COPLINK软件,整合警方掌握的各类数据,提供数据分析及数据可视化功能,准确的进行犯罪模式的分析,发现犯罪热点地区,为警力的调配提供依据,提前进行防控,预防犯罪的发生。
国内公安行业应用大数据的案例目前还不多,今天重点分享下怀柔公安的大数据应用:犯罪数据分析和趋势预测系统。
怀柔公安将近9年的1.6万起案件数据,抓取4700多个犯罪空间坐标,通过多种预测模型,预测未来某段时间、某个区域,可能发生的犯罪概率、犯罪类型。此系统将犯罪案件分为入室盗窃案、强奸案、杀人案、诈骗案、抢劫案等八大类,按不同区域,以图形的方式显示出发案比例。每类案件都有其犯罪时间规律,系统能够以数轴方式预测出不同时间段发生犯罪的概率,并随时补充近期发生犯罪的时间、地点等数据。
通过此系统,怀柔警方实现了更精准的警情预报,民警从被动地围着案件转,转变为更有前瞻性地巡逻防控,系统上线以来,警情同比下降27.9%。
接下来第二部分重点探讨一下,利用运营商的数据能够在犯罪预防和案件侦破方面做什么样的应用。
国外的研究机构表示,使用移动数据并不是推测犯罪事件的唯一途径,但确实是大大提高了准确率。这意味着,如果你有不良的上网习惯,你有异常的活动行为,相关部门将会“密切留意”你。
在英国,研究人员建立了一套算法,搜集英国各大移动通讯公司的数据。通过这套算法,一张伦敦地区的犯罪事件预测地图已经被成功绘制。
用人口统计和移动数据与犯罪数据进行了比对,成功预测伦敦可能发生犯罪事件的地点,准确度高达70%。
运营商的数据具有“时空人物迹”的属性,对某些案件的预防以及侦查办案有着重要的意义。
我们通过一组数据看看运营商的数据能够对那些案件进行预防预测:
这组数据来自互联网,是某省公安的警情通报数据,这里面有两个关键词:多发性侵财案件、系列案件。解释一下:多发性侵财型案件,是指发案数量多、涉案面广,发案频率高,与人民群众利益密切相关的盗窃、抢劫等刑事犯罪案件,这类案件能够占所有刑事案件的90%以上。系列案件,通常是指由同一犯罪主体在一定地域、一段时间内连续实施某种犯罪行为而形成的案件。
我们今天讨论的案件预防,主要就是侵财类案件的预防。这类案件大部分都是系列案件,也就是说犯罪嫌疑人在实施完第一次犯罪行为后,会有后续的连续犯罪行为,而我们要预防的,就是后续的连续犯罪行为。
一方面,我们利用历史的案件数据,分析某类案件的特征,包括犯罪分子的特征,作案手段的特征、选择作案对象的特征等等。
同时,结合运营商数据,进行犯罪嫌疑人特征画像、行为画像以及关系圈分析,如:案发前出现在此区域的新号码、发生关机事件的号码,符合犯罪分子特征的号码(某高危地区、某年龄段、职业特征等),这里面采用一些算法将快递、送餐以及亲戚朋友等不确定的对象进行排除。最终会形成一个嫌疑人号码清单,这个清单涉及到运营商的用户隐私数据,不能直接提供,但是可以绘制这部分号码的位置热点,不涉及个体的轨迹,结合具体案件类型的选择处所特征,根据算法(常微分和正态分布)发现案件规律及影响范围,从而对案件再次发生的可能性、时间、地点进行预判。
刚才讲的是对于侵财类案件的预测和预防。对于个案的辅助侦破,运营商的数据又能做哪些事情呢。公安案件侦破传统的手段是先进行现场勘查、调取视频录像、问询目击证人等等,当这些传统的手段掌握不到更多的线索的时候,案件侦破就陷入泥潭,尤其是一些新型犯罪案件,如网络诈骗等,公安机关往往只能掌握有限的信息,如一个QQ号、或者微信号。将运营商的数据和公安的数据进行融合,首先在嫌疑人的排查方面能够提高效率,其次确定目标对象后,通过其网络行为,信令轨迹能够快速的定位嫌疑人位置、分析其关系网络,在事后,还能利用运营商数据进行案件的串并以及存取留证等工作。
分享几个利用大数据进行案件侦破的具体案例以及设想,结合一些实际的场景,我们看看到底在案件的预防和案件侦破方面会怎么做。
2013年波士顿马拉松爆炸案是一个典型的利用大数据以及众筹进行案件侦破的案例,警方收集各种案发现场的信息,包括视频监控、目击人员的询问记录、以及Twitter和Facebook开放的案件专栏向网民收集的各类信息。短时间内收集到约10TB的信息,通过视频识别、可视化分析等技术建立嫌疑人的关系网络及活动轨迹,最后利用军方的手段对嫌疑人进行精准定位,实施抓捕。
另一个是昆明火车站爆炸案,假设我们引入运营商数据后,对预防此类事件的思考:
通过事后分析,暴恐分子已在云南滞留多日,并且曾到昆明、红河火车站进行过踩点。如果能够重点场所、重点对象进行事先的监控,将运营商数据和公安数据进行融合分析,一定程度上,能够做到对此类事件的预防。
第三个是长春盗车杀婴案
案件发生后,东三省警务动用了上千警力进行全城搜索,最后是嫌疑人主动自首。如果利用运营商数据,首先通过案件地点的手机号码、结合公安重点人员数据进行排查,能够快速确定重点嫌疑人(此人有犯罪前科),同时结合人员轨迹和车辆轨迹进行交叉匹配、伴随分析,能够让公安部门有针对性的调取视频监控,从而确定嫌疑对象,案件侦破的效率会大大提高。
利用运营商数据能够给公安工作带来很大的便利,预防案件发生,提高办案效率只是一部分。公安数据和其他行业的数据、互联网数据进行融合,会产生更大的化学反应,更加精准提高预判能力。
以上是我今天分享的内容,时间仓促,准备的不充分,有些想法不太成熟希望大家多多指教!谢谢。