第二节 大数据侦查的介说

在提出大数据侦查的概念之前,我们先通过一则实务案例去直观感受大数据在侦查中的作用。

犯罪嫌疑人苑某因盗窃罪被J省X县公安机关抓获。苑某长期在高速公路上选择货运车作为盗窃目标,采取夜间并车行驶的方法,利用驾驶员右后视镜盲区,盗取货车上的物品。公安机关共审理查明了嫌疑人2012年2月23~24日在J省X县境内的3起扒车盗窃事实。在公安机关侦查阶段,犯罪嫌疑人苑某做了6次供述,前后供述稳定,且与部分被害人供述、证人证言能够相互印证。但是在检察机关审查起诉阶段,犯罪嫌疑人却翻供,声称其遭受了警察的刑讯逼供,供述都是按照公安的指示交代的,并声称其从未去过J省X县(嫌疑人苑某是外地H省人),盗窃现场笔录及指认照片都在警察诱导下所作,自己根本不知道那地方。当时,侦查人员认定事实的主要依据就是犯罪嫌疑人的供述,以及部分证人证言、被害人陈述、现场勘验笔录,而案件中大部分赃物已经下落不明,作案车辆也尚未找到。因此,案件一时陷入了僵局。在补充侦查阶段,但侦查人员巧妙调取了嫌疑人在案发期间的手机基站数据,基站数据反映,案发时段的嫌疑人的7次通话地点都是案发地点J省X县。最终,检察机关认为嫌疑人侦查阶段供述稳定,且与证人证言、被害人陈述以及手机基站数据相印证,认定了嫌疑人的盗窃事实。

本案例是笔者与J省X县基层检察人员访谈时所获取的案例。案件承办人员表示,如果不是因为补查阶段所获取的手机基站数据,就无法印证嫌疑人供述的真实可靠性,从而也就无法定案了。其实,本案中的手机基站数据的运用就反映了“大数据”思维。基站数据本身是对嫌疑人时空位置的“数据化”,通过对手机基站数据查询也就间接地还原了嫌疑人当时的时空位置。据反映,实务中通过“大数据”来侦破的类似案例也越来越多,在此大趋势下,本书提出“大数据侦查”的概念。

一、大数据侦查概念的提出

(一)传统“侦查”的概念

在提出大数据侦查概念之前,我们需要先厘清传统“侦查”的含义。早在20世纪七八十年代,我国对“侦查”和“侦察”这一对概念尚还辨别不清,实务及理论界运用混乱。“侦察”与军事活动相关,不是严格的法律术语;而侦查则是专门的法律术语,更具有规范性。马海舰:《侦查措施新论》,1~2页,北京,法律出版社,2012。随着现代法治化的进程,“侦查”一词也逐渐取代了“侦察”,作为法定用语。

我国《刑事诉讼法》第106条第1款明确指出了“侦查”的主体和内容,大部分学者也是根据这一法律规定出发,来理解侦查的内涵。例如有学者认为侦查是国家法定机关在办理刑事案件过程中,为收集犯罪证据和查获犯罪人而依法进行的专门调查工行和有关强制性措施。陈永生:《侦查程序原理论》,21页,北京,中国人民公安大学出版社,2003。例如有学者认为侦查是警察机关和检察机关在办理刑事案件的过程中,为了收集证据,揭露犯罪,揭发犯罪人而依照法律规定所实施的调查性措施和强制措施。任惠华:《侦查学原理》,119页,北京,法律出版社,2002。总而言之,“传统”侦查概念具有以下内涵:第一,侦查的主体是法定的国家机关,以公安机关和检察机关为主;在一定情形下,国家安全机关、军队保卫部门、监狱等机关也享有一定的侦查权。第二,侦查启动的时间必须是在立案之后。在我国,立案是侦查的前置程序,唯有经过法定立案才能开启侦查程序。第三,侦查的内容包括调查取证措施和强制性措施。第四,侦查作为一项诉讼活动,往往涉及对公民权利的剥夺,因此必须依照法定程序进行。何家弘:《新编犯罪侦查学》,60~61页,北京,中国法制出版社,2007。

尽管传统侦查的概念已经基本形成通说,但笔者认为,上述的观点仍具有一定的局限性。例如就侦查的内容而言,除了法律明文规定的侦查措施外,实务中还经常运用到法未明文规定的侦查措施,如围追堵截、跟踪守候、外线侦查、特情侦查,等等。所有揭露、证实犯罪,抓捕嫌疑人,收集犯罪证据的方法均应视为侦查措施。马海舰:《侦查措施新论》,14页,北京,法律出版社,2012。就侦查时间而言,通说认为侦查必须在立案之后才能启动,但这往往与实践中的做法相悖。立案需要建立在“发现犯罪事实或者犯罪嫌疑人”的基础上,然而不经过一定的调查措施则无法确定犯罪事实及犯罪嫌疑人。因此实务中存在着“初查”及“立线侦查”的做法,这就与法定的侦查时间形成了悖论。不少学者也开始对侦查的启动时间提出质疑,建议将侦查启动时间提前至立案之前。孙展明:《论我国侦查启动模式的重构》,载《中南林业科技大学学报》(社会科学版),2011(2)。有学者指出,“侦查”的概念本身就具有多样性和开放性,可以被理解为一个过程、一套程序、一种权力等,正是概念界定的多元化和开放性,才有利于我们推进与侦查相关范畴的研究。郭冰:《侦查学基础理论研究》,59~60页,北京,中国人民公安大学出版社,2010。本文也立足于开放性的侦查概念,并在此基础上去建立大数据侦查的内涵。

(二)“大数据侦查”的概念

本书所谓的“大数据侦查”并不是个标准的法律概念,学理界也并未有约定俗成的界定。虽然近两年大数据在侦查领域的运用也已经有了不少研究成果,但是目前大数据侦查的研究仍在感性层面摸索前进,在理论和实践层面都尚未形成成熟的体系。大部分学者多是将大数据作为侦查背景,或者将其作为新的侦查技术来展开研究。本书在传统侦查概念及现有研究的基础上,从广义和狭义两个角度去理解“大数据侦查”的概念。

从广义角度来看,“大数据侦查”包括大数据侦查思维、大数据侦查模式、大数据侦查方法、大数据侦查机制等完整的体系。本书也拟以大数据作为主线,串联起整个大数据侦查的框架,探讨大数据技术对侦查模式、侦查方法、侦查思维、侦查制度等方面带来的一系列影响与变革,构成一幅完整的“大数据侦查”图景。

从狭义角度来看,大数据侦查则着重强调侦查中对大数据技术的运用。可以将其界定如下:“大数据侦查”是指法定侦查机关针对已发生或尚未发生的犯罪行为,为了查明犯罪事实、预测犯罪等,所采取的一切以大数据技术为核心的相关侦查行为。相比于传统侦查的概念,“大数据侦查”需要注意以下几点。

第一,大数据侦查的外延要宽于传统侦查。传统的侦查概念中将侦查对象限定为已经确定立案的刑事案件,没有立案的不能对其实施侦查。但本书拟构建一种广义上的侦查理念,将侦查的时间外延向前延伸,将“预测型侦查”纳入其中。具体来说,大数据侦查的对象可以分为两类,一类与传统侦查的对象一致,是已经发生的、确已立案的犯罪活动;另一类则是尚未发生或者即将发生的犯罪活动,以及虽已经发生但未被察觉、未被立案的犯罪活动。概言之,已经发生的犯罪行为和尚未发生的犯罪行为,都是大数据侦查的对象。本书之所以将大数据侦查的时间轴向前延伸,是基于以下几点考量:①传统的立案侦查本就不具有合理性。我国刑事诉讼法规定侦查程序只能在立案之后才能启动,而立案必须达到“发现犯罪事实或嫌疑人”的要求。但是,很多时候为了发现犯罪事实或嫌疑人又必须采取一定的侦查活动,如此一来,便与法定的立案侦查形成了矛盾,实务中也不乏初查和立线侦查的做法。况且,破案讲究时效性,很多时候待到立案之后再实施侦查活动,往往就延误了最佳破案时机。鉴于此,越来越多的学者呼吁将启动侦查程序的时间提前。孙展明:《论我国侦查启动模式的重构》,载《中南林业科技大学学报》(社会科学版),2011(2)。②大数据为犯罪预测提供了技术方法支持。大数据最核心的价值就在于预测,其能够通过回归分析、聚类分析等数据挖掘技术来发现事物之间的关系及发展规律,将之用于未来时空便能在一定程度上实现对特定领域的预测。对于犯罪活动同样如此,大数据技术方法能够实现对犯罪地点、犯罪类型、犯罪嫌疑人等信息的预测,在一些犯罪活动尚未发生时就能够及时将其识别。犯罪预测并非新事物,但是过去的犯罪预测主要是基于人们的主观经验和简单的数据统计。而大数据在预测方面的巨大功能则大大提高了犯罪预测的准确性,越来越多的侦查部门开始将大数据技术吸收至对未来犯罪活动的预测中去。③有利于保障国家和公民的利益,维护社会稳定。犯罪是小部分犯罪分子对国家和公民利益造成了侵害。对于普通公民而言,将侦查时间提前,尤其是在犯罪活动尚未发生、扩大之时就及时将其预测并遏制,有利于防患于未然,保障国家和公民的利益免受侵害,保障社会秩序的稳定。即便是对于犯罪分子本身而言,在犯罪活动开始之前所接受的惩戒、教育也远比在犯罪活动完成后所面临的惩罚小得多。④有利于合理分配侦查资源,提高侦查效率。在立案之后采取侦查措施,侦查人员往往处于被动地位,侦查行为容易被犯罪嫌疑人所牵制,局势被犯罪嫌疑人所主导,从而导致侦查成本增加,侦查效益降低。而在大数据侦查中,侦查时间的提前使得侦查人员处于主动地位,能够从整体上把控局势,有的放矢地投放侦查资源;对犯罪活动的预测防范,更是避免了侦查资源的无谓投入,提高了侦查效益。⑤大数据预测型侦查已然成为时代发展趋势。目前,很多侦查实务部门都开始利用大数据、人工智能等技术,提前预知犯罪活动的发生,并据此展开警力部署,在犯罪活动发生前就将其制止。例如美国警方利用PredPol、COMPASTAT等软件去预测热点犯罪区域,我国北京怀柔警方也有着类似的做法。随着未来大数据技术的发展,侦查人员对于犯罪时间、地点、类型及犯罪人群的预测将会越来越准确,大数据预测型侦查的发展必将是大势所趋。总而言之,大数据侦查将侦查活动的外延向前延伸,从已经立案的案件拓展到尚未发生,或已发生但未被发现的案件,从而将一些犯罪苗头、犯罪准备活动等相关问题也都纳入其中。吕雪梅:《美国预测警务中基于大数据的犯罪情报分析》,载《情报杂志》,2015(12)。

第二,大数据侦查的目的比传统侦查更全面。大数据侦查的目的是查明犯罪事实及预防犯罪活动的发生。在传统的侦查概念中,侦查目的一般包括查明案情、收集证据、抓获嫌疑人等,总体而言还是以查明犯罪为主。而大数据侦查的目的除了查明犯罪外,还包括预防犯罪。在当今大数据时代,预测、预防犯罪都已经具有了技术条件上的可能性,如果还将侦查的目的局限于对犯罪活动事后的侦查,那么根本无法应对当今时代瞬息万变的犯罪活动。另外,将大数据侦查的目的归纳为查明犯罪事实及预防犯罪,也与大数据侦查的对象相对应。最后,从侦查的上位概念——刑事诉讼程序出发,其目的不仅仅是查明犯罪事实、打击犯罪,更重要的在于保护公民的人身、财产等权利。预防犯罪更有利于从源头上保护公民的权利,将其作为侦查的目的具有实质上合理性。这里所说的预防犯罪,仅仅是从目的角度去阐述大数据侦查的概念,并不是本书讨论的重点。概言之,犯罪预测属于大数据侦查的范畴,而犯罪预防虽然是犯罪预测的后续行为,但并非属于本书所讨论的大数据侦查范畴,其更多地属于犯罪学领域。

第三,大数据侦查的技术性比传统侦查更强。传统侦查中所采取的措施主要依靠人力、脑力劳动或者辅之以简单工具的帮助,而大数据侦查则离不开数据科学、人工智能等专业技术的帮助。例如传统侦查中,侦查人员往往采用蹲点守候的方式来确定嫌疑人等相关人员的落脚点,需要耗费大量的精力和时间;如果采用大数据侦查技术,则可以根据嫌疑人的常用网购地址数据或者手机基站位置等数据来确定其落脚点。

图2-3 大数据侦查概念

二、大数据侦查的特征

(一)侦查空间的数据化

有学者曾经提出多网络时代“双层社会”的理论,意指网络空间和现实空间的渗透融合。于志刚、郭旨龙:《信息时代犯罪定量标准的体系化构建》,28~29页,北京,中国法制出版社,2013。大数据时代的到来,又赋予了“双层社会”新的内涵。互联网就像是一个光源,数据相当于阴影,有光源的地方就会有阴影,几乎人类所有的想法和行为都被数据记录下来,并且一旦记录下来就不会消除。从而形成一个与现实空间相对应的、相平行的虚拟数据空间,我们每个人都可以在数据空间找到与自己相对应的“数据人”。王宁:《知道吗?我们原来生活在“数字阴影”和“平行宇宙”中》(非出版物),北京,2016年新经济智库大会的发言内容。大数据侦查则正是在这样的一个平行数据空间中展开的,侦查人员根据现实空间的人和事物去找到其对应的数据形式,再从数据空间返回到现实空间。通过现实空间与数据空间的交叉,通过数字阴影之间的碰撞,很多与犯罪行为相关的线索、信息就显现出来了。所以说,大数据侦查的环境是与现实空间相平行的数据空间。

(二)侦查技术的智能化

面对海量的数据集,仅靠侦查人员的人工分析是完全不可能的,必须运用专业的大数据技术。大数据涉及计算机、数据科学、人工智能等多个学科,需要运用到不同的专业技术。如在数据采集环节,需要运用传感技术、日志文件、网络爬虫等技术;李学龙,龚海刚:《大数据系统综述》,载《中国科学:信息科学》,2015(1)。在数据清洗环节,需要运用专门的软件,来修正不完整、不正确的数据,保障数据源的质量;在数据分析环节,则需要运用数据挖掘技术,包括关联性分析、分类分析、偏差检测等。由此可见,大数据侦查的每一个阶段都需要运用到专业化、智能化的大数据相关技术。这些智能化技术的运用,不仅提高了侦查工作的准确性,加快案件侦破的进度;同时也大大解放了传统侦查中的人力劳动、人海战术,推动了侦查领域生产力的解放。

(三)侦查思维的相关性

侦查活动实际上就是一个重构犯罪的过程,侦查人员根据犯罪行为所留下的痕迹、线索及证据,逐渐回溯性地去还原犯罪事实的过程。其中,犯罪行为是“因”,犯罪现场所遗留的线索、证据是“果”,侦查活动就是由果及因、以果溯因的过程,是一个不断假设、验证、再假设、再验证的过程,遵循人类一直以来的因果关系思考模式。如侦查人员在现场发现一枚指印,猜测其是犯罪分子所留,并通过指纹鉴定、比对技术,发现果然与公安机关数据库中的犯罪分子指纹相吻合,这便是一个由假设到验证的因果思维过程。

而大数据最典型的思维特征是“相关性”,将事物、行为转化为数据,通过数据运算来发现各要素之间有无相关性。大数据只发掘事物之间有无相关性,而不去探寻它们之间为什么有关系,即“知其然而不知其所以然”。这种方式耗时少、成本小,相比于人类的主观分析,数据得出的结果也更具有客观性和说服力。大数据的相关性思维同样会对侦查活动产生影响,侦查人员通过对虚拟空间的数据进行碰撞、挖掘,会发现大量数据间的相关关系,从而为侦查提供线索。但是,机器的数理逻辑与人类的主观经验逻辑毕竟不同,有些数据相关性能够进行因果解释,而有些数据的相关性则无法找到因果解释。因此,侦查人员还需要运用传统侦查经验,对大数据所提供的“数据线索”进一步分析和验证。不过无论如何,大数据的相关性思维都为侦查活动打开了新的思维视角。

三、大数据侦查与技术侦查、侦查技术

在侦查学中,侦查技术和技术侦查是一对容易混淆的概念。在大数据技术进入侦查领域后,有人认为其是一种侦查技术,也有人认为是技术侦查。那么大数据侦查究竟属于侦查技术还是技术侦查呢,大数据侦查与这两者之间又有怎样的关系呢?

(一)大数据侦查与技术侦查

技术侦查是指侦查机关针对某些类型的犯罪,在秘密的情况下所采取的具有一定科学性、技术性的侦查措施。张慧明:《技术侦查相关概念辨析》,载《中国刑警学院学报》,2012(4)。2012年《刑事诉讼法》修改时正式赋予了技术侦查的法定地位,《刑事诉讼法》第二章第八节专门规定了技术侦查措施的相关规定。技术侦查具有以下特征:一是技术性,技术侦查需要借助一定的科学技术手段,如电子监听、监控等,不包括传统利用人力的跟踪、监视等措施;二是秘密性,技术侦查强调秘密性,不能让犯罪嫌疑人有所察觉;三是技术侦查针对的是尚未实施或正在实施的行为,只有尚未完成的违法犯罪行为才具有实施技术侦查的必要;四是技术侦查一般会对公民的隐私权、通讯自由等权利造成侵害。廖斌,张中:《技术侦查规范化研究》,3~5页,北京,法律出版社,2015。

大数据侦查与技术侦查在运用范围、程序规定、技术内容等方面都有所不同。首先,二者的运用范围不同。根据刑事诉讼法的相关规定,技术侦查只能运用于危害国家安全犯罪、恐怖活动犯罪等几类法定的犯罪活动中;而大数据侦查的运用则没有案件种类的要求。其次,二者的程序规定不同。技术侦查由于涉及公民的重要权利,需要履行严格的审批程序;而大数据侦查一般程序要求没有技术侦查严格。最后,二者的技术内容也不同。技术侦查一般是指电话监听、网络监控、密拍、技术定位等技术;而大数据侦查则重点强调数据分析处理技术。

然而,大数据侦查与技术侦查也有交叉之处。技术侦查中可能会运用到大数据侦查方法,大数据时代完全可以将一些大数据技术吸收至传统的技术侦查措施中去;部分大数据侦查也可能会涉及技术侦查程序。不过,大数据侦查本身是中立的,被纳入技术侦查范畴的大数据侦查措施并非由于其技术特征,主要还是缘于其使用方式和使用情境。尤其是针对尚未发生的或即将发生的犯罪行为,需要采取秘密的“大数据监控”方式去获取嫌疑人相关数据的情境。例如在一些恐怖活动犯罪、毒品犯罪中,为了不打草惊蛇、全面掌握犯罪事实,侦查人员会对嫌疑人的银行账户数据、话单数据、社交网站数据、即时通讯数据等进行秘密监控,并通过关联关系、异常分析等数据挖掘技术来寻找数据背后的规律,从而及时发现相关犯罪线索。对于技术侦查情境下的大数据侦查,应当根据《刑事诉讼法》第148~150条的规定来进行规制。

图2-4 技术侦查与大数据侦查

(二)大数据侦查与侦查技术

侦查技术并不是个法定的术语,在学理界,侦查技术强调侦查机关在刑事侦查中对科学技术的运用,既包括传统的物理取证、检验等技术,也包括随着信息化发展而产生的电子取证技术、信息化取证等。张慧明:《技术侦查相关概念辨析》,载《中国刑警学院学报》,2012(4)。“侦查技术”还有广义和狭义之分。从狭义上来说,侦查技术不包括具有秘密性的技术侦查措施,而是特指公开的侦查技术手段,如电子取证技术、视频技术、测谎技术等;从广义上讲,侦查中凡是采取科学技术、方法、知识的措施都属于侦查技术范畴,包括上文提到的“技术侦查”措施,本书语境中即选取广义的侦查技术概念。

大数据侦查与侦查技术是从属关系,大数据侦查属于侦查技术范畴。大数据侦查中最核心的部分就是大数据技术的运用,无论是数据的收集、存储还是数据分析、数据呈现都离不开专业的大数据技术。大数据技术依托于现代的网络通讯技术、传感技术、数据库技术、数据挖掘技术、人工智能等一系列复杂的科学技术体系。常见的大数据侦查方法有数据搜索、数据碰撞、数据挖掘、犯罪网络关系分析、数据画像等,它们都属于侦查技术的范畴。相比于传统的勘验技术、鉴定技术等,大数据侦查技术毫不逊色。因而从广义上来说,大数据侦查属于侦查技术范畴。

图2-5 侦查技术与大数据侦查

四、大数据侦查与信息化侦查、情报导侦

随着大数据技术在侦查中的运用,不少学者也提出大数据侦查与我们常说的的情报导侦、信息化侦查之间是怎样关系的疑问。在本书语境下,笔者认为大数据侦查与情报导侦、信息化侦查是不同的概念,但是它们之间又有着密不可分的联系。

(一)大数据侦查与情报导侦

情报就是人与人之间信息的传递,是伴随着人类社会产生和发展的一种古老现象。随着人类传播媒介的发展,情报逐渐从肢体动作、语言、书面文字发展到现代的网络和无线通信等传递方式。顾名思义,情报导侦就是强调人类的“情报思维”在侦查中的运用。自从新中国成立之后,我国情报导侦工作就开始起步、发展,情报导侦是指侦查机关对侦查中的各种证据、资料、线索等情报的获取,并对其进行分析研判,从而为刑事侦查、犯罪预防等工作提供指导和方向。随着信息技术的发展,情报导侦也逐渐从有形的、物理空间的情报,如人身痕迹特征、痕迹物证、作案工具等信息,发展到无形的、虚拟空间的情报,如各种数据库信息、电子数据信息等。情报导侦的外延包括与侦查工作有关的各种信息,内涵主要强调对情报信息的分析、研判,将情报信息转化为有用的知识。彭之辉:《关于公安情报概念的理解》,载《公安学刊》,2007(1)。随着情报导侦工作的开展,情报不仅仅局限于对个案的侦破,还可以通过对不同时期犯罪情报的汇总、分析,总结归纳犯罪规律和特点,为未来犯罪活动的预测提供信息。任惠华主编:《侦查学演讲录》,265、292页,北京,法律出版社,2010。

情报导侦与大数据侦查既有区别又有联系。就区别而言,首先,二者的侧重点不同。情报导侦的核心在于对情报信息的分析、研判;而大数据侦查不仅强调对数据的分析,同时更强调数据分析的技术、方法与思维。其次,二者的载体不同。情报导侦的载体是情报资料,其具体以何种方式所呈现则没有要求;而大数据侦查的载体则是可供分析计算的数据。最后,二者的分析方法不同。情报导侦既可以是人为的主观经验分析,也可以是计算机等机器进行的分析;而大数据侦查则主要运用计算机来进行分析处理。不过,情报导侦和大数据侦查也有相联系之处。二者都强调对初始情报资料、原始数据的加工分析,强调通过寻找规律来对未来犯罪进行预测。

人类每一次的技术革命都为情报导侦注入了新的发展动力,在当前大数据的革命浪潮下,大数据技术、大数据思维方式不可避免地对传统的情报导侦产生影响,情报导侦在内容、传递和分析方式上将朝着纵深方向进一步发展。

(二)大数据侦查与信息化侦查

“信息化”一词起源于20世纪60年代的日本。自八九十年代开始,我国各个领域开始受到信息化技术的冲击,侦查领域自然也不例外。信息化侦查就是随着信息化技术的发展而出现的侦查模式。从公安部第一代“金盾工程”的建设开始,我国的侦查领域便开启了信息化的历程。信息化侦查以“信息”(information)作为主要内容,依托计算机技术、网络技术,收集和挖掘虚拟空间的各种信息,用于案件侦破工作。相比于传统的人证、物证等物理空间的侦查方式而言,信息化侦查主要强调信息化技术对于侦查工作方式带来的影响和变革。陈刚:《信息化侦查教程》,2、13页,北京,中国人民公安大学出版社,2012。

那么,大数据侦查与信息化侦查之间的关系是怎样的呢?从名称上看,二者是不同的概念;但也有怀疑论者认为大数据侦查与信息化侦查只是名称的不同而已,并没有实质的差异;还有学者认为信息化侦查由业务信息主导的侦查模式和大数据驱动的侦查模式组成,大数据侦查是信息化侦查的组成部分。何军:《大数据与侦查模式变革研究》,载《中国人民公安大学学报》(社会科学版),2015(1)。笔者认为,大数据侦查是信息化侦查的组成部分,是信息化侦查在当今时代的体现。信息化侦查本质上就是强调信息技术对于侦查工作的影响,而大数据恰恰是信息化技术在当前发展的体现,因而大数据侦查也是时代背景下信息化侦查的必然发展阶段。

不过,就以往信息化侦查而言,大数据侦查在侧重点、技术特征方面也与其有所不同。信息化侦查的侧重点在于强调侦查工作中对于信息技术的运用;而大数据侦查中除了运用专业技术外,还强调其特有的大数据思维,以及大数据侦查的模式。信息化侦查中所涉及的技术主要包括计算机、信息网络、通讯等;而大数据侦查中还涉及数据处理、人工智能、神经网络等新的技术。笔者认为,从本质上来说,情报导侦的核心在于对情报的分析研判,分析结果才是有价值的情报;信息化侦查的核心在于信息技术的运用,并没有过多强调对信息进行加工研判;而大数据侦查不仅强调对数据的分析处理,也强调数据分析结果以及大数据特有思维的运用。这三者之间侧重点的不同是它们进行比较的基础。

(三)大数据侦查的传承与发展

大数据侦查并非一蹴而就的新事物,也不是与情报导侦、信息化侦查完全相对的概念,而是随着大数据技术的出现,在已有的情报导侦、信息化侦查基础上发展而来,是对传统情报导侦、信息化侦查的传承和发展。“传承”强调信息化侦查、情报导侦已有的建树为大数据侦查所提供的基础,“发展”强调大数据侦查对信息化侦查、情报导侦的推进作用。

大数据侦查对传统情报导侦、信息化侦查的传承主要体现在以下两个方面。(1)多年来的信息化侦查建设为大数据侦查提供了丰富的数据源。公安机关基于其治安管理及打击犯罪等职务需求,对一些社会基本数据以及与公安业务有关的数据进行收集、整理,并逐步建立了不同主题的数据库。例如2003年我国公安启动了“金盾工程”任务,建立公安机关的通信工程和网络工程,建成了全国范围的八大基础信息库;在此基础上,金盾工程第二、第三期又继续深入开展,致力于数据库之间的共享以及数据综合应用平台等建设工作。检察机关的信息化建设也开始蓬勃发展,已经有不少检察机关的职务犯罪侦查部门开始组建数据库,例如某市检察系统建立有“情报信息平台”,包括人大代表信息、政协委员信息、律师信息、婚姻信息、殡葬火化信息、工商登记信息、基本生活救助信息、企业纳税信息、个人所得税信息、房屋登记信息、住房公积金信息、出租房屋信息、通讯信息、手机信息,等等。这些随着信息化侦查发展而建立起来的数据库,为大数据侦查提供了基础的数据资源。(2)情报导侦的分析研判思维为大数据侦查奠定了思维模式基础。情报导侦的核心就在于对已收集到的情报信息进行分析、研判,找到零散犯罪情报背后的规律、特点,将研判分析后的“情报成果”用于辅助侦查工作。这一思维模式与大数据侦查的思维不谋而合。大数据侦查通过数据挖掘、数据二次分析来获取有关侦查信息,强调通过历史犯罪数据的分析来提炼犯罪规律、犯罪特征,并对未来犯罪进行预测。大数据侦查思维与情报导侦思维极具相似性,大数据侦查思维的运用离不开传统情报导侦长期以来所总结的分析研判原理、方法和经验。

大数据侦查对传统情报导侦、信息化侦查的发展主要体现在以下两个方面。(1)侦查载体、侦查媒介的突破。无论是情报导侦、信息化侦查还是大数据侦查,都需要某种载体、媒介去传递信息,侦查人员根据所传递的信息去还原犯罪事实。在情报导侦的发展过程中,侦查媒介逐渐从有形的物证、书证发展到无形的虚拟空间的情报;信息化侦查的媒介是以电子形态所呈现的电子信息。大数据侦查则是将“数据”作为侦查媒介来传递信息。“数据”作为一种全新的载体和媒介,比传统的情报、信息的粒度更加细化。尽管数据多半是以电子化、虚拟化形式所存在,但大数据侦查所关注的重点并不在于数据的形式,而是强调数据所拥有的独立内涵。正如量子的发现带来了物理学上的革命,“数据”也带来了侦查领域的革命,侦查信息的发现、收集、存储和分析都能以数据为媒介来进行。(2)侦查信息分析方法的突破。无论是情报导侦、信息化侦查还是大数据侦查,对于所获取的第一手线索、信息都需要经过一定的分析、判断。传统信息化侦查中更为强调对电子信息的获取,而信息的分析、研判则不作为重点,一般辅之以简单的信息查询、检索方法。在情报导侦中,尽管情报的分析、研判是重点工作,但是由于过去情报分析技术的不发达,很多时候都需要靠侦查人员的主观经验分析判断,不仅耗费劳动力,对于一些深度隐藏的犯罪规律,如犯罪分子的作案手段特征、习性规律、作案时间地点等特征根本难以发现。大数据侦查对于信息的分析、研判水平则有了新的突破。大数据强调盘活沉睡的数据资源,打破各个部门之间的信息孤岛,通过海量数据之间的串并、碰撞来发现线索和证据;更重要的是,大数据侦查能够对数据进行二次利用和深度分析,通过数据挖掘技术对海量的犯罪数据进行分析,发现犯罪现象背后的行为规律、特征等深层次信息。

五、大数据在侦查中的运用形式

目前在侦查实务中,大数据侦查中的数据分析结果究竟是以怎样的形式所呈现、运用的呢?据侦查实务人员反映,目前他们主要将大数据分析结果作为线索来使用。但笔者认为,除了用作线索外,大数据在将来有可能会成为一种新的证据形式。

(一)大数据侦查之线索运用形式

线索是侦查中用于查明案件事实、收集证据不可或缺的媒介,对线索的正确运用能够有效推进案件的侦破进程。薛怀祖:《浅议侦查线索的显现与价值体现》,载《铁道警官高等专科学校学报》,2003(4)。在案件的侦查过程中,会出现大量线索,有些线索是真实的,有些线索是虚假的;有些线索与案件联系紧密直观,而有些线索与案件的联系具有间接性。查明案件事实的过程,就是不断地通过线索去查找新的线索、证据,通过对大量线索的梳理逐渐还原案件事实,不断地缩小案件侦查范围。邹荣合:《论侦查线索的分类》,载《公安学刊》,2000(2)。

一般来说,线索没有严格的形式要求,运用程序灵活方便。在大数据侦查尚未成熟时期,将大数据分析结果作为线索使用,是较为稳妥的选择。据实务人员反映,目前大数据在侦查中最主要的形式就是作为线索使用。在传统的犯罪侦查中,线索带有小数据时代的印记,往往局限于物理空间的物品、痕迹以及人类的印象、言词等。随着人类科学技术的发展,线索的范围和形式也在不断扩张。大数据时代,传统物理空间的线索在数据空间往往有着对应的形式,数据空间甚至能够提供更多物理空间无法显现的线索。具体而言,大数据侦查结果作为线索运用主要体现在以下两个方面。

一是“从案件到线索”。在案件发生之后,通过大数据方法去搜集与案件有关的线索。由于仅仅是作为线索使用,所以对于大数据方法的运用及数据本身的形态并没有严格的法律规定。可以运用大数据方法找到与案件或嫌疑人之间直接相关的线索,例如知道嫌疑人的身份后,可以在基本人口数据库、在逃人员数据库、前科人员数据库中搜集与他直接相关的信息。另外,还可以通过数据挖掘技术,挖掘出与案件相关的线索,例如有关嫌疑人性格特征、行为偏好、人际关系等方面的信息。尽管有些数据与案或人之间的关系并非那么紧密,但是能够为案件侦破提供丰富的线索。

二是“从线索到案件”。在不知道是否有案件发生的时候,侦查人员能够通过大数据识别、预测技术来直接发现某种犯罪活动的线索。“从线索到案件”这一方式尤其在证券欺诈犯罪、恐怖活动犯罪、贪污贿赂犯罪等隐蔽性较强的犯罪活动中具有广阔运用空间,例如侦查人员可以运用大数据技术来抓取信用卡欺诈犯罪的线索——分析海量用户的历史交易数据,通过孤立点和相异度计算所得出的异类数据很有可能就是犯罪活动的信号;再如某市检察院其利用大数据算法将涉税犯罪的规律转化成数据规则,并将其投放于海量的各单位税票数据中,从而发现涉税案件的线索。

(二)大数据侦查之证据运用形式

人类的科学技术革命总会推动证据形式的发展。证据作为案件信息的载体,无不与人类历史上的媒介变革息息相关:语言对应着言词类证据,文字和印刷术对应着书面证据,电话、广播等电磁波媒介则对应着视听类证据,而近些年的计算机、互联网媒介则催生了电子数据证据的发展。每一次媒介革命总会产生新的证据形式,证据形式的扩展也推动了人类司法证明水平的发展,越来越多的信息得以被记录、存储、传播及解读。那么,大数据所带来的媒介变革,是否也会再次推动证据形式的发展,产生“大数据证据”这一新的证据形式呢?严格来说,大数据侦查中的数据分析结果有两种形式:一种方式是通过大数据技术去寻找相关数据,大数据并没有对原本的数据形态进行改变,对于这类数据的运用可以参照传统的电子数据形式;另一种方式是通过大数据技术对原本数据进行分析,产生了新的数据,对于这类新的数据能否作为证据运用,目前尚不明朗。本节的讨论对象主要是针对后者。关于这两种大数据分析结果的形式,后面章节还会进行详细分析。

目前在刑事犯罪侦查实务中,“大数据”主要是作为犯罪线索来使用,将大数据分析结果直接作为证据使用的案例尚不多见。但这并不表示大数据没有证据价值。有学者认为,随着大数据在工作生活中的广泛运用,它确有在诉讼中成为证据、发挥证明效力的可能性。Joe Sremack,“Big Data Forensics-Learning Hadoop Investigations”,Packet Publishing Lted,p1.笔者认为,大数据在刑事诉讼中具有成为新证据形式的可能性,理由有以下两个方面。

第一,部分“大数据线索”有可能转化为“大数据证据”。尽管从字面上看,线索和证据是两个不同的概念——线索是针对侦查阶段而言,而证据则在侦查、审查起诉和审判三个阶段都会涉及;线索没有固定的形式要求,也没有收集程序上的严格规定,一般而言只要能够推进侦查工作的信息都是线索,而证据则需要符合法定的形式和性质,并且按照法定的程序去收集。但实际上,线索与证据之间并没有严格的界限。对于证明犯罪事实具有重要作用、并经查证属实的线索可以作为定案的证据,这类线索也被称为“证据性线索”。邹荣合:《论侦查线索的分类》,载《公安学刊》,2000(2)。上文提到目前大数据侦查结果主要是作为线索使用,当这些“大数据线索”能够证明案件事实,符合证据属性要求,经法定程序获取,即有可能成为定案的证据。

第二,在民事诉讼和行政诉讼中,都已经出现了将“大数据”作为定案证据的案例。在“上海唯觉广告有限公司与被告上海盛久网络科技发展有限公司服务合同纠纷案”中,被告将“百度指数”作为证明己方主张的证据。“百度指数”是大数据的典型代表,它在证明事物的网络关注度、发展趋势方面有一定的说服力。本案中法院认为“由于被告提供的证据系从‘百度’互联网中直接统计得出,且经过公证机关公证,被告的证据优势明显”。案件字号:(2014)沪二中民五(知)终字第67号。在唐某某与中国证监会行政诉讼一案中,法院也是根据大数据分析结果来认定唐某某存在操纵股票价格的行为。大数据分析结果显示,在唐某某涉案的19个账户之间,MAC地址、IP地址具有高度重合率,19个账户中所交易的股票品种也存在着高度的一致性。案件字号:北京市第一中级人民法院行政判决书,(2013)京一中行初字第1171号。不过,刑事诉讼中的证明标准以及证明程序相较于民事诉讼、行政诉讼要更为严格,在没有相关法律规定和司法判例指导的前提下,如何将大数据的特性与既有的证据属性要求、证据规则进行衔接,也是亟待解决的问题。笔者认为,随着大数据技术在刑事侦查中的普及,大数据在将来能够直接作为刑事定案的证据。