近年来,全国检察机关以数字化改革赋能新时代法律监督,运用检察大数据思维,推动法律监督模式的重塑性变革,从“数量驱动、个案为主、案卷审查”的个案办理式监督向“质效导向、类案为主、数据赋能”的类案治理式监督转变,探索出一条大数据法律监督新路径。
畅通数据来源是大数据法律监督的根本。经过实践探索,大数据法律监督的核心内容是通过对办理个案的系统总结,归纳类型化要素,对政法、政务、社会等所涉数据进行采集梳理,经过数据碰撞和分析,得出具有高度盖然性的监督线索,经查实后开展法律监督,并由此发现执法司法及社会经济领域中的突出问题,进而推动社会治理。这一“个案办理—类案监督—系统治理”路径面临的首要难点即为“数据从何而来”,而这正是大数据法律监督有别于传统法律监督之处,也是实现法律监督模式重塑性变革的关键之举。
加强数据管理、提升数据质量是大数据法律监督的关键。大数据法律监督中的“数据难题”主要体现在三个方面:
一是数据获取渠道有限。一方面,数据来源匮乏,共享渠道不畅通。对此,检察机关目前通过建立侦查信息查询机制、与执法司法领域建立数据共享目录等途径减少信息壁垒,但是大量政务数据、社会数据共享仍较为有限。另一方面,自有资源未被充分利用。大量检察数据散落在不同的“信息孤岛”上,呈现分散化、碎片化等特点,缺乏统一管理与应用,形成大量“沉睡的数据”。
二是数据安全亟待重视。一方面,部分在法律监督中确实需要的数据字段,由于涉及客户隐私、公民信息等,数据提供方以保护信息安全、数据边界难以厘清等理由拒绝共享,导致监督陷入瓶颈。另一方面,无论是执法司法数据还是社会数据,均会涉及个人或者单位的敏感信息。随着大数据法律监督的不断深入,如何对已有数据加强安全管理、规范数据使用将成为重要课题。
三是数据质量尚待提高。一方面,数据本身存在局限性。由于共享权限有限、数据涉密等原因,部分已获取的数据信息存在信息不全、格式混乱等问题,导致部分数据虽然量大但是不精、不全,且清洗工作耗时耗力。另一方面,数据与监督需求的关联度欠缺。部分监督模型需要大量信息,但是海量信息中只有部分信息是有用信息,如何缩小数据范围、提高匹配精度是提高监督质效的关键,共享信息的质量直接影响数字监督效果。
以数字思维拓展大数据法律监督的深度和广度。检察干警需要充分运用数字思维提高获取数据、驾驭数据、运用数据的能力。在数字经济时代,数字化是一种思维方式、一种行为能力,将数字思维和相应技术引入检察监督,破解“数据难题”,将大大拓展大数据法律监督的深度和广度。
一要激活自有资源,以数据唤醒数据。“四大检察”“十大业务”本身具有丰富的信息数据,深挖自有数据是首要工作。一方面,一体化管理检察数据。历经多年积累,无论是刑事检察,还是民事检察、行政检察、公益诉讼检察,都通过各种途径积累了大量的数据,但数据分散导致数据利用率低。因此,应实现检察数据的贯通共享,将已获取的数据进行一体化、系统化管理,实现融合监督。另一方面,统一数据形式和标准。除检察业务应用系统、侦查监督平台中填录的案卡、报表数据是结构化数据外,检察数据中还有大量卷宗材料、图像、音频等非结构化数据以及半结构化数据。结构化数据容易采用常规方式进行分析处理,但对于非结构化及半结构化数据需要通过特定的技术转化后利用,统一数据标准,整合多源数据。
二要创新共享方式,以非共享实现共享。在检察大数据战略下,检察机关目前已开展了多类专项数字监督,但在更广阔领域因数据权限、数据安全等原因仍存在不同程度外部阻力。对此,应运用数字思维,改变传统的导出共享方式为联邦学习(一种重要的面向隐私保护的机器学习框架,可以在不收集数据的情况下协同进行模型的训练,实现数据的“可用不可见”,从而保护隐私信息)下的共享模式:一方面,通过联邦学习,可实现在不暴露真实数据的情况下完成合作建模,能够让AI算法借助位于不同站点的数据获得经验,摒弃将数据进行归集的方法,使得各方均能凭借本地数据获取全局数据。对于大数据法律监督而言,这将大大拓展监督数据的来源。另一方面,联邦学习这种“数据可用不可见”“数据不动模型动”的方式也会大大加强数据的隐私保护,减少数据泄露风险。
三要类型化治理,以数据驱动数据。大数据法律监督的核心是类型化的思维方式,这除了体现在“类案治理监督”上,同样可以用于数据治理以提升数据质量。一方面,可以将部分数据治理的模式推广到整个类型化数据上,形成主题数据库。在数据标准统一的基础上形成易于检索、碰撞便利的标准库和主题库,如毒品犯罪数据库、电信诈骗犯罪数据库、涉税犯罪数据库、集资类犯罪数据库等,充分联结监督需求与现有数据,把已有数据挖深、用尽。另一方面,建立专项监督数据库,以数据驱动数据。可将已开展的专项监督类型化,如检察机关已开展的“空壳公司”清理专项监督活动,通过梳理无税款、无社保缴纳等特点,调取一批具有监督针对性的企业信息、税务信息,这部分信息相较于海量的“纯数据”而言更具监督价值。类似的如对强制戒毒、司法网拍等的专项检察监督中积累的“初步排查数据”,均能为各地检察机关提供更有针对性的数据支持。