第0168章 大数据技术[第1页/共3页]
许云洁道:“姐夫,你别急,我另有一个相反的数据,能够让你减轻对这两小我的怀疑,这就是康文林和董朝阳两小我的两篇小我事情总结。康文林的小我事情总结五千一百二十九个字,与那些匿名告发信比拟,只要两个特性类似,与他以往的笔墨质料比拟,只要一个特性不异一个特性类似。董朝阳的小我事情总结四千六百五十一个字,与那些匿名告发信比拟,只要一个特性类似,与他以往的笔墨质料比拟,只要一个特性不异两个特性类似。你们想想,这个数传闻了然甚么?申明他俩有甚么题目?”
徐浩东当即警悟起来,“子健,这奥妙投票奥妙计票,你好象没有参与,你如何会晓得得这么清楚啊?”
“接着,我再解除市公安局网警大队代理大队长吴兴涵,因为他是个专业作家,常常在报纸杂志上颁发文章,以是他的质料最多,对比度也更高,但他只要一个特性不异两个特性近似,而不不异的特性非常较着。说实在的,他是被阐发法度第一个解除的,因为他的那篇六千三百多字的小我事情总结,几近没有甚么特性是跟那些匿名告发信是近似的,在那么短促的时候内,底子不成能有装假的机遇。也就是说,没有可比性,他不该该遭到思疑”
杨凌道:“我懂了,这个数据是成反比的,这个数据越低,反而申明他们的怀疑度越大。”
徐浩东接过杨凌递来的十一份小我事情总结,去寝室交给许云洁。
作为市纪委书记,沈腾也想去,因为市纪委有权提早参与。
杨凌有点不测,“徐书记还会玩收集?大数据技术有点云山雾罩,普通人玩不了的。”
“与此同时,我用扫描仪录入了那一百二十七封匿名告发信,将那一百二十七封匿名告发信当作一百二十七篇文章,让阐发法度对它们停止阐发判定,也找出它们在十七个方面的特性。现在,我能给出的一个根基判定,就是那一百二十七封匿名告发信,应当是一小我或两小我写的。其次,这两小我的文明程度应当起码是大专毕业以上,并且这两小我应当有较长的时候在构造事情,因为他们的文风有种居高临下的特性,和行文的机器性及教条性。”
徐浩东从寝室里走了出来,“各位,我们先用饭,我们想要的成果,能够还需求一二个小时才气出来。”
沈腾也跟着帮腔,“对啊,人家在干活,我们能吃得下去吗?”
沈腾道:“这个主张好,你找徐书记说去。”
许云洁道:“比如说,我们列出了一共十七个特性,市公安局办公室主任康文林,六个特性不异七个特性类似,一个类似的特性相称于半个不异的特性,六加三点五再除以十七,约为零点五五八,不就是百分之五十五点八么。”
许云洁道:“从概率上论,市公安局办公室主任康文林的怀疑度是百分之五十五点八,东城派出所所长董朝阳的怀疑度是百分之五十。”
许云洁直奔主题,“姐夫,我是如许做的,通过你们的内网,我的搜刮法度找出了这十一个的统统质料,包含小我档案、发言、陈述和文章及其他质料,以及刚拿来的十一份小我事情总结。再操纵阐发法度,找出了他们在文笔、文采、文风、语法、用词、是非句、段落是非、标点标记和行文风俗等方面的特性,一共有十七个方面。因为文明本质的凹凸,事情环境和事情性子的分歧,以及耐久构成的写作风俗,他们都有本身的特性,就象人的指纹和DNA一样,我列出十七个方面,没有两小我的某一方面是完整不异的。”