库克群岛

造就译如何用大数据技术分析万


白癜风怎么能治好 http://m.39.net/pf/a_6159813.html
本文节选翻译自《连线》杂志“HowRportrsPulldOffthPanamaPaprs,thBiggstLakinWhistlblowrHistory”“Howth11.5millionPanamaPaprswranalysd”一家在中美洲注册的律师事务所,他的万份秘密文件被匿名者交给德国《南德意志报》,这些文件被不知名人士泄露给新闻机构,后者再与多个新闻机构和名记者分享信息——这项调查已经持续近1年。据《南德意志报》报道,此次披露的泄密数据比维基解密(WikilaksCablgat)、离岸解密(OffshorLaks)、LuxLaks和SwissLaks这几个解密网站披露的数据总和还要多。这使得这次数据泄露成为历史上最大的数据泄露。ICIJ表示,一些机构积极注册壳公司来帮助富人及政要在全球转移资产,此为资产转移的路线图。史上最大泄密数据怎样流出?据ICIJ负责人Ryl介绍,文件泄密事件始于年末,当时,一位匿名举报人主动联系《南德意志报》。《南德意志报》的记者BastianObrway说这位举报人通过加密的聊天软件与他取得联系,表示将会提供某种数据,意图“将这些罪行公诸于众”。但这位举报人称,他(或她)可能“有生命危险”,因此只愿意通过加密渠道联系,并拒绝面谈。Obrmayr问:“到底有多少数据?”举报人回答说:“你从未见过那么多。”Obrmayr告诉《连线》杂志,他通过多个加密渠道与这位线人联系,而且频繁更换渠道,每一次都会删除所有对话历史记录。他笼统提到曾使用Signal和Thrma之类的加密软件,以及PGP加密电子邮件,但拒绝透露他们使用的具体方法。每一次,记者和线人重新建立联系后都会使用事先设定的问题和答案来相互验证身份。Obrmayr说:“我会问‘天气晴朗吗?’他应回答‘月球上在下雨’,或其他莫名其妙的回答,这样我们就知道对方依然是那个人。”泄密的规模究竟有多大?实际泄密的文件尚未被公布——国际调查记者联盟(ICIJ)已宣布,将于下月公布泄密文件涉及的完整公司名单——它们到底包含多少数据尚不得而知。据报道,全部泄露信息包括上述律师事务所的万份内部文件。其中包括但并不局限于电子邮件、合同、抄本和扫描文件。总计包括万封电子邮件、万条数据库信息、万份PDF文件、万张图片和32万份文本文件。所包含信息的总量甚至比维基泄密事件和爱德华·斯诺登泄密案更庞大。全部信息累计有2.6TB字节。这批文件数据生成的时间跨度长达数十年,从年一直到年。据ICIJ透露,“这些数据显示,上述律师所与超过1.4万家银行、律师事务所、公司法人和其他中间人合作,为其客户设立空壳公司、基金会和信托。”最受这些顶级富豪们欢迎的十大避税天堂。文件显示,逾11.3万(每两家就有一家)家企业在英属维京群岛注册。如何协调几百家媒体的报道?文件曝光了有哪些跨国银行请求为其客户建立壳公司以及数量,其中Exprta公司和信托服务的请求数量居榜首。Obrmayr拒绝透露他们的举报人具体是如何一次性将数百GB甚至上TB的的数据传送给《南德意志报》的,这显然远远超过电子邮件的上限,但如果通过邮寄加密硬盘的方式却很容易匿名转交。Obrmayr只是简略地说:“我学到了很多关于如何安全地传输大文件的知识。”在联系上ICIJ后,ICIJ的技术人员为这些文件专门设计了一种“双因素认证保护搜索引擎”、以及一个通过加密电子邮件与其他媒体(包括BBC、卫报、Fusion和几十家外语媒体)共享的URL地址。这一网站甚至包括实时聊天系统,方便记者们交换意见,查找自己看不懂的外语文件的翻译版。“如果你想要查阅巴西相关文件,可以找一位巴西记者,”Ryl说,“你还能看到谁已经起床开始工作,并进行公开通信。我们鼓励每个人告知其他人他正在做什么。”不同的媒体机构最终分别在华盛顿、慕尼黑、伦敦、约翰内斯堡和利勒哈默尔组织了各自的面谈。令人惊讶的是,虽然这些信息被如此广泛地分享,要将数据库中的信息公诸于众还需等待——或许,部分原因在于它是如此的庞大且难以驾驭。Obrmayr承认,虽然发生大规模泄密事件的传闻风声四起,但数据本身并未泄露出去。“去年秋天,我一度非常紧张,担心太多人知道了,”他说,“有几个地方曾出现传闻,但范围并未扩大。”Ryl说,媒体组织并不计划像维基解密一样发布完整数据库,因为这样做会暴露无辜个人的敏感信息,他们的报道只


转载请注明:http://www.xuefolanqc.com/gjxz/5496.html


当前时间: