当前位置:澳门贵宾厅 > 数据 > 这种暴力催收行为离不开爬虫技术的,过去双方联手闷声发大财的日子将不复存在
这种暴力催收行为离不开爬虫技术的,过去双方联手闷声发大财的日子将不复存在
2020-04-06

业内认为,监管出手正本清源,第三方风控公司、征信公司以及金融大数据公司等相关行业与金融机构的合作模式也将发生改变,过去双方联手“闷声发大财”的日子将不复存在。

原标题:爬虫技术罪与罚:失衡的催收应用边界

值得关注的是,《个人金融信息保护试行办法》被列入《中国人民银行2019年规章制定工作计划》中,将对何为个人金融信息、谁可以获取个人金融信息等重要问题作出梳理。业内认为,监管出手正本清源,第三方风控公司、征信公司以及金融大数据公司等相关行业与金融机构的合作模式也将发生改变,过去双方联手闷声发大财的日子将不复存在。

“爬虫技术是一项工具,但被居心不良的人使用,就可能出现大问题。”一位互联网消费金融平台风控总监感慨说。

请问你是XXX吗?你是XXX同学的家长吗?相信不少人都接到过这样的电话,对方能够直呼其名,说出孩子的姓名、家庭住址甚至一些金融信息,而呼叫内容往往是广告、推销或诈骗等。他们怎么知道我们的信息?我们的信息是怎样泄露的?

尽管近日51信用卡被查主要源自其委托的催收公司存在冒用国家工作人员暴力催收行为,但在多位业内人士看来,这种暴力催收行为离不开爬虫技术的“配合”。

2018年3月,百度CEO李彦宏的一番话遭遇众多网民的不满,却也揭开了一个事实:中国人对隐私不敏感,愿意用隐私交换便捷性,企业就可以用数据做一些事情。然而,这只是数据泄露的其中一个原因。通过技术手段对个人信息进行采集也是互联网公司的常用做法,比如,爬虫软件就是其中之一。近段时间以来,个人信息泄露暴力催收等事件屡有发生,大数据行业野蛮生长的弊端不断暴露。

www.vip8888.com,“比如有些互联网消费金融平台通过爬虫技术能时时掌握借款人行踪与地址定位(未必获得用户允许),然后将此信息转交给催收公司,由后者上门轮番暴力催收,无论借款人跑到哪里,暴力催收就如影随影,如此部分借款人心态崩溃,容易走上不归路。”这位互联网消费金融平台风控总监透露,此外有些平台在未获得用户授权的情况下,通过爬虫技术掌握借款人与亲朋好友的通话记录,由此向这些亲朋好友施压督促他还款,导致借款人感到脸面丢失,也容易走上不归路。

值得关注的是,《个人金融信息保护试行办法》被列入《中国人民银行2019年规章制定工作计划》中,将对何为个人金融信息、谁可以获取个人金融信息等重要问题作出梳理。业内认为,监管出手正本清源,第三方风控公司、征信公司以及金融大数据公司等相关行业与金融机构的合作模式也将发生改变,过去双方联手闷声发大财的日子将不复存在。

他坦言,这背后,与某些平台通过爬虫技术过度收集并贩卖借款人隐私信息息息相关。

隐私成数据

多数情况下,借款人看到的授权协议仅仅显示平台将通过后者授权的账号,只能登陆相关网站邮箱与手机桌面查看所下载的APP。但事实上,这些平台的爬虫技术早已突破授权协议使用范畴,开始抓取借款人在网站邮箱与手机桌面的大量各类数据,其中不少涉及用户极其隐私的个人信息“另有他用”。比如他们会将借款人地址定位信息“交给”催收公司进行催收回款,或将借款人其他隐私信息卖给其他平台作为信贷风控决策依据等。

当前,互联网、大数据、人工智能和实体经济深度融合,经济社会各个领域数据开发利用活动变得日益频繁。

“在欧美国家,这种行为肯定是触犯法律的。”一位曾在美国开发爬虫技术的金融机构技术总监向21世纪经济报道记者透露。

多位业内人士告诉《金融时报》记者,数据作为一种潜在的资产,已经成为各方争夺的焦点,但滥用滥采、数据泄露、非法交易,这三点是大数据运用过程中不可回避的问题。

记者多方了解到,目前中国对用户隐私信息保护的相关法律正在加速完善,比如正在征求意见的《个人金融信息(数据)保护试行办法》规定,(金融机构)不得非法从从事个人征信业务活动的第三方获取个人金融信息,以及金融机构不得以“概括授权”的方式取得信息主体对收集、处理、使用和对外提供其个人金融信息的同意。

个人数据是当前非法数据交易的主要数据类型,个人信息滥采滥用现象也十分严重。工业和信息化部赛迪研究院电子研究所副所长陆峰表示,以手机电筒APP软件为例,除了要求获取电池和摄像头访问权限之外,还要求访问用户通信录和地理位置等与软件功能无关的个人信息。

被玩坏的爬虫技术

这样的应用并不是少数。根据2018年中消协通报的100款App个人信息收集与隐私政策测评情况报告显示,共测评的10类100款App中,有91款App都存在过度收集用户个人信息的问题,近半数APP隐私条款内容不达标。支付宝滥用个人数据的事件就曾引爆网络舆论,2018年年初,支付宝公布的2017全民账单详细列出了每个人的消费详情,但有网友发现,在查看自己的数据之前,有一行授权界面的小字我同意《芝麻服务协议》,不但字特别小,而且是默认勾选好的。

上述金融机构技术总监直言,爬虫技术在欧美国家金融领域的使用相当普遍,比如在洗钱监管方面,不少金融科技公司通过爬虫技术抓取各类公开信息,以此完善涉嫌洗钱者的名单以及其人际关系网,从而不放过任何一个漏网之鱼。

中央财经大学中国互联网经济研究院副院长欧阳日辉告诉《金融时报》记者,现在各类移动应用十分普遍,这些APP对个人信息的采集和开发运用也越来越频繁,一定程度上造成了数据的滥用滥采问题。这些数据除了用作精准营销之外,还被一些不法分子用来实施精准诈骗或其他非法用途。

“在中国,爬虫技术显然被玩坏了。”他透露,相比欧美国家金融机构通过爬虫技术只能抓取公开信息或经用户授权的个人信息,中国不少P2P平台都存在利用爬虫技术过度收集用户隐私信息行为。具体而言,比如用户授权P2P平台只能访问他浏览过的网站页面或邮箱里涉及信用卡账单的邮件,手机桌面APP下载软件等信息,但在实际操作环节,这些P2P平台利用爬虫技术抓取用户在这些网站的消费行为,私人邮件内容,还有个人行踪及地址定位等隐私信息。

如果说上述类型的个人信息泄露某种程度上是用户自身出于用隐私交换便捷性的需要,那么,近期备受关注的暴力催收爬虫事件则掀开了数据泄露以及非法交易的另一角。

这也是引发暴力催收事件频发的主要原因之一。比如P2P平台将用户地址定位“交给”催收公司,由后者不断上门轮番对借款人进行暴力催收加快回款速度,而部分借款人发现自己走到哪里都被暴力催收,最终心态崩溃并走上不归路。

11月14日,公安部召开新闻发布会称,9月1日以来,各地网安会同刑侦部门收网打掉团伙147个,抓获嫌疑人1531名,采取刑事强制措施798名,铲除了一批帮助犯罪的技术服务商、数据支撑服务商、支付服务商,实现了对套路贷犯罪规模打击、生态打击。

此外,很多P2P平台还通过用户“授权”,通过爬虫技术抓取用户在银行的大量个人信息,包括个人以往借贷还款记录,职业、婚姻状况等数据,并将这些数据与用户提交给平台的个人数据进行交叉验证,以此判断用户真实的还款能力与还款意愿。但事实上,这种用户“授权”所抓取的内容,是银行需保护的用户隐私信息。

在黑龙江公安机关网安部门侦破的7.30网络套路贷专案中,宋某因无力偿还贷款,套路贷平台通过骚扰电话、恐吓信息、诱导借款等形式,不断对其本人、家人、同事、朋友进行各种方式的软暴力催款,给其带来了巨大的精神压力。业内人士称,P2P暴力催收的背后是无孔不入的爬虫江湖,这种催收行为主要依靠爬虫技术的配合,不仅爬出你的个人信息,还爬出你的家人、朋友等隐私。其背后原理就是,某第三方大数据平台在未经授权的情况下,通过爬虫技术时时掌握借款人行踪与地址定位,然后将此信息转交给催收公司,由后者上门完成催收。

这也引发不少银行与P2P平台的纠葛。近日市场传闻一家银行向51信用卡发函,直指后者通过爬虫技术对银行用户信息进行全方位大量抓取。由于银行未与51信用卡签订相关授权书——允许后者从银行系统获取用户个人信息,因此银行认为51信用卡此举构成侵犯公民个人信息罪,要求后者停止这种抓取用户个人信息行为。

爬虫本身是作为搜索引擎的底层技术,只是一些机构在利益的驱使下非法爬取数据并用作非法用途,给个人隐私披上数据的外衣让其看起来合理化。多位业内人士表达出这样的观点。中国人民大学国发院金融科技与互联网安全研究中心主任杨东也表示:技术本身是中性的,无善恶之分,认识到这一点就可以理性、客观地看待数据分析市场和数据分析机构。

监管加强保护个人隐私

大数据从业者

面对爬虫技术过度收集贩卖个人隐私信息所造成的社会问题,欧美国家相关部门一直在加强从严监管力度。

既然技术是中性的,爬虫也仅仅是通过互联网进行数据一种工具,且不是唯一工具。那么,为什么相关的企业却开始谈爬虫色变,有的科技公司干脆对外声称没有该业务或产品?

去年5月,欧盟出台了《通用数据保护条例》(简称GDPR)。这份法案的最大杀伤力,是过去互联网机构习以为常的、利用爬虫技术过度抓取用户行为数据的做法,因涉嫌侵犯隐私变得不再“合法”。

在分析人士看来,这些企业怕的是在一波强监管之下,整个行业会全军覆没。可以看到,随着监管开始正本清源,野蛮生长的大数据收集时代将进入冷静期,势必给第三方风控公司、征信公司以及金融大数据公司等带来商业变革,第三方数据公司与金融机构的合作模式也将发生改变。但是,在监管中倒下的永远是那些没有竞争能力和创新能力的企业。

它之所以被称为史上最严的数据保护法案,主要在于两点,一是任何企业只要在欧盟市场提供商品或服务,或收集欧盟公民的个人数据,都将受到这部法案的管辖。比如中国跨境电商平台提供“面向欧洲的特惠产品”“欧洲区包邮”等采购服务,或在商品价格上标注欧元价格,就可以被视为在欧盟市场提供商品或服务,将受到GDPR的管辖;二是GDPR法案规定跨境电商等网站经营者不得擅自将用户姓名、银行账户、IP地址等个人信息用于其他业务用途,反之这些网站经营者若要将用户信息用于其他业务用途,需与用户重新签订一份授权协议并明确标注新的用途。

大数据清理整顿会波及谁?从广义上来说,这几乎涵盖了所有与之相关的行业,但指向也很明确,即帮助犯罪的技术服务商、数据支撑服务商、支付服务商。从与金融密切相关的大数据风控来看,目前包括主流的金融机构以及各类类金融机构基本都会使用。该行业当前的市场组成主要包括:中国人民银行征信中心和百行征信为代表的全面征信机构、八家专业征信信息提供商以及5000~6000从事大数据分析的企业。

这导致不少跨境电商等互联网平台抱怨客户服务体验大幅下降。因此它们一直尝试游说欧洲相关部门能适度放宽GDPR对个人信息获取使用的监管要求,但鉴于对用户隐私信息的从严有效保护,欧洲相关部门没有松口。

但由于个人数据保护立法相对滞后,上述第三层级的市场目前表现良莠不齐、鱼龙混杂。据业内人士分析,第三层级大数据公司也分为三种,一种是没有自有数据只提供大数据产品或者基础技术的公司,第二种是自己业务能产生数据并且能对外输出数据和技术赋能的公司,第三种是自己不能产业业务数据,数据来源于爬虫爬取、对外购买、授权使用后再以此进行对外数据输出和技术赋能的公司。

美国奥斯顿律师事务所(alston&bird llp)合伙人kenneth g.weigel此前接受本报记者采访时表示,美国法律则主要从“未经授权故意访问”“超过授权访问权限”“从任何受保护的计算机获取信息”三大维度判断爬虫技术公司是否过度收集使用用户个人隐私信息。按照《1986年计算机欺诈与滥用法》,只要爬虫技术公司在抓取用户个人隐私数据时存在上述三种状况,基本都被判定败诉与巨额赔款。

随着个人数据保护相关立法与监管的不断发展,那些使用爬虫技术进行个人隐私数据的暴力爬取的这类公司将受到清理整顿,如果完全不能用爬虫,此类公司只有与数据拥有方进行合作,授权使用或购买数据。香颂资本执行董事沈萌说。

值得注意的是,近年中国在保护个人隐私信息方面的法律日益完善。早在2017年5月8日,最高法院、最高检察院出台了《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》,对爬虫技术过度收取滥用个人隐私数据做出严格入罪规定。

业内人士认为,虽然大数据风控理论上也有各种漏洞,比如数据来源和使用的合法性、数据质量及可持续性,风控模型本身设计是否存在缺陷等,但这只是说明大数据风控还有需完善之处,不能因此否定大数据的存在和应用价值。

正在征求意见的《个人金融信息(数据)保护试行办法则规定金融机构不得非法从从事个人征信业务活动的第三方获取个人金融信息,以及不得以“概括授权”的方式取得信息主体对收集、处理、使用和对外提供其个人金融信息的同意。

安全与发展

“在2017年《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》出台后,相关部门曾抓了一些利用爬虫技术过度收集滥用个人隐私数据的P2P平台技术人员,但由于当时处罚力度不够重,并未引发很多大数据风控机构与P2P平台高层重视,如今多家爬虫技术公司被查与相关高层被抓,足以凸显相关部门正采取雷霆手段整治爬虫技术过度收集滥用个人隐私数据行为,从而净化个人隐私信息保护领域。”上述平台技术总监指出,经此一番行业动荡,利用爬虫技术过度收集个人隐私信息牟利的公司未来生存空间也被大幅压缩,目前很多银行与持牌金融机构已经暂停与这类机构的各类大数据风控技术合作。

从国际经验看,在欧美等发达国家,大数据行业在信用经济、消费经济、普惠金融等领域扮演着不可替代的角色。随着与人工智能、机器学习等技术的融合发展,大数据分析在我国也进入到了发展的快车道。根据IDC最新报告预测,2019年度全球大数据与智能分析的市场为1896.6亿美元,其中来自中国的市场贡献将达到96亿美元,预计2019年至2023年复合年均增长率达23.5%。

当前,大数据行业被推上了风口浪尖,很多科技公司都未能逃过这一波攻势,在社会大众普遍对大数据不够了解、不够信任的基础上,任何风吹草动都会引发大家的关注。某科技公司负责人告诉《金融时报》记者,对于机构而言,应该不断探寻用科技的手段寻求隐私保护与数据共享的平衡;对于行业来说,对数据规范使用的监管将是一个长期过程,也将是一个金融与科技、风险与创新、文化与心理、法律与监督等多方博弈,多方协商,最终达到一个最佳平衡点的过程。

在欧阳日辉看来,大数据开发利用一种不可逆转的发展趋势,关键是要树立安全的大数据发展观。坚持发展和安全双轮驱动原则,既要鼓励和支持大数据应用,又要同步做好安全风险的防范,积极稳妥推进大数据应用。

数据治理提上日程

业内人士认为,《个人金融信息保护试行办法》的提出或许只是一个信号,未来监管对大数据行业的整顿,将进一步深入下去。

陆峰认为,大数据时代,个人信息的商业价值和法律意义都在提升,加强数据治理,已经刻不容缓。

面对利益的冲击,更需要筑牢法律的防火墙,让企业提高数据的安全保护重视程度,让职能部门强化对市场、行业的监督管理,让司法机关严厉惩处违法行为,为公民隐私穿上保护衣。陆峰说。

可以看到,随着数据问题频发,数据治理立法以及行业规范建设加快步伐。2018年9月7日,十三届全国人大常委会立法规划公布,《个人信息保护法》与《数据安全法》被列入第一类项目,个人信息保护和数据安全立法正式提上日程。行业规范建设方面,2018年5月,银保监会发布了《银行业金融机构数据治理指引》,要求提高数据质量、加强数据应用提升数据价值、监管机构要加强监管等,且要求数据治理时要遵循全覆盖原则,即应该覆盖机构的全部数据生命周期;10月12日,北京银保监局发布《关于规范银行与金融科技公司合作类业务及互联网保险业务的通知》,要求严禁与以大数据为名窃取、滥用、非法买卖或泄露客户信息的企业开展合作;北京市网络行业协会、北京邮电大学和公安部第三研究所相关专家研究起草了《互联网个人信息安全保护指引》。

杨东认为,当前的紧要任务是推动形成金融监管机构、行业头部企业与法律界等共同研究探讨的善治局面,鼓励科技向善。

针对当前大数据行业的弊端,杨东建议,金融监管机构出台金融业个人数据保护合规操作指南,引导金融机构及数据分析机构的合规运行;组织金融业成立行业自律组织,制定个人数据保护自律守则,设立隐私认证标识;根据合规性评估结果定期公布合规供应商清单,以此来加强数据分析行业的个人数据保护。

业内人士也表示,行业的繁荣发展不是某一家公司的使命,需要更多机构、更多智慧来共同促进,而在清理整顿之后,相信大数据行业将进入全新发展周期。

责任编辑:周星如

上一篇:没有了
下一篇:没有了