9 月 11 日,金色财经独家现场确认存信数据平台公信宝被杭州市公安局西湖分局古荡派出所查封,另有可靠消息称有公信宝员工失联。

存信数据平台公信宝被封 “爬虫”为罪魁祸首?

对于公信宝被查,有分析认为,大概率是因为“数据”的事情,而不是因为“区块链和发币”的事情。

公信宝是何公司?

公信宝的主体运营公司为杭州存信数据科技有限公司。工商信息显示,杭州存信数据科技有限公司,注册于 2016 年 10 月 28 日,注册资本 750 万元,法定代表人、执行董事兼总经理为黄敏强。该公司出资结构为:黄敏强,66.5%;涂国君,18.5%;李笑来,7.5%;天津真格天弘资产管理合伙企业(有限合伙),7.5%。

存信数据平台公信宝被封 “爬虫”为罪魁祸首?

据公开资料显示,公信宝是点对点数据交易平台,为企业提供了与以往中心化数据交易(如数据中间商,数据黑市)全然不同的解决方案,其公信链 GXChain 也是一条以全球数据经济进行服务的基础链。

GXS 是公信宝发行的代币,总量 1 亿,历史最高价曾达到 11.24 美元,现已经上架 35 个交易所,该项目于 2017 年 3 月 4 号启动,共识机制为 DPOS。受该消息影响,24 小时下跌 23.37%,现报价 0.58 美元。

据了解,公信宝除了区块链,主要业务还有爬虫,其在爬虫方面的优势是电商类做得比较好。在一份 2018 年的产品价格服务表中,公信宝介绍了其爬虫类数据类型涵盖社保、学信网、京东、电信、移动、联通、智联招聘、芝麻信用分、微信、支付宝,甚至是人行征信数据等。

存信数据平台公信宝被封 “爬虫”为罪魁祸首?

公信宝为何被封?

关于公信宝被封的原因,金色财经第一时间电话联系了杭州市公安局西湖分局古荡派出所,对方表示,不方便透露也不清楚。所以现在还没有官方的回复。不过一位币圈行业从业者表示,公信宝这个事情,大概率是因为“数据”的事情,而不是“发币”的事情。

因为最近很多为网贷提供数据、爬虫抓数据、洗数据、购买黑数据的数据公司都被查被抓,员工被约谈。据每日经济新闻报道,近日杭州多家大数据服务公司遭警方贴封条,停止运营商爬虫服务。9 月 6 日,有消息称杭州魔蝎科技被警方控制,一位核心高管被带走调查,同日,上海新颜科技也被警方要求协助调查。9 月 10 日,有消息称数据服务公司聚信立暂停对外提供用户授权的运营商爬虫服务。

上海一位消费金融公司高管向每经记者表示,爬虫产品被停可能是因为爬虫得到的信息转给第三方是不合规的,对于较多依赖运营商数据进行风控的公司来说影响较大。“你自己爬可以,但是不能把爬出来的信息给到其他人。不过监管现在并没有一个很明确的说法。”

爬虫是违法的吗?

网络爬虫也叫网络蜘蛛(spider),是一种用来自动浏览网络的机器人,它方便用户自动化、高效率地浏览互联网并从互联网上获取数据。通俗来讲,爬虫就是一项计算机技术,就是顺着 URL (网页链接)由一个网络爬向另一网络,获取数据。

其实,爬虫作为一种计算机技术就决定了它的中立性,因此爬虫本身在法律上并不被禁止,但是利用爬虫技术获取数据这一行为是具有违法甚至是犯罪的风险的。

爬取数据是有可能触犯法律的,但要具体情况具体分析。爬取数据操作分为爬取的行为和爬取获得的数据两方面。

爬取行为的法律风险

爬虫目前能造成的技术上影响在于野蛮爬取,即多线程爬取,从而导致网站瘫痪或不能访问,这也是大多数网络攻击所使用的方法之一。由于爬虫会批量访问网站,因此许多网站会采取反爬措施。

由于网络爬虫会根据特定的条件访问页面,因而爬虫的使用将占用被访问网站的网络带宽并增加网络服务器的处理开销,甚至无法正常提供服务。在《反不正当竞争法》第十二条第二款中我们可以发现,法律会对爬虫的这种行为进行规制。

即经营者不得利用技术手段,通过影响用户选择或者其他方式,实施下列妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为:…(四)其他妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为。

因此,如果网站运营者已经采取了一定的反扒措施,而爬虫开发人员基于经营的目的、强行突破网站运营者采取的反爬措施,并客观上导致了网站无法正常运行,则很有可能构成上述规定所表述的不正当竞争行为。

强行突破某些特定的反爬技术措施,还会构成形式犯罪的行为。

《刑法》第二百八十五条规定,违反规定侵入国家事务、国防建设、尖端科学技术领域的计算机信息系统的,不论情节严重与否,构成非法侵入计算机信息系统罪。《刑法》第二百八十六条还规定,违反国家规定,对计算机信息系统功能进行删除、修改、增加、干扰,造成计算机信息系统不能正常运行,后果严重的,构成犯罪,处五年以下有期徒刑或者拘役;后果特别严重的,处五年以上有期徒刑。而违反国家规定,对计算机信息系统中存储、处理或者传输的数据和应用程序进行删除、修改、增加的操作,后果严重的,也构成犯罪,依照前款的规定处罚。

如上所述规定,爬虫开发者在获取数据过程中,一旦突破某些技术防护措施并且操作不当,造成严重后果的,将会构成犯罪,面临牢狱之灾。

爬取获得的数据的法律风险

数据一般分为两大类:个人数据和非个人数据。

如果爬虫爬取了个人信息(PII)信息,而为用户未授权或者授权不充分带来的法律风险很大。爬取个人信息还有可能会面临牢狱之灾,《中华人民共和国刑法》第二百五十三条之一所涉的 “侵犯公民个人信息罪” 及第二百八十六条之一所涉的 “拒不履行信息网络安全管理义务罪” 就是爬虫在个人信息爬取过程中经常触碰到的“红线”。此外,未经被收集者同意,即使是将合法收集的公民个人信息向他人提供的,也属于刑法第二百五十三条之一规定的“提供公民个人信息”,可能构成犯罪。

爬取非个人数据(non-PII)数据总体风险较低,但轻则可能构成侵犯著作权(在被爬取的数据具有独创性构成作品的情况下),如果有竞争关系,还可能因实质替代获取不正当竞争优势、干扰或破坏他人网络服务的正常运行,涉嫌构成不正当竞争;

重则可能因绕开技术措施非法获取数据,涉嫌侵犯商业秘密(严重情形涉及刑事责任),涉嫌构成非法侵入计算机信息系统、非法获取计算机信息系统数据罪等罪。

总结一下就是爬虫本身技术不是非法的,但是爬虫行为和爬取数据具有很高的风险,如果未经允许,将爬取数据用来进行商业行为,将面临法律问题。

参考资料:《你的爬虫会送你进监狱吗?》

来源链接:mp.weixin.qq.com