• 原告:北京微梦创科网络技术有限公司(“新浪微博”)
  • 被告:云智联网络科技(北京)有限公司(“超级星饭团App”)
  • 审理法院:北京市海淀区人民法院
  • 案号:(2017)京0108民初24512号
  • 裁判时间:2020年7月20日
  • 裁判结果:(1)被告停止侵权;(2)被告刊登声明消除影响;(3)被告赔偿经济损失1000万元及合理开支228,554元

一、案情概况:不止于此案

根据App Store内超级星饭团App的简介:“超级星饭团是一款专为粉丝打造的粉丝追星服务平台,让粉丝轻轻松松即时了解爱豆的SNS社交动态信息,随时随地紧紧守护自己的超级明星。”但新浪微博认为,超级星饭团App在未经新浪微博许可的情况下,通过爬虫程序爬取新浪微博中明星的动态,并将从新浪微博获取的明星动态数据与从其他平台获取的数据相结合,提供z明星动态,供“粉丝”所使用,进而侵犯新浪微博对数据的权益,进而构成不正当竞争。

案件中,超级星饭团App也承认部分数据来自于新浪微博,因此双方的主要的争议焦点在于:超级星饭团App抓取新浪微博数据是否侵犯新浪微博的合法权益。

这个案件在诸多层面具有典型意义,涉及到数据、个人信息、爬虫等多个领域,值得认真研讨。此外,本案并不是新浪微博为自己数据权益发起的唯一诉讼,之前(2016)京73民终588号“新浪微博诉脉脉案”开创了“三重授权”原则;(2019)京73民终2799号“新浪微博诉饭友App案”案被北京知识产权法院列为2019年度北京市法院知识产权司法保护十大案例。

二、固定证据:上收手机后的勘验

在涉互联网的案件中,固定证据向来都是难题。本案中,除了常见的公证以外,也通过当庭勘验的方式固定证据。法院同意新浪微博的勘验申请,并在本案庭审前上收双方通讯工具,避免与法庭勘验相关的问题和程序被提前泄露而影响勘验结果的客观真实性。

通过在法庭计算机中安装VPN,新浪微博登入公司内网,在线修改“超级话题”代码,将明星“李子璇”的上线时间修改为12:23,下线时间修改为12:26。随后专家辅助人登录超级星饭团App,发现App中的显示的时间为修改后的时间,而微博App和微博超话App中“李子璇”信息,均未显示勘验代码中记载的上线和下线时间。

尽管超级星饭团App进行了一些反驳,但新浪微博通过现场勘验的“突袭”,向法庭证明了超级星饭团App不仅会抓取超级星饭团App公开的前端数据,也会抓取新浪微博非公开的后端数据。

三、访问权限:公开数据与非公开数据

在知乎上,我最经常被问到的一个问题就是:爬虫程序是否合法?

通过爬虫程序在互联网上爬取数据是一件再正常不过的事情,搜索引擎的基础就是各种爬虫程序,用Python写一个简单的爬虫程序并不困难。但爬虫程序会显著消耗服务器资源,裁判文书网、工商登记信息网、12306等网络系统都饱受爬虫之苦,所以验证码设计愈发诡异。所以这也导致围绕着爬虫程序的“攻防”是互联网上一项热门的生意:爬虫程序越来越能够模拟真人的访问行为;网络平台也越来越能够判断网线对面是真人还是代码。

法庭将涉案数据分为“公开数据”与“非公开数据”两类,以访问权限为判断标准:在无相反证据的情形下,对于微梦公司未设定访问权限的数据,应属其已在新浪微博中向公众公开的数据;但对于其通过登录规则或其他措施设置了访问权限的数据(如用户即便登录新浪微博帐号亦无法访问的数据),则应属新浪微博中的非公开数据。

法庭认为,对于平台的公开数据,虽然是平台经营者重要的经营资源,但对爬虫程序应有容忍的义务:

而对于平台中的公开数据,基于网络环境中数据的可集成、可交互之特点,平台经营者应当在一定程度上容忍他人合法收集或利用其平台中已公开的数据,否则将可能阻碍以公益研究或其他有益用途为目的的数据运用,有违互联网互联互通之精神。且无论是通过用户个人浏览或网络爬虫等技术手段获取数据,只要其遵守通用的技术规则,则其行为本质均相同,网络平台在无合理理由的情形下,不应对通过用户浏览和网络爬虫等自动化程序获取此类公开数据的行为进行区别性对待。当然,如果他人抓取网络平台中的公开数据之行为手段并非正当,则其抓取行为本身及后续使用行为亦难谓正当;如果他人抓取网络平台中的公开数据之行为手段系正当,则需要结合涉案数据数量是否足够多、规模是否足够大进而具有数据价值,以及被控侵权人后续使用行为是否造成对被抓取数据的平台的实质性替代等其他因素,对抓取公开数据的行为正当性做进一步判断。

在庭审中,超级星饭团App并没有证明成功地向法庭证明自己合法正当获取新浪微博的公开数据。法庭认为超级星饭团App是通过伪装成用户登录或模拟用户行为向新浪微博后台服务器发送请求,并按照浏览器规则进行解析等技术手段获取数据,并违反Robots协议,在白名单以外仍然抓取公开数据,因此具有主观恶意。此外,自始至终超级星饭团App未向法庭说明其使用的技术和如何通过该技术实现对涉案数据大规模抓取进行演示或提交相关证据。

Robots协议仅是文本文件(.txt),并不像HTTP、FTP这些协议(protocol)如果不遵守就无法使用,更算不上法律意义上的协议(agreement),因此Robots协议的效力其实值得商榷,且超级星饭团App也并非《搜索引擎服务商自律公约》的签署方。从访问控制的角度来看,Robots协议更像是草坪上竖立的“禁止进入”标识,物理上没有办法阻挡人们踩踏草坪。在(2017)苏01民初2340号“北京焦点诉百度案”中,法庭就建议百度“在现有运行机制包括用户协议中明确法律提示条款、设置robots协议等的基础上,百度公司仍然应当主动积极应对新技术开发、新应用场景、新业态运营在市场拓展过程中可能引发的侵权现象,关注其中可能存在的侵权风险……”。

四、数据权益的边界

本案虽然是围绕不正当竞争的纠纷,但数据权益的保护仍然是重点问题,且可能会在未来影响到一系列类似案件的请求权基础。本案中,法庭对新浪微博的数据权益进行了如下论述:

……在当前的市场环境下,数据已经逐渐成为经营者,尤其是互联网经营者之间相互竞争的基础性资源,获得数据意味着可据此进行分析并改进、完善产品功能,从而获得更多的经营利益。因此,司法不能以数据尚未成为一种法定权利为由而拒绝裁判。当经营者为收集、整理数据,以及维护其互联网产品中的数据运行和安全而付出成本,且该种数据整体上可为经营者进行衍生性利用或开发从而获得进一步的经营利益时,其他经营者未经许可擅自抓取且使用平台数据的行为,当然可以落入反不正当竞争法调整的范围。

据此,结合涉案数据系新浪微博产品的重要基础,微梦公司为运营新浪微博,维护涉案数据安全付出了相应成本(如前述部分明星要求其动态信息不予公开,微梦公司显然需要为此进行产品功能的设计),微梦公司对涉案数据进行衍生性利用或开发,以及《微博服务使用协议》中关于涉案数据归属的约定等因素,微梦公司可基于其对涉案数据享有的经营利益,依据反不正当竞争法对云智联公司擅自抓取并使用涉案数据的行为提出相应主张。

……微梦公司所主张的涉案数据虽系来源于微博用户数据,但并非该些零散且相对独立的数据的简单集合,而是微梦公司进行了数据安全保护等加工后形成的数据(例如,根据《微博服务使用协议》第1.2.3条,用户可通过设置功能自行控制、把握查阅其信息的帐号类型);此外,涉案数据中亦有非微博用户生产的数据,如涉案数据中的明星在线时间,显然系微梦公司根据微博用户在线时间计算、整理得出。因此,微梦公司主张的涉案数据系新浪微博平台数据,与微博用户个人数据存在本质不同……。

对于新浪微博来说,除了通过《反不正当竞争法》进行维权,另一个“解题思路”是直接通过《民法总则》/《民法典》第一百二十七条(数据条款)进行维权,比如(2018)苏0684民初5030号“浙江淘宝网络有限公司诉杜某等网络侵权责任纠纷案”中淘宝公司便是按照此思路对恶意评价行为进行追责,认为恶意评价侵犯了自己的数据权益,并得到了法庭的支持。当然选择何种方式原告与律师会有自己的考量,我也无需赘言。

五、违法关键点:数据利用

在竞争法的角度,超级星饭团App在获取数据后的使用行为更值得关注,即超级星饭团App在获得数据后的利用方式是否会减损新浪微博的商业机会。

在本案中,法庭认为涉案数据均系与明星动态相关的数据,而关注涉案信息的主要用户群体即明星粉丝,与超级星饭团App的用户类型一致,且构成替代关系,用户可以不使用新浪微博就能获得明星数据,直接影响新浪微博的广告收益。(2019)京73民终2799号“新浪微博诉饭友App案”中,法庭也使用过类似的思路,认为:微梦公司对新浪微博数据享有合法权,在案证据可以认定复娱公司系通过绕开或破坏微梦公司技术保护措施的手段,实施了抓取和展示新浪微博数据的行为,使得饭友×××用户无需注册或登录新浪微博帐号即可查看新浪微博全部内容,复娱公司的行为必然会影响微梦公司与用户间协议的履行,导致微梦公司的独家权益无法得到保障,对数据维护等的投入无法获得相应回报,或将减损用户数据安全程度,妨碍、破坏了新浪微博的正常运营。

在(2016)沪73民终242号“大众点评诉百度案”中,争议焦点并不在于数据的获取,而在于对数据进行收集后如何进行利用才算合法。“大众点评诉百度案”案件的裁判为数据收集后的利用提供了清晰的指引——即在数据利用时不能实质替代原服务,应采取对原服务影响更小,并能在一定程度上实现积极效果的措施对数据进行利用。

六、公开数据中个人信息合规隐忧

案件中,个人信息主体的角色也不应忽视,法庭认为:

对于涉案数据中的公开部分,正常情况下,新浪微博用户可随时选择修改或删除相关数据,微梦公司基于其与用户之间的协议亦应维护用户处理其数据之权利;但云智联公司的抓取和展示涉案数据的行为会使这部分数据脱离用户自身和微梦公司的控制,减损其处理数据的权利。而对于涉案数据中的非公开部分,往往包含与用户个人隐私相关的信息(如用户设置仅自己可见)或其不希望他人收集或查看的信息(如用户发布后自行删除的信息或前述明星限制公开的数据),云智联公司对其进行抓取和展示可能导致此类用户个人信息的泄露和被侵害,而这必然影响新浪微博数据安全进而破坏微梦公司所提供服务的正常运行,也可能侵害用户对其个人隐私等信息所享有的合法权益。

在《民法典》第一千零三十六条中,规定合理处理该自然人自行公开的或者其他已经合法公开的信息,行为人不承担民事责任,但是该自然人明确拒绝或者处理该信息侵害其重大利益的除外。这意味着通过爬虫程序爬取前端公开的个人信息并不违反法律,但是个人信息的主体有权拒绝。《民法典》对已公开个人信息的态度延续于《最高人民法院关于审理利用信息网络侵害人身权益民事纠纷案件适用法律若干问题的规定》第十二条的规定。

程啸教授认为:“一方面,即便是已经合法公开的个人信息依然受到法律的保护,自然人对这些个人信息并不因其公开而失去控制的权利,其有权拒绝他人对这些信息进行处理;另一方面,由于个人信息的保护对于维护自然人的人格尊严和人格自由具有很重要的意义,所以,即便是已经合法公开的个人信息,也不得任意进行处理,如果处理该信息将侵害自然人的重大利益的,也要承担民事责任。”(《论我国民法典中的个人信息合理使用制度》,载《中外法学》2020年第4期)

当然明星们可能不会要求超级星饭团App删除自己的个人信息,但在其他场景下,大量裁判文书信息、新闻报道公开的个人信息保护一直也都是一个棘手的问题。个人信息主体其实是有权利要求爬取数据的平台删除其个人信息,需要爬取数据的平台具备响应机制。但有一点需要留意,根据《征信业管理条例》第十三条第二款:“企业的董事、监事、高级管理人员与其履行职务相关的信息,不作为个人信息。”但如果超出董监高的履行职务相关的信息的范围,则仍然属于个人信息。

简而言之,对于已公开的个人信息,个人信息主体并未丧失掌控的权利,仍然可以要求停止处理、删除、修正错误。

最后修改日期:2020年8月25日

作者

留言

撰写回覆或留言

发布留言必须填写的电子邮件地址不会公开。