爬取数据,当心“踩雷”
发布时间:2019/7/17 15:45:20来源:中国知识产权报/国家知识产权战略网分享到

  前有北京市海淀区人民法院(下称海淀法院)就“抖音”APP起诉“刷宝”APP不正当竞争纠纷作出的北京市首例数据爬取禁令,后有针对新浪微博起诉“饭友”APP爬取内容构成不正当竞争纠纷,判赔210万元,连日来,这两起涉及互联网数据爬取的不正当竞争纠纷备受关注。

  网络数据是互联网的基础性、核心资源,近年来因爬取数据引发的纠纷并不少见。不过,互联网特点是开放,其本质是分享,面对种类繁多的数据,数据保护的边界在哪里?有专家认为,企业未主动公开,且与企业核心竞争力息息相关的数据应该受到保护。为了避免爬取数据潜在的侵权风险,企业需要遵守诚实信用原则,对数据的使用目的、爬取方式及呈现形式均需格外谨慎。

  爬取数据引纠纷

  两起案件均为原告起诉被告未经许可,爬取其平台上的部分内容。

  新浪微博的运营商北京微梦创科网络技术有限公司(下称微梦公司)在诉讼中表示,经过数年的运营,新浪微博已经拥有了巨大的用户群体,是娱乐明星分享动态的平台,已经成为娱乐媒体和粉丝主要关注和交流的平台。上海复娱文化传播股份有限公司(下称复娱公司)作为“饭友”APP的运营者及服务者,未经许可,在“饭友”APP中的明星账号设置新浪微博专题,完整地展示对应明星微博的界面、内容等全部数据,同时屏蔽新浪微博中的部分功能并添加自有功能。在微梦公司看来,复娱公司的行为侵犯了其权益,同时违反了诚实信用原则和公认的商业道德,以不正当竞争为由将其起诉至法院,索赔210万元。

  同样,“抖音”APP认为“刷宝”APP上存在大量“搬运”自“抖音”APP的短视频及评论内容,其行为构成不正当竞争。“抖音”APP的开发者及运营者北京微播视界科技有限公司(下称微播公司)起诉称,经过大量经营成本投入、高质量运营和对原创内容的扶持,“抖音”APP已形成了在同类产品的竞争优势,同时对平台中的视频及评论享有相关权益。北京创锐文化传媒有限公司(下称创锐公司)、成都力奥文化传播有限公司(下称力奥公司)大量爬取“抖音”APP上的视频及评论,展示于“刷宝”APP上,其行为替代了“抖音”APP向用户提供内容并获得用户与流量的权利,攫取了微播公司的市场份额、削减了其竞争优势与交易机会。据此,微播公司向海淀法院提出行为保全申请,请求创锐公司、力奥公司立即停止爬取“抖音”APP上的视频、评论并在“刷宝”APP上展示。

  不过,对新浪微博与“抖音”APP各自的控诉,复娱公司和创锐公司、力奥公司均不以为然。

  针对微梦公司的诉讼请求,复娱公司表示,“饭友”APP并未爬取新浪微博的数据,其只提供新浪微博链接,用户点击之后便可跳转至新浪微博,同时,明星在新浪微博上的内容已经公开,其提供链接服务的目的是供粉丝了解明星使用;新浪微博中的相关功能未在“饭友”APP上显示是界面限制,并非恶意屏蔽。

  而创锐公司、力奥公司认为,首先,“抖音”APP中的短视频权利属于用户,微播公司无法证明享有涉案短视频的相关著作权;并且“刷宝”APP上的视频都由用户上传,其未实施爬取行为;此外,力奥公司已经删除了大多数视频,被诉行为已经得到控制。创锐公司还补充,其并不是“刷宝”APP的开发运营者,涉案行为与其无关。

  合法权益受保护

  两起案件中,微梦公司与微播公司对各自平台上的数据是否享有合法权益都是原被告双方争议的焦点。从结果来看,海淀法院确认了微梦公司与微播公司均享有依法保护数据的权益。

  海淀法院表示,微梦公司提交的《微博服务使用协议》中显示,微梦公司对用户发布在新浪微博平台上的内容享有独家权利及转授权的权利;同样,微播公司亦与用户之间定有协议,在政策的经营活动中使用“抖音”APP上的短视频内容具有合法的授权依据。

  那么,复娱公司与创锐公司、力奥公司是否实施了数据爬取行为,相关行为是否构成不正当竞争?

  海淀法院认为,相关证据显示,复娱公司平台上展示的新浪微博内容,已经根据自身需求对新浪微博内容进行了增删,而根据提供链接服务是为了便于网络信息共享等目的,提供链接方理应完整呈现被链接信息,因此,法院对复娱公司称其设置链接的说法不予认同,其行为应认定为爬取了新浪微博的后台数据;同时,通过“饭友”APP对新浪微博平台内容的呈现,使“饭友”APP用户不用注册或登录新浪微博账号,便可查看新浪微博内容,破坏了新浪微博数据的展示规则,已经对新浪微博部分内容构成了实质性代替,分流了其潜在用户流量,妨碍、破坏了新浪微博的运营,构成不正当竞争。

  “‘刷宝’APP中多达5万余条短视频与‘抖音’APP上短视频相同,且有127处评论内容相同,同时短视频中还含有‘抖音’APP专有的VID码。创锐公司、力奥公司所称视频均由用户上传未提供相应证据,法院对此未予采信。现有证据显示,‘刷宝’APP上的评论内容、顺序甚至是标点符号都与‘抖音’APP对应评论完全相同。”据此,法院认定创锐公司、力奥公司直接采用技术手段或人工方式获取了微播公司的视频资源、评论内容,争夺其流量和用户,削弱了微播公司的竞争优势,已经违反诚实信用原则,扰乱正常市场竞争的可能性极大。

  使用数据需谨慎

  数据作为互联网企业的基础性、核心资源,其带来的流量变现、大数据分析等价值正日益凸显。爱奇艺法律部诉讼维权总监胡荟集在接受采访时表示,通过数据分析,不仅能从宏观角度展现企业的经营状况,同时也能实现数据预测和数据决策,从而影响企业运营的各个环节,其重要性不言而喻。此外,对于资讯类和信息类平台,数据就是企业的直接竞争力,已成为企业的无形资产,尤其是核心技术资料等数据更是企业安身立命的资本。

  记者在采访中了解到,目前,互联网大数据领域的侵权纠纷虽然数量不多,但都颇具典型意义。“在司法实践中,数据爬取通常涉及个人信息数据和企业数据。个人信息数据主要是指用户留存在平台的个人信息,平台与用户之间或因这些数据产生隐私权纠纷;企业数据主要是用户注册和在平台活动轨迹形成的信息(如用户发布的文章、图片、视频等),这些数据通常会引发竞争纠纷。”海淀法院法官张璇表示,此类案件中,可以发现,当事人主张的数据已经不再是原始的网络数据,而是经过网络运营者投入大量智力劳动成果、经过深度开发与系统整合所形成的衍生数据,其能够带来商业利益和竞争优势。

  互联网数据类型繁多,数据保护的边界在哪里?胡荟集认为,除企业主动公开、涉及公共利益需要披露或基于合作提供的数据外,其他所有足以构成企业核心竞争力的数据都应该受到保护,包括员工信息、客户信息、市场渠道资源、核心技术数据、产品数据、开发文档和源代码等。

  众所周知,互联网的特点是开放,数据(信息)的本质是共享,如何爬取数据才能避免侵权风险?对此,张璇建议,经营者未经他人允许不要随意使用其他经营者未开放的数据,即便是爬取前端开放的数据,这种开放也只是事实上的开放,并不意味着这些数据已经进入公共领域,如果爬取了大量数据,且使用这些数据的主营业务实质性替代了被爬取主体业务的,仍然可能构成不正当竞争。

  胡荟集表示,企业在经营活动中应遵守诚实信用原则,特别是对出于商业目的数据使用,应在获得授权方同意后,方可以搜集、使用其他企业的数据信息,且在使用的过程中,应当严格遵守双方对数据使用的约定,不能破坏他人的技术措施,不能对被采集一方产生实质性替代后果,通过其他手段不正当获取数据。(张彬彬)

  

中国知识产权报社   版权所有
联系地址:北京市海淀区西土城路6号 邮编:100088 电话:010-82803888-6002 邮箱:nipso@cipnews.com.cn ICP备案编号:京ICP备15001074号-6

京公网安备 11010802036826号