隔靴如何搔痒:问责算法

一、“黑箱”的烦恼

机器学习技术的兴起让人工智能成为近几年来最为火热的技术之一,各行各业都开始陷入人工智能的狂热之中。目前大部分机器学习算法,都是基于人工神经网络(Artificial Neural Network,即ANN)来构建的。人工神经网络是由大量处理单元互联组成的非线性、自适应信息处理系统。它是在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理

人工智能对法律的挑战同样存在,算法的不透明是其中最为重要的挑战之一,决策依据不透明导致风险不可控,而神经网络的决策过程也被视为“黑箱”。

当王思聪在新浪微博上的抽奖暴露出新浪微博抽奖算法对男性用户的歧视;当华为手机采用人工智能优化了CPU、GPU、NPU等性能的调度,在识别跑分测试应用程序会智能开启“性能模式”来提供最强的性能,当短视频疯狂根据浏览习惯推荐视频;当百度搜索把QQ邮箱的“山寨版”置于搜索结果首位……尽管这些算法未必都与神经网络或是机器学习有关,但算法对法律的挑战已经来到前台。

二、隔靴照样搔痒——问责“黑箱”

尽管人们尝试过使用开放源代码这样的方式对抗“黑箱”,但效果并不尽如人意,而且开源在很多领域并不现实。同样,即使是要求算法具有可解释性也不具有实际意义,目前神经网络根本没有办法被解释。

在2018年1月11日,今日头条召开了一场旨在推动整个行业来问诊算法、建言算法的分享交流会。资深算法架构师、中国科学技术大学计算机博士曹欢欢,在今日头条总部带来了题为《让算法公开透明》的分享,面向行业公开算法原理,消除社会各界对算法的一些误解,同时接受意见和建议。但到了2018年4月,因为“快手”“火山小视频”直播短视频平台传播涉未成年人低俗不良信息导致社会舆论反映强烈,国家网信办于4月4日依法约谈“快手”和今日头条旗下“火山小视频”相关负责人,提出严肃批评,责令全面进行整改。国家网信办依据《网络安全法》《互联网信息服务管理办法》《互联网直播服务管理规定》等法律法规,要求“快手”“火山小视频”暂停有关算法推荐功能,并将违规网络主播纳入跨平台禁播黑名单,禁止其再次注册直播账号。

在国务院2017年7月发布的《新一代人工智能发展规划的通知》中,提出建立人工智能安全监管和评估体系:

“建立健全公开透明的人工智能监管体系,实行设计问责和应用监督并重的双层监管结构,实现对人工智能算法设计、产品开发和成果应用等的全流程监管。促进人工智能行业和企业自律,切实加强管理,加大对数据滥用、侵犯个人隐私、违背道德伦理等行为的惩戒力度。”

可以预期,中国会采取设计问责+应用监督的监管模式,控制有害算法结果的输出,并确保算法决策受到与人类决策相同的规制。实际上,法律也从来没有回避过“黑箱”,或者说“黑箱”对法律来说不是一个多么严重的问题。算法无论是开源、“黑箱”或者是商业秘密,监管从来都不会缺席。在各国的立法以及国家标准中,也越来越频繁将算法纳入规制的对象。

《电子商务法》

第十八条 电子商务经营者根据消费者的兴趣爱好、消费习惯等特征向其提供商品或者服务的搜索结果的,应当同时向该消费者提供不针对其个人特征的选项,尊重和平等保护消费者合法权益。

《个人信息安全规范》

当仅依据信息系统的自动决策而做出显著影响个人信息主体权益的决定时(例如基于用户画像决定个人信用及贷款额度,或将用户画像用于面试筛选),个人信息控制者应向个人信息主体提供申诉方法。

《通用数据保护条例》(欧盟GDPR)

第22条 数据主体有权不受仅基于自动化处理行为得出的决定的制约,……

在“魏则西事件”发生后,国家网信办会同国家工商总局、国家卫生计生委和北京市有关部门成立联合调查组进驻百度公司。要求“改变竞价排名机制,不能仅以给钱多少作为排位标准。立即调整相关技术系统,在2016年5月31日前,提出以信誉度为主要权重的排名算法并落实到位……

三、责任承担——“黑箱”攻防

对于算法的使用者来说,“黑箱”是免责(或者说逃避责任)的利器,仿佛人工智能真的具有智能可以承担责任一样。机器学习“黑箱”的法律最大的挑战,可能在于对因果关系的重新构建,让因果关系可能不再局限于法律主体之间。有观点认为如果机器学习的行为没有办法被预见,那么机器学习导致损害的责任也没有办法进行分配。大量基于科幻电影的法学研究喜欢赋予人工智能或是机器人所谓“人格权”,以解决责任承担的问题。

但当真如此吗?“黑箱”虽然可以阻断因果关系,但并不会成为可以不承担责任的理由。从大陆法系侵权法的角度,黑箱所带来的因果关系不明并不是什么严重问题。法律意义上的因果关系不是哲学意义上的因果关系,更不是佛教中的“因果”。法律上的因果关系是指行为与结果之间决定与被决定,引起与被引起之间的关系。

根据相当因果关系说的理论

事物之间的因果关系是事物普遍联系和相互制约的反映形式之一,它是客观的,独立于人们的意识之外的,它不依人的意志为转移。但是人们对因果关系的认识,是要受制于人类的知识水平的。事物之间联系的复杂性、人类认识能力的有限性、信息占有的不完全性等等,使得人们不可能完全认识事物之间的因果关系。从而,人们对特定事件之间的因果联系的判断也只能是在现有的认知条件和信息状况下,对因果关系作出一个大致的判断。因而,因果关系的认定就不完全是一个逻辑推演的过程,而只是一个可能性的判断过程。

即使是无法识别责任,从保护被害人的角度,也可以使用举证责任倒置这一利器。

四、算法之争:今日头条诉百度案

在2018年,还有一个颇为有趣的案例——“今日头条诉百度不正当竞争案”。今日头条称接到用户举报,在百度搜索“今日头条”相关内容,排序第一的搜索结果,是由百度“百家号”发布的今日头条被要求整改的文章。排序第二的搜索结果,是“今日头条官网”,却用红字标出警告:“提醒:该页面因服务不稳定可能无法正常访问。”

百度方面则认为:百度的自然搜索结果排序,与用户需求、相关性、时效性、用户的点击行为等一系列因素相关。“今日头条指责的‘旧闻’搜搜结果与今日头条近期因内容低俗被相关部门处罚整改的社会热点密切相关,也与用户寻找多样化的资讯类app需求相契合,因此排列靠前不足为奇。”

《反不正当竞争法》

第十二条 经营者不得利用技术手段,通过影响用户选择或者其他方式,实施下列妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为:

(一)未经其他经营者同意,在其合法提供的网络产品或者服务中,插入链接、强制进行目标跳转;

(二)误导、欺骗、强迫用户修改、关闭、卸载其他经营者合法提供的网络产品或者服务;

(三)恶意对其他经营者合法提供的网络产品或者服务实施不兼容;

(四)其他妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为。

我刚才搜了一下,案件似乎还没有开庭的迹象。这个案件有意思的地方,在于今日头条提供初步证据的情况下,法院会如何认定搜索算法这种“技术手段”,是要求百度解释算法?还是直接追究百度使用算法的责任?无论结果如何,都会具有深远的影响。

五、没有结论

这篇小文章只是阶段性的一些思考,本来想一鼓作气写一篇论文,但总是心有余而力不足,遂先记录下些许想法,待时机成熟再扩充了。

对于算法的法律问题,早已经超越了算法能否申请专利这样的“简单”问题。当算法在我们生活中所扮演的角色越来越重要,我们的决策越来越依赖算法,那么责任的承担,因果关系的建立都成为了法律需要直面的问题,或者这都不是问题。我不知道,也没有答案。只是感觉算法的法律问题思考下去会是一条颇为有趣的旅途,尽管终点未必会如预期,但路途两边的风景已经足够美丽。

法律科技:砝码、桥梁与超维

受百事通与律新社的邀请,参加了第三届新兴法律服务业博览会暨Legal+高峰论坛。说起来我一直都是法律科技活动的常客,每参加一次类似的活动都会有些新的思考。拿出来分享,供大家批判。

根据维基百科的解释,法律科技即指通过利用技术提供的法律服务,传统上法律科技仅指运用技术与软件帮助律师事务所进行管理、文件存储、计时、记账与电子证据开示。而近年来,对法律科技的运用早已不局限于律师事务所与律师,司法机关、公证机关、公司法务都开始在自己的工作中有意无意地在工作中频繁利用各种法律科技。

感觉很难去给“法律科技”下一个准确的定义,在不同的时期、背景都有着不同的科技影响着我们寻求正义之路,想厘清法律科技对法律行业的影响,就需要先从历史、技术、产品等不同纬度对法律科技进行梳理。更重要的是着眼于当下正在影响法律行业的科技,以互联网为基础的各种科技产品的广泛运用,正在给整个法律行业带来翻天覆地的影响。 继续阅读法律科技:砝码、桥梁与超维

区块链立法的起点:《区块链信息服务管理规定(征求意见稿)》

为规范区块链信息服务,国家网信办发布在2018年10月19日就《区块链信息服务管理规定》公开征求意见,这也是我国首次就国家级区块链法规公开征求意见。《区块链信息服务管理规定》公开征求意见意味着金融以外的区块链应用被监管者纳入视野,区块链立法开始进入“快车道”。

一、管辖范围

区块链信息服务,是指基于区块链技术或者系统通过互联网站、应用程序等形式,向社会公众提供信息服务。根据《互联网信息服务管理办法》,互联网信息服务包括:

  • 向上网用户有偿提供信息(经营性)
  • 网页制作等服务活动(经营性)
  • 向上网用户无偿提供具有公开性、共享性信息的服务活动(非经营性)

而通过区块链提供上述服务,即可能被纳入《区块链信息服务管理规定》认为是提供区块链信息服务。区块链的本质是分布式记账(记录信息)系统,在理论上所有的区块链系统都在提供信息服务,包括为最高人民法院所认可的区块链存证服务,都被《区块链信息服务管理规定》纳入管辖范围。

在主体方面区块链信息服务提供者,包括:

  • 向社会公众提供区块链信息服务的主体或者节点;
  • 为区块链信息服务的主体提供技术支持的机构或者组织。

《区块链信息服务管理规定》拟将节点提供者也认为是区块链信息服务提供者,而根据区块链去中心化的特点,所涉及的主体会远超想象。以比特币为例,只要在自己的电脑上下载了完整的钱包,即成为比特币系统的节点,也就属于区块链信息服务提供者。除此以外,技术支持机构也被定义为区块链信息服务提供者,极大拓展了《区块链信息服务管理规定》拟管辖的主体。

二、监管

区块链信息服务监管拟分为国家与地区(省级)两级。根据区块链分布式的特点,或许国家网信办需要承担更多的监管职责。如果基于区块链提供从事新闻、出版、教育、医疗保健、药品和医疗器械等服务,还需要获得相关领域主管部门的审核。

开展区块链信息服务,需要在国家网信办的系统中提交以下信息:

  • 服务提供者
  • 服务类别
  • 服务形式
  • 应用领域
  • 服务器地址
  • ……

《区块链信息服务管理规定》拟要求区块链信息服务提供者在开发上线新产品、新应用、新功能的,应当按有关规定报国家和省、自治区、直辖市互联网信息办公室进行安全评估。这可能会导致多重监管的问题,工信部传统上负责互联网新技术新业务安全评估,并在2017年曾就《互联网新业务安全评估管理办法》公开征求意见。如果网信办、工信部不进行有效协调,那么区块链开发者在推出新产品、新应用、新功能时,可能不得不需要向多个部门申请安全评估。

三、合规

在《区块链信息服务管理规定》中,拟要求区块链服务提供者主要从以下几方面进行合规:

  • 落实信息内容安全管理主体责任
  • 配备与服务规模相适应的专业人员和技术能力
  • 建立健全用户注册、信息审核、应急处置、安全防护等管理制度
  • 应当具备对违法内容发布、记录、存储、传播的即时和应急处置能力
  • 制定和公开管理规则和平台公约,与区块链信息服务使用者签订服务协议
  • 配合监督检查、设立举报入口
  • 发布内容与日志保留不少于六个月

更进一步,《区块链信息服务管理规定》拟要求区块链信息服务使用者落实网络实名制。在《网络安全法》中,实名制的要求仅限于:

  • 为用户办理网络接入、域名注册服务
  • 办理固定电话、移动电话等入网手续
  • 为用户提供信息发布、即时通讯等服务

区块链信息服务或许是被监管者认为属于为用户提供信息发布服务,而被要求网络实名制。

四、区块链信息服务提供者的法律责任

序号 行为 法律责任
1 填报虚假备案信息 暂停服务,限期整改注销备案
2 制作、复制、发布、传播法律法规和国家有关规定禁止的信息内容 警告、责令限期改正暂停服务处五千元以上三万元以下罚款

关闭服务

构成犯罪的,依法追究刑事责任

3 未在其网络平台上标明其备案编号 责令限期改正给予警告,并处五千元以上一万元以下罚款
4 未按本规定履行备案手续 责令限期改正给予警告,并处一万元以上三万元以下罚款
5 区块链信息服务存在信息安全隐患的 责令限期整改、暂停服务
6 未按规定办理变更、注销手续 警告、责令限期改正责令暂停服务,处五千元以上三万元以下罚款构成犯罪的,依法追究刑事责任
7 未落实合规义务
8 未进行新产品、新应用、新功能的评估
9 未落实网络实名制 责令改正处五万元以上五十万元以下罚款暂停相关业务、停业整顿、关闭网站、吊销相关业务许可证或者吊销营业执照

直接责任人员处一万元以上十万元以下罚款

10 未对违法信息进行有效处理 责令改正,给予警告,没收违法所得处十万元以上五十万元以下罚款,并可以责令暂停相关业务、停业整顿、关闭网站、吊销相关业务许可证或者吊销营业执照直接负责的主管人员和其他直接责任人员处一万元以上十万元以下罚款
11 内容日志留存未达到六个月 责令改正,给予警告处一万元以上十万元以下罚款对直接负责的主管人员处五千元以上五万元以下罚款

数据时代的数据规则:淘宝诉美景不正当竞争纠纷案

案件名称:淘宝(中国)软件有限公司诉安徽美景信息科技有限公司不正当竞争案
案号:(2017)浙8601民初4034号
原告:淘宝(中国)软件有限公司(“淘宝公司”)
被告:安徽美景信息科技有限公司(“美景公司”)
审理法院:杭州铁路运输法院
裁判结果:美景停止不正当竞争行为,赔偿淘宝人民币200万元。 继续阅读数据时代的数据规则:淘宝诉美景不正当竞争纠纷案

重要数据,如何重要

“重要数据”是一个法律概念。

在《网络安全法》中,“重要数据”被不止一次提到:第二十一条要求网络运营者应当按照网络安全等级保护制度的要求,采取数据分类、重要数据备份和加密等措施;第三十七条要求关键信息基础设施的运营者在中华人民共和国境内运营中收集和产生的个人信息和重要数据应当在境内存储。因业务需要,确需向境外提供的,应当按照国家网信部门会同国务院有关部门制定的办法进行安全评估。

重要数据直接关系到等级保护与数据跨境传输两大制度,不可谓不重要,但在《网络安全法》却缺少相应的定义。

在信标委征求意见的《信息安全技术 数据出境安全评估指南(征求意见稿)》(“评估指南”)中,将重要数据定义为:“相关组织、机构和个人在境内收集、产生的不涉及国家秘密,但与国家安全、经济发展以及公共利益密切相关的数据(包括原始数据和衍生数据)。”并且将政府信息公开渠道合法公开的数据,排除出重要数据的范围。评估指南还以附录的形式,列了非常详细的重要数据识别指南。

近日,中央网络安全和信息化委员会办公室、工业和信息化部开展“个人信息和重要数据安全专项调查”,在中国互联网协会的《专项调查问题列表与答复》(“答复”)重要数据是指:不涉及国家秘密,但如果泄露、窃取、篡改、毁损、丢失和非法使用可能危害国家安全、国计民生、公共利益的未公开数据,包括:
(1)地理、自然资源、重要物资储备等数据;
(2)基因、生物特征、疾病等数据;
(3)宏观统计等重要经济数据;
(4)网络信息系统的缺陷、漏洞、防范措施等数据;
(5)人群导航位置、大型设备目标位置和移动数据;
(6)法律法规规定的其他重要数据。

较之于评估指南中事无巨细的27大类,答复只分了6大类,即使算细分也只有11类,无疑是缩小了重要数据的范围。但还是需要注意,答复并不是正式的法律文件,不具有法律效力。答复只是提供了未来重要数据划定范围的一个趋势。