数据合规之算法合规（上）——概念、应用及合规问题

首页 > 出版刊物 > 专业文章 > 数据合规之算法合规（上）——概念、应用及合规问题

作者：张丹　2021-08-20

[摘要]伴随着互联网、云计算、大数据与人工智能的深度融合，“万物互联、人人在线、事事算法”的人工智能时代悄然而至。

前言

伴随着互联网、云计算、大数据与人工智能的深度融合，“万物互联、人人在线、事事算法”的人工智能时代悄然而至。算法开始呈现越来越大的影响，日益成为社会关注的问题，算法将被应用到更多的领域中，从方方面面影响我们的生活。但算法崛起也对法律规制提出了挑战，由于算法本身所具有的不可解释性、结果不确定等特征，使得算法在提升社会效率的同时也带来了很多问题，如算法歧视、信息茧房等，它可能挑战人类的知情权、个体的隐私与自由以及平等保护。2021年8月3日，全国信标委发布了《信息安全技术机器学习算法安全评估规范（征求意见稿）》，预示着算法相关的标准已经在出台的路上。本文将从算法的概念、应用场景、合规问题、企业应对等几个方面就算法合规问题进行分析探讨。

算法的概念

算法的本义是指能够用来计算、解决问题和做出决定的一系列有条理的步骤，就如同患者遵循医院的流程挂号、看病、取药。随着技术的发展，算法通过采集不同维度具有相对关系的大数据，运用更为复杂的规则原理进行分类、推理、预测等自动化决策或辅助决策。也就是说算法通过代码层而决定了内容层。

《未来简史》的作者曾预言，在未来，随着科技的发展，计算机科学发展人工智能的电子算法与生命科学研究生命的生化算法将会融合，未来将会形成由算法联接万物的“万物互联网”；算法将发展出人类无法理解、统治人类的新型生命，即智人。《未来简史》将算法的重要性、影响力提到了相当高的程度，也可从侧面看出，未来算法将对人类影响至深。

应用场景

日常生活中，算法被频繁使用于各领域，搜索结果的排序、精准营销、个性化推荐、精准扶贫、精准助学、商业战略、绩效管理乃至人们每天上班导航的路径，无不依赖算法所做出的决策。

如某短视频平台所使用的推荐算法，其具体规则是：经审核发布的短视频，系统会自动分配给一个初始流量池，比如面向500个用户的曝光量，平台会根据这500次曝光所产生的数据，如完播率、点赞、关注、评论、转发等给短视频作者的账号进行加权，如算法判断需要加权，平台会挑选该账号的部分优质作品赠送上万次的曝光。除此之外，平台对经算法判断优质的作品会给予更大的加权，如推荐给标签匹配的用户，或将其列入精品短视频，一旦成为精品短视频，几乎每位用户都有机会刷到该短视频。由于短视频平台上每天上传的视频数量非常大，需要科学的算法技术提升管理质量，试想，如果没有不断优化的算法，用户在海量的视频池中寻找到有用的或感兴趣的视频将变得困难。

再如市场垄断的算法共谋，该算法的规则是：两个或两个以上相互竞争的企业通过使用相同或类似的定价算法，并依据市场数据实时调整价格，通过该算法应对其他平台价格变动，从而实现与竞争对手的价格保持匹配，客观上使得主要竞争者之间形成了一个隐形的价格联盟，该种联盟会导致价格固定、非竞争性市场以及限制其他市场主体进入等，不利于市场开放竞争的同时也损害了消费者的权益。

从上述算法应用中可以看出，算法具有两面性，如推荐算法基于对用户的个人画像，向用户推荐其喜爱的产品或服务，客观上减少了用户自我检索的时间，平台还会将已经过数据验证的优质短视频推荐给用户，也让用户不必在海量的视频中浏览那些低质量的视频。但算法也有“恶”的一面，如信息茧房、算法歧视、算法杀熟等。以算法杀熟为例，商家通过追踪每个用户的线上行为、基本资料等，对用户进行画像，洞察用户的喜好、消费行为、支付意愿等，由于老用户积累了大量的数据，商家据此可以推测出老用户的价格敏感度、消费能力、支付意愿等，从而给出更高的定价。

算法作为一项技术并不具备中立性，算法的“善恶”不在于算法技术是否中立，而在于算法的开发者或使用者持有怎样的价值取向。如果运用合理，算法不仅可以增强客户粘性，提升企业效益，也可以帮助用户实现更为有效的决策；但如果算法的开发者或使用者仅仅商业利益至上，则可能损害公共利益或消费者权益。

合规问题

随着越想来越多基于数据的算法被运用于各个场景，同时将更多的问题投射出来。从前述算法的应用场景可进一步分析，算法可能产生如下合规问题：

1. 个人信息的违法处理

算法的有效性需要大数据的训练喂养，比如算法杀熟，如数据不够多，维度不够丰富，算法的有效性就要大打折扣，这也是为什么该算法只针对老用户，新用户在平台上的数据量不够支撑进行数据分析。因而，相当多的企业通过各种渠道获取数据，如为了提升人脸识别算法的精准度，企业甚至通过爬虫技术从互联网公开渠道获取戴口罩的人脸信息。虽然从互联网渠道获取已公开的个人信息无需取得个人同意，但企业应当在合理范围内处理，对个人权益有重大影响的，应当取得个人同意。除此之外，企业利用爬虫技术侵入他方计算机系统还可能侵犯他方的数据权益或触犯非法获取计算机信息系统数据罪。

作为对《个人信息保护法》的响应，2021年8月1日最高院发布了《关于审理使用人脸识别技术处理个人信息相关民事案件使用法律若干问题的规定》，明确规定基于个人同意处理人脸信息的，未征得自然人或者其监护人的单独同意，或者未按照法律、行政法规的规定征得自然人或者其监护人的书面同意属于侵害自然人人格权益的行为。

算法的开发和使用过程中，不仅仅涉及个人信息的获取，也会涉及个人信息的存储、分析、加工、使用、对外提供等，皆应遵守相关法律法规、政策性文件、国家标准，由于该问题可在个人信息保护范畴探讨，在此不赘述。

2.算法杀熟

算法杀熟事件已曝光多次，往往是用户在更换账号购买产品或服务时才能发现，日常无法感知。由于用户对某一软件的依赖，或者由于商家/平台的垄断地位，用户无法作他选择，商家/平台利用用户黏性以获取更高的收益。在旅游行业的数据杀熟事件发酵后，主管部门很快发布《在线旅游经营服务管理暂行规定》，明确了在线旅游经营者不得滥用大数据分析等技术手段，基于旅游者消费记录、旅游偏好等设置不公平的交易条件，侵犯旅游者合法权益。

算法应当促进消费者和公共利益，而不是为了满足市场主体的商业利益，大数据杀熟明显是为了满足市场主体的超额利润而严重侵害消费者的权益，《个人信息保护法》明确指出要对大数据杀熟作出有针对性的规范，可以预测，数据杀熟将面临严格的法律规制。

3. 算法歧视

算法的有效性依赖于对已有数据的加工分析，如所使用的基础数据本身存在瑕疵或算法的设置存在歧视，那么算法结果必然失去客观性和准确性。例如，在美国进行人脸识别的算法训练，如果所使用的数据大都是白人的数据，那么就可能无法识别亚裔或非裔，对其他种族形成歧视。算法可能会固化歧视与偏见，使其更难被发现、更难以矫正。

又如“苹果税现象”，复旦大学曾做过一项研究，在国内5 个城市进行了800多次打车测试后发现，当用户选择一键呼叫" 经济型+舒适型" 两档时，与非iPhone手机用户相比，iPhone手机用户更容易被价格更高的舒适型网约车司机接单，比例为非iPhone手机用户的3倍。该算法造成了对不同乘客的差别待遇，形成算法歧视。《关于平台经济领域的反垄断指南》第十七条规定，具有市场支配地位的平台经济领域经营者，无正当理由对交易条件相同的交易相对人实行差异性标准、规则、算法进而实施差别待遇属于滥用市场支配地位的情形。由于算法所具有的隐蔽性，算法的歧视性可能难以被发现，然而一旦被发现，开发者/使用者可能面临民事赔偿以及行政处罚。

4. 信息茧房

算法推荐技术在给用户带来了一定便利的同时，也使得其陷入重复获得自己兴趣领域内的信息，从而丧失了获得更广阔范围领域信息的机会。好比将自己的生活桎梏于像蚕茧一样的“茧房”中，不能了解不同的事物、不能获得不同的视角，最终产生根深蒂固的偏见。这种基于个体的偏见如形成普遍现象，将对我们所倡导的和谐社会产生深刻影响。有鉴于此，下述规定通过向个人赋权的形式给予用户自决权。

如《数据安全管理办法（征求意见稿）》第二十三条规定，网络运营者利用用户数据和算法推送新闻信息、商业广告等，应当以明显方式标明“定推”字样，为用户提供停止接收定向推送信息的功能；用户选择停止接收定向推送信息时，应当停止推送，并删除已经收集的设备识别码等用户数据和个人信息。《信息安全技术个人信息安全规范》第7.5条也对个性化展示的使用作出了限制，包括在向个人信息主体提供业务功能的过程中使用个性化展示的，应显著区分个性化展示的内容和非个性化展示的内容；在向个人信息主体提供电子商务服务的过程中，根据消费者的兴趣爱好、消费习惯等特征向其提供商品或者服务搜索结果的个性化展示的，应当同时向该消费者提供不针对其个人特征的选项。而有望年内发布的《个人信息保护法》第二十四条也规定了通过自动化决策方式进行商业营销、信息推送，应当同时提供不针对其个人特征的选项。

在个人信息保护领域，个人赋权是欧盟乃至多数国家所认可的保护个人信息权益的途径，在已知的法律法规、规范性文件中已明确了自然人的查询、复制、修改、删除等权利，在《个人信息保护法》中又提出了个人的可携带权，即“个人请求将个人信息转移至其指定的个人信息处理者，符合国家网信部门规定条件的，个人信息处理者应当提供转移的途径”。虽然相关规定明确了自然人可拒绝基于个人特征的展示或推送，但是对于算法在其他场景下的应用问题仍旧没有明确的规制。

5.算法共谋

如上文所述，通过算法共谋可以自动达成垄断协议，在传统的市场中，一般是经营者开会签署协议或形成会议纪要的方式实现垄断，但在新经济时代，通过算法设计和数据的传递就能自然实现横向垄断或纵向垄断的效果。共谋行为会对市场和消费者造成巨大的危害。当具有竞争关系的经营者之间利用技术手段、平台规则、数据和算法等方式，达成、实施垄断协议，排除、限制相关市场竞争时，可能导致其他经营者自主定价权被剥夺、消费者利益受到侵害、市场的价格信号被扭曲、市场资源浪费，甚至导致其他经营者被打压，阻碍整个行业技术生产的进步。

然而，算法共谋的前提是市场参与者有共谋的故意，通过算法手段达到垄断市场的目的，随着市场日渐趋于透明，市场参与者即使没有共谋的故意，也可能由于算法的趋同而客观上达到垄断市场的目的，如何界定市场参与者的共谋，如何有效审查算法可能是个执法难题。

6.侵害劳动者权益

去年引起社会广泛关注的外卖算法系统，某些互联网平台利用算法设置外卖骑手的配送时间，送餐时间被压缩得越来越短，外卖骑手为了在时限内完成送餐，违反交通规则的情形时有发生，对外卖骑手的生命健康造成严重威胁。而且，这个算法系统采用自动化的机器决策，骑手很难理解和提出抗议。无独有偶，在南京市建邺区工作的部分环卫工人陆续接到了公司配发的一款智能手环，并被要求在上班期间佩戴。手环除了具备定位功能外，只要环卫工人上班期间在原地停留20分钟，手环就会自动发出“加油”的语音，提示环卫工人继续工作。

可以理解，外卖算法的目的一是为了增强用户粘性，形成竞争优势，最终获取更多市场份额；二是实现对众多外卖骑手的有效人力资源管理。但是算法中没有更多加入公共规则的考量，当效率优先成为算法使用者的价值取向，就会忽视个人权益。很快，政策制定者发布了《关于维护新就业形态劳动者劳动保障权益的指导意见》，提出“督促企业制定修订平台进入退出、订单分配、计件单价、抽成比例、报酬构成及支付、工作时间、奖惩等直接涉及劳动者权益的制度规则和平台算法，充分听取工会或劳动者代表的意见建议，将结果公示并告知劳动者。工会或劳动者代表提出协商要求的，企业应当积极响应，并提供必要的信息和资料。指导企业建立健全劳动者申诉机制，保障劳动者的申诉得到及时回应和客观公正处理”。

7. 责任承担

以自动驾驶为例，自动驾驶是算法发展最为迅猛和成熟的领域之一，算法的运用让无需依赖驾驶员参与的自动驾驶技术也成为可能，这带来的直接结果就是证明缺陷尤其是人工智能系统层面的缺陷将变得异常困难；同时事故的发生可能无法合理归因于算法的设计或者制造缺陷。那么一旦发生自动驾驶事故，谁应该是责任的承担者，驾驶员、汽车制造商亦或是自动驾驶系统提供者？

本月12日，林先生驾驶某品牌汽车启动自动驾驶功能（NOP领航状态）后，在某高速路段发生交通事故不幸逝世。同月，美国国家公路交通安全管理局对特斯拉自动驾驶系统展开安全调查。工信部于今年1月1日发布《汽车驾驶自动化分级》，对汽车自动驾驶分为6个级别，L0~L2级仍需要驾驶员驾驶，L3~L4为有条件的自动驾驶，L5级为完全自动驾驶，林先生启动的NOP功能属于L2以内的级别，仍旧需要驾驶人驾驶，如非由辅助驾驶功能所导致的交通事故，事故责任恐怕仍由驾驶员承担。但要想证明辅助驾驶功能的缺陷并非易事，车辆数据是否完整未被篡改、功能失效过程是否可以重复并验证，举证责任如何分配等等，都需要通过司法实践来进一步明确。

在《新一代人工智能治理原则——发展负责任的人工智能》第六条共担责任中，倡导人工智能研发者、使用者及其他相关方应具有高度的社会责任感和自律意识，严格遵守法律法规、伦理道德和标准规范。建立人工智能问责机制，明确研发者、使用者和受用者等的责任。可见，目前来说关于新型领域的侵权问题仍旧需要通过实践来明晰。

全站搜索

数据合规之算法合规（上）——概念、应用及合规问题

相关律师

扫码分享