翻唱、编曲、改编与修改的边界——AI时代音乐侵权认定标准的反思与重构

首页 > 出版刊物 > 专业文章 > 翻唱、编曲、改编与修改的边界——AI时代音乐侵权认定标准的反思与重构

作者：周魏捷　2026-04-10

近期，李荣浩公开指责单依纯在授权被明确拒绝后仍在深圳演唱会上演唱《李白》。事件本身的法律定性并不复杂，著作权人拒绝授权后仍然使用，就是侵权。但真正值得讨论的，不是“未授权翻唱是否侵权”这种教科书里已有答案的确定问题，而是在这个时代这一事件背后所呈现出的三个更深层的困惑。一是编曲改动到什么程度才触及改编权？二是传统的“实质性相似”认定标准还能不能用？三是当AI既能创作音乐又能鉴定抄袭时，整套侵权认定范式是否需要重构？

李荣浩在长文中其实提供了一个音乐理论层面的判断：“从和弦到律动并无太大变化，把真鼓改成电鼓，前后加的几段，我理解比喻成一本书换了个书皮。”这句话实际上提到了音乐在著作权法中最棘手的问题之一——翻唱与改编的边界。而不少听众认为单依纯版本“很难听”这一评价，其实又把保护作品完整权这一权利推上了台面。

本文试图从这些被公众讨论忽略的真问题出发，结合司法实践和音乐技术分析框架，探讨AI时代音乐侵权认定的可能发生的变化。

一、编曲行为的困境：翻唱、改编与“改得难听”

（一）三项权利的内涵与外延区分

讨论单依纯事件，先要厘清三项容易混淆的权利：

修改权是作者自己的权利，指作者有权在思想或观点发生变化时对已发表的作品进行修改，以维护人格与表达的一致性。保护作品完整权针对他人的损害性改动，核心是“歪曲篡改”。改编权针对他人的创造性改动，核心是“产生了新的独创性表达”。

三者的逻辑互不替代。获得改编权许可不等于可以歪曲原作；改编结果超出原作基本表达可能构成违约；仅获得修改权许可不足以支持产生新作品的改编。

（二）编曲：法律上的尴尬地位

编曲在我国著作权法中没有独立地位。《著作权法》和《著作权法实施条例》均未使用“编曲”概念，也未规定编曲者的权利。

司法实践中对编曲的态度经历了明显演变。早期的代表性案例是2003年北京市海淀区人民法院审理的“《常来常往》案”。该案中，编曲者主张其对歌曲《常来常往》的编曲享有著作权，但法院认定编曲曲谱“只是对原曲进行了乐器配置、声部分工、组合，并没有改变乐曲作品的基本旋律”，编曲过程“仅是一种劳务性质的工作”，不具有著作权法意义上的独创性。这一判决在此后相当长的时间内塑造了“编曲无版权”的普遍观念。

但这一观点近年来随着时代发展发生了变化。2024年，北京互联网法院审结了一起编曲者以音乐作品作者身份主张权利的案件。该案中，原告苏某某在另一原告清唱歌词的基础上进行编曲创作并配乐，形成涉案音乐作品。法院认定编曲内容“具有独创性，是该作品不可或缺的组成部分”，编曲者可以作为音乐作品的创作者之一主张权利。这是国内司法实践中将编曲纳入音乐作品著作权保护的重要突破。

从《常来常往》到这一新判例，司法态度的变化说明法院正在走出“音乐作品＝旋律”的单一认知，开始承认非旋律要素的独创性价值。在流行音乐创作实践中，“作曲人”交付的DEMO通常只包含主旋律或主旋律加简单和声，其余全部声部由编曲人完成——西方流行音乐行业对此有明确的分工区分：Songwriter（负责旋律与歌词）与 Arranger／Producer（负责编曲、配器、制作）分属不同工种，各自的创造性贡献在署名和版税分配中均有体现。

学术界和实务界对编曲的法律保护路径有三种观点：作为演绎作品保护、作为邻接权对象保护、纳入音乐作品保护。共识尚未形成，翻唱与改编的边界在实务中因此缺乏清晰标准。

（三）单依纯版《李白》：翻唱还是改编？

回到事件本身。根据公开信息，单依纯版《李白》的编曲由音乐人常石磊操刀，主要改动包括：

●配器框架转换：原曲的摇滚真鼓替换为电子鼓，叠加合成器音效

●新增念白段落：加入口语化念白“如何呢？又能怎？”，融入游戏台词元素

●结构调整：前后增加段落，整体风格从原曲的流行摇滚转向电子化处理

对于这些改动的幅度，各方的判断完全不同。李荣浩作为著作权人认为“从和弦到律动并无太大变化，把真鼓改成电鼓……比喻成一本书换了个书皮”；而不少媒体和乐评人则认为改动幅度远不止“换了个书皮”，常石磊的编曲对原曲的配器框架和整体风格做了根本性的转换。

这正是问题所在。在缺乏客观技术比对工具的情况下，各方对“改了多少”的判断完全取决于立场和主观感受。如果用音乐理论的分析框架来看，需要逐一检视各个要素：

在没有对两个版本进行系统的和声分析、节奏比对和频谱检测的情况下，任何一方对改动幅度的判断都是主观的。 这恰恰说明，翻唱与改编的边界在当前的判断体系下缺乏客观标准，而这正是AI辅助技术分析可以介入的地方。

无论最终如何定性，有一点是确定的：即便认定构成改编，同样需要改编权许可；而改编涉及的权利许可比翻唱更多。

（四）“改得难听”与保护作品完整权

不少听众认为单依纯版《李白》“很难听”，这是否触及保护作品完整权？

应该予以厘清的是，“难听”是审美判断，“歪曲篡改”是法律判断，二者不能等同。

保护作品完整权的核心不是改编后好不好听，而是改动是否损害了原作者的声誉，或让公众对原作产生错误认知。如果听众能区分“这是单依纯的演绎版本”和“《李白》原来就是这样”，那么即便效果不佳，也难以构成法律上的“歪曲”。但如果改编版本广泛传播导致公众将其与原作混同，原作者声誉因此受损，则保护作品完整权的适用空间就打开了。

这个判断在传统场景下还不算难。但AI时代的问题是——当AI可以在几秒内生成数百个编曲版本，有的只换了音色，有的面目全非，传统的翻唱/改编二分法面对这种程度的改动，需要更精细的判断工具。

二、域外音乐侵权认定的标准之争

（一）风格也能构成抄袭吗？——Blurred Lines案

2015年，美国洛杉矶联邦地区法院陪审团认定Robin Thicke和Pharrell Williams的《Blurred Lines》侵犯了Marvin Gaye《Got to Give It Up》的版权，判赔730万美元（后降至530万美元加未来版税的50％）。

值得注意的是，两首歌的旋律和歌词完全不同。法院认定侵权的依据是节奏部分（rhythm section）的“feel”——听感上的氛围相似性。2018年，第九巡回上诉法院以2:1维持判决。

异议法官Jacqueline Nguyen的表述至今被广泛引用：该判决“允许Gaye家族做到了前人从未做到的事——给一种音乐风格注册版权（copyright a musical style）”。判决后超过200名制作人签署法庭之友意见书，警告这将引发“版权淘金热”。

这个案件的影响在于，它把侵权认定标准从“旋律是否相似”扩展到了“律动和氛围是否相似”这个模糊地带。

（二）“基本构建模块”不受保护——Sheeran案和Dark Horse案的回摆

但美国司法并没有沿着Blurred Lines的方向走下去。两个后续案件的走向相反。

Ed Sheeran案（2023一审/2024二巡维持/2025最高院拒绝再审）：Sheeran的《Thinking Out Loud》被指控抄袭Marvin Gaye（又是他）的《Let’s Get It On》。陪审团仅用3小时便认定不侵权。第二巡回上诉法院明确指出：“即便组合在一起，涉案的四和弦进行与切分节奏型也过于缺乏独创性，不足以获得版权保护”（too unoriginal for copyright protection）。最高法院拒绝受理上诉，终局确认。

Katy Perry的Dark Horse案（2019一审/2022九巡推翻）：基督教说唱歌手指控Dark Horse抄袭其歌曲Joyful Noise中的一段八音符组成的固定音型（ostinato）。陪审团一度判赔280万美元，但第九巡回上诉法院推翻判决，认定该音型属于“缺乏足够独创性的常见音乐元素”（commonplace musical elements lacking in sufficient originality），原告寻求的是对“基本音乐构建模块的不当垄断”。

三个案件放在一起看：

这三起案件共同构成了美国现代音乐版权法的演变史。从支持“感觉相似”转向严格保护“创作自由”。同样是“听着像”，一个判侵权两个判不侵权。标准本身的不稳定，才是问题所在。

（三）音乐表达有限性的困境

标准为什么不稳定？根源在于音乐表达的有限性。这个问题需要从音乐理论的角度稍做展开。

调性音乐建立在十二平均律之上，只有12个音级。在此基础上构建的和声体系，常用的和弦进行实际上非常有限。流行音乐中最常见的I－V－vi－IV进行（如C大调下的C－G－Am－F），支撑了从Let It Be到Someone Like You再到无数华语流行曲的和声框架。另一组常见进行i－III－VII－VI（小调下的Am－C－G－F）同样出现在大量作品中。研究者对流行音乐数据库的统计分析显示，排行榜前列歌曲中超过半数的和声进行可以归入少数几种模式。

节奏层面的有限性同样显著。流行音乐的绝大多数作品采用四四拍，常见的鼓组节奏型（drum pattern）也就那么几种基本变体——底鼓落在第一、三拍，小军鼓落在第二、四拍，这个框架覆盖了摇滚、流行、R＆B的大部分作品。就连较为复杂的切分节奏（syncopation），可变化的空间也远小于听众的直觉想象。

旋律的变化空间相对较大，但也受到音域、音程和可唱性的约束。大多数流行歌曲的主旋律活动在一个八度左右的音域内，以级进和小跳为主，大跳较少。在这个约束条件下，旋律片段之间出现相似是一种必然。

更深层的问题在于，音乐的各个要素并不是独立存在的。和声进行会强烈暗示特定的旋律走向——当和弦从属和弦进行到主和弦（V→I）时，旋律落在主音上是最自然的选择；特定的节奏型会导向特定的旋律重音分布。这意味着，当两首歌共享相同的和声进行和节奏型时，它们的旋律在某些片段出现相似几乎是不可避免的——这是音乐语言的内在逻辑决定的，而不是作曲者的主观选择。

四四拍、八分音符律动、蓝调音阶、I－V－vi－IV的和声进行，这些都是音乐的“基本词汇”，如果对这些基本要素主张版权，相当于对语言中的常用词组主张版权。但另一面，当这些基本要素以特定方式组合，形成了可识别的个性表达时，又确实应当受到保护。问题在于阈值，即什么程度的组合才从“公共领域的音乐词汇”变成“受保护的个人表达”？

传统的“接触＋实质性相似”框架回答不了这个问题，因为“实质性相似”的判断高度依赖专家证人的主观意见和陪审团的直觉。不过，在当前时代，AI的介入可能改变这个局面。

三、AI带来的双重变量

（一）AI作为创作工具所涉及的训练侵权与输出侵权

不过在问题尚未解决的情况下，AI音乐生成平台（Suno、Udio等）的出现，使得上述问题进一步复杂化。

2024年6月，美国三大唱片公司（UMG／Sony／Warner）同时对Suno和Udio提起版权侵权诉讼。原告指控这些AI平台通过流媒体翻录（stream-ripping）非法获取版权录音用于模型训练，且生成物与原作“惊人相似”（strikingly similar）。原告在诉状中测试了这些平台——输入针对特定歌曲特征的提示词（如年代、流派、风格描述、艺术家特征等），生成的输出与原作高度相符。

原告还提出了一个新的损害理论——“稀释理论”（dilution theory）。Deezer的数据显示，每天约6万首AI生成音轨上传到该平台，AI内容已占每日新增音乐的约39％。原告主张，大规模的AI生成音乐会“过度挤占”（overrun）版权目录、与真人录音直接竞争、稀释版税池。

两案均在2025年下半年以和解告终。UMG与Udio于2025年10月和解并签署许可协议，Warner与Suno于2025年11月和解，但Sony Music仍未与Suno和Udio达成全局和解，诉讼在部分地区仍在继续。选择许可路径而非对抗到底，传递了行业信号，但也意味着“AI训练是否构成合理使用”这个核心法律问题仍然悬而未决。截至2025年10月，美国联邦法院共有51起版权人诉AI公司的诉讼，合理使用问题上仅有3个法官作出实质性裁决（2个支持AI方，1个反对），下一批判决预计不早于2026年中。

欧洲方面，2025年11月慕尼黑地方法院在GEMA v. OpenAI案中作出了更直接的裁决：模型训练中的“记忆行为”和ChatGPT输出中对歌词的再现均构成版权侵权。法院没有接受OpenAI“模型只学习模式、不存储数据”的抗辩，认为未经许可使用受版权保护的作品，无论在输入端还是输出端，都落入著作权法的管辖范围。

（二）AI作为鉴定工具会产生鉴定方法本身的变化

AI在创作端改变的是“被鉴定对象”，在鉴定端改变的则是“鉴定方法”。

传统的音乐版权侵权鉴定依赖法律音乐学家（亦称司法音乐学家，Forensic Musicologist），围绕三个要素展开：接触（access）——被告是否有机会接触原作；相似性（similarity）——两首歌是否足够相似；独创性（originality）——涉案相似元素是否真正具有独创性，还是在公开技术中普遍存在。

问题在于，这套体系高度依赖专家的主观判断。已有观点认为法律音乐学在诉讼中的“证据使用与滥用”，指出法院对此类证词的使用方式“混淆了陪审团并违反了联邦证据规则”。

AI工具正在进入这个领域。波形比对、频谱分析、模式识别AI已经开始出现在法庭上。西弗吉尼亚大学法学院的研究认为，AI在识别音乐版权侵权方面可能比人耳更准确——AI可以同时分析音高序列和声进行、节奏模式、频谱特征等多个维度，而人耳不可避免受到记忆偏差、审美偏好和“锚定效应”（Anchoring Effect）的影响。

Spotify在2020年前后为一项“抄袭风险探测器”（Plagiarism Risk Detector）技术申请了专利，通过分析歌曲的“旋律谱”（Lead Sheet）——含旋律、和弦和歌词的简化乐谱——与数据库交叉比对，检测和弦序列、旋律片段和声的相似度，生成量化的比对结果。

（三）两个变量的叠加所带来的问题

AI同时出现在创作端和鉴定端，带来一个更加复杂的问题：

在创作端，AI可以生成与特定歌曲“风格接近但旋律不同”的作品。如果一个模型在数万首歌曲上训练后，生成了一首“听起来很像某首歌但不存在旋律抄袭”的作品，传统的“实质性相似”标准应对不了。

在鉴定端，AI可以在任意两首歌之间找到“相似性”——音乐的有限性决定了相似性无处不在。当鉴定工具的灵敏度远超人耳时，侵权阈值应该设在哪里，本身就成了一个新问题。

四、从音乐分析视角看侵权认定标准的调整方向

（一）旋律中心主义的局限

传统的音乐侵权比对集中在旋律线的相似度。在古典音乐和早期流行音乐时代，旋律确实是作品最核心的表达要素，这种做法有其合理性。

但现代音乐的创作逻辑在变。电子音乐中，核心表达往往不在旋律，而在音色设计（sound design）、律动构建（groove）和空间处理（spatial effects）。嘻哈音乐中，beat的构建、采样手法和flow的节奏性表达可能比旋律更具个性。现代流行音乐制作中，制作（production）本身，包含了混音、编曲、音色选择，这些要素越来越成为歌曲辨识度的主要来源。

AI在这些非旋律维度上的学习和复制能力尤其强。一个在大量电子音乐上训练的模型，可以复制特定的drum pattern、bass line设计和合成器音色质感，同时生成完全不同的旋律线。如果侵权认定仍以旋律为中心，这类行为会逃脱规制。

（二）多维度综合评估

音乐理论提供了更精细的分析框架。一首音乐作品的“表达”至少由以下维度构成：

侵权认定不应局限于单一维度，而应做加权综合评估。不同类型的音乐，各维度权重不同：旋律驱动的流行歌曲，旋律相似度权重高；节奏驱动的电子音乐或嘻哈，律动和音色的权重应当上调。

（三）AI辅助鉴定的证据规则建议

如果AI辅助鉴定进入司法实践，以下几点值得考虑：

第一，AI鉴定结果的证据定位。 AI比对结果应当是辅助性的客观证据，不是独立的侵权认定依据。AI提供各维度的量化相似度数据，但是否构成实质性相似的最终判断仍由裁判者结合语境做出。

第二，建立“音乐公共领域数据库”。 AI鉴定工具的一个重要功能，是检索涉案相似元素是否属于音乐的“公共领域词汇”。如果两首歌共享的元素在大量既有作品中普遍存在（如I－V－vi－IV和弦进行、标准四四拍鼓点），该相似性不应支持侵权认定。

第三，区分不同维度的侵权阈值。旋律的复制与和声进行的相似、律动模式的相似，应当适用不同的认定标准。旋律独创性空间较大，较低程度的相似即可构成侵权；和声进行和基本律动因其公共性，需要更高程度的相似。

第四，专家辅助人角色的转变。传统的不会被AI取代，但角色会变——从“用耳朵判断是否相似”转向“解读AI比对数据在音乐理论上的意义”，即哪些相似性是音乐语言的固有特征，哪些反映了创作层面的实质性借用。

五、结语

从李荣浩诉单依纯事件出发，最终面对的问题则是，当AI既能批量生成音乐、又能量化分析相似性时，建立在人耳判断和专家直觉上的传统音乐侵权认定体系，还够用吗？恐怕不够。

音乐侵权认定需要从旋律中心主义转向多维度的综合评估，需要借助AI将“实质性相似”这个模糊判断转化为可量化、可辩论的证据体系，也需要在编曲保护、改编权边界等传统难题上形成更清晰的规则。

著作权法的目的不是阻止创作，而是在保护创作者权益和促进文化繁荣之间找平衡，而在AI时代这个平衡点需要重新校准。校准的前提是真正理解音乐，不只是理解法条怎么写，还要理解旋律为什么动人、律动为什么让人起舞、音色为什么有辨识度。法律人学会用音乐的语言思考版权问题，版权法才能真正保护音乐。

全站搜索

翻唱、编曲、改编与修改的边界——AI时代音乐侵权认定标准的反思与重构

相关律师

扫码分享