×

打开微信,扫一扫二维码
订阅我们的微信公众号

首页 锦天城概况 专业领域 行业领域 专业人员 全球网络 新闻资讯 出版刊物 加入我们 联系我们 订阅下载 CN EN JP
首页 > 出版刊物 > 专业文章 > “今人可见古时月”——关于使用互联网档案馆技术取证的分析

“今人可见古时月”——关于使用互联网档案馆技术取证的分析

作者:杨冰 马鹏琛 孙睿 2023-09-22

前言:实务中某些案件往往需要当事人提交过去某段时间的网页信息作为证据,如商标权撤三答辩、专利权使用在先证明等,而网页信息资源是一种动态增长的“原生性”网络文献,具有不可再生的特点。有研究表明,一个网页的平均寿命只有44天[1]。如当事人未在纠纷发生前进行充分的证据留痕,则可能在纠纷发生时,产生不能适时、充分举证的风险。随着技术发展,“互联网档案馆”技术广为人知,并成为当事人解决上述问题的重要选择之一,逐渐应用在司法实践中。而通过“互联网档案馆”技术获取的证据,是否具备适格证据的条件和相应的证明力,在实务中并未形成统一意见。本文中,笔者将结合司法案例对其取证可行性与取证建议进行简要分析。


一、互联网档案馆概述


(一)何为互联网档案馆


根据百度百科及相关资料显示,互联网档案馆最早起源于1996年美国人布鲁斯特·卡利(Brewster Kahle)创办的 Internet Archive(简称 IA)。IA 是一个非营利性机构,其创立目的是定期抓取与保存全球网站的网页内容,并向全世界开放,是目前世界范围内对互联网档案资料保存历史最久远、保存范围最广、保存内容最完善的机构。截至2021年4月,IA在网页时光机中保存了超过3000万册图书和文本、890万部电影、视频和电视节目、64.9万个软件程序、1322.5万个音频文件、380万张图片和5800亿个网页,其抓取范围与存储容量仍在不断扩大。


根据程序设计,IA会根据网页的规模及活跃度进行频率不同的抓取,针对规模较大及更为活跃的网站可能一天进行多次抓取,针对规模较小的网站可能相当长时间进行一次抓取。IA的抓取范围包括多个国家的大多数网站,覆盖面较广,甚至某些较小网站也被收录在内。在网站抓取技术方面,IA主要运用的是其与芬兰、瑞典等国家图书馆联合开发的Heritrix爬虫软件[2],Heritrix对网页仅抓取而不修改,精确捕捉每一个完整的网页内容,实现大规模的网页信息采集,基于其对网页不会进行修改的特点,IA可以呈现相关网页在特定时间的原貌,这也为其抓取内容在司法实践中作为证据提交提供了可能性。


(二)诉讼中的IA取证步骤


通过案例检索分析,笔者总结出诉讼中常见的IA取证过程:首先使用网页浏览器登录IA[http://web.archive.org/](此过程如在国内操作需开启VPN),在IA页面输入需要查询的网页,而后在IA所抓取的该网页的历史状态中根据时间选择并浏览,最后通过网页截图或保存页面的方式将相关信息固定下来,并作为证据提交。IA具体界面如下所示:


image.png

(英文原界面)


image.png

(中文翻译界面)


关于使用IA在实践中获取证据的步骤,广州互联网法院(2020)粤0192民初44585-44591号判决书对此有较为详细的描述:“在浏览器进入百度百科‘互联网档案馆’的词条,记载互联网档案馆(TheInternetArchive),……定期收录并永久保存全球网站上可以抓取的信息……网页……叫做‘时光倒流机器’(WaybackMachine),它像收集旧报纸那样收集旧网页。之后通过词条底部链接点击进入archive.org/web/web.php网站,在WaybackMachine附近空白框输入‘jiqimao.tv’,点击‘BROWSEHISTORY’,选取日历为2019年7月29日在另外的窗口打开网页,可见网站左上角有的图标,且经搜索在电视剧栏目查得《破冰行动》的海报并点击进入简介页面,可见列有‘多源播放’线路,后将整个网页文件保存”。


需要强调的是,IA属于境外网站,由于我国GFW(Great Firewall of China,网络防火长城)的存在,在国内并不能直接使用浏览器对其进行访问,而需要借助VPN(Virtual Private Network,虚拟专用网)实现。VPN作为远程访问技术,通过对数据包的加密和数据包目标地址的转换来实现远程安全通讯,简单地说就是利用公用网络架设专用网络,进行加密通讯,上网者可以使用VPN技术绕过GFW相应的IP封锁、内容过滤、域名劫持、流量限制等,实现对境外网络内容的访问。


这种跨越GFW的网络访问行为,也被称为“翻墙”,受到相关法律法规的管制。因此,通过这种“非正常访问”方式所取得的材料,其证据能力如何,是否应予排除,是实务中争论较多的问题。


二、IA所获取证据之证据能力分析


有观点认为使用VPN访问境外网站的取证行为违反我国互联网管理相关法律法规,所获证据应予排除;亦有观点主张应从证据本身属性等方面判断其证据能力,不能仅因取证行为瑕疵就一概排除IA所获取证据。笔者赞同后种观点,即通过IA“翻墙”取得的证据不能仅因其取证行为瑕疵而遭排除,在该证据符合民诉法等法律法规与相关司法解释的情况下,应允许其参与庭审举证质证,理由如下:


(一)使用VPN访问IA是否违法存在争议


实践中持排除证据观点者普遍认为“翻墙”行为违反了《中华人民共和国计算机信息网络国际联网管理暂行规定》(下简称《暂行规定》)第六条“计算机信息网络直接进行国际联网,必须使用邮电部国家公用电信网提供的国际出入口信道。任何单位和个人不得自行建立或者使用其他信道进行国际联网”之规定,即 “翻墙”没有使用邮电部指定国际出入口信道,属于私自建立或使用其他信道进行国际联网。如(2021)粤0192民初36849号及(2020)粤0192民初44585-44591号判决书在说理部分阐明:“该录屏证据涉及以VPN访问“互联网档案馆”网站,实际上是以非正常渠道突破网络管制措施,对在中国大陆地区有访问限制的网站进行访问,违反了行政性管理规定。”


严格来看,“翻墙”行为并未突破上述规定。根据《中华人民共和国计算机信息网络国际联网管理暂行规定实施办法》第三条第三款之关于相关名词的解释“国际出入口信道,是指国际联网所使用的物理信道。”物理信道是指用于传输数据信号的物理通路,它由传输介质与有关通信设备组成,与逻辑信道共同组成通信信道。而使用VPN软件属于在技术上建立用于数据传输的逻辑虚拟信道,其接入互联网实际仍然使用了国际联网所使用的物理信道,并非是自行建立或者使用其他(物理)信道进行国际联网的行为,并不是《暂行规定》所禁止的行为,其所获证据不应排除。


(二)通过IA获取证据并未严重侵害法益,不是法律规定应予排除之证据


首先,根据《民诉法司法解释》第一百零六条[3]的规定,“严重侵害他人合法权益、违反法律禁止性规定以及严重违背公序良俗”等三种取证手段形成或获取的证据应当予以排除。民事诉讼中非法证据排除规则的立法本意更多在于保护社会其他法益不受当事人取证的侵扰,当民事诉讼当事人获取证据仅在方式上不符合常规路径,而并不存在严重侵害社会其他法益的情况时,不应直接排除。


其次,就“翻墙”行为而言,《暂行规定》第六条的禁止性规定主要是为了规范网络秩序,维护网络安全及其健康发展,涉及国家、社会公众的利益。在普通民事案件当中,特定当事人基于证明案件事实之需要,使用VPN方式进行国际联网,取证手段或存在瑕疵,但如果仅是为了获取与案件事实相关的网页、邮件等证据材料,对涉案相关网站搜索、截图、下载或同步录屏,并不会冲击上述规定立法目的的实现。从维护司法公正、平衡各方利益的层面看来,不宜仅因证据通过“翻墙”手段取得就认为其属于非法证据进而直接排除。司法实践中,亦有许多法院在认定“翻墙”行为违法的情形下仍肯定“翻墙”所获证据的证据能力,如(2021)粤0192民初36849号[4]判决书中广州互联网法院就认为虽然“翻墙”行为属于突破网络管制的不当方式,但后续取证操作并没有违反法律的禁止性规定,亦未严重侵犯法益,相关证据不应予以排除。


综上,笔者以为,IA之“翻墙”取证行为或有瑕疵,其所获取证据并不因此当然丧失证据能力,实践中当事人仍可提交相应证据,但其提交应严格符合法律要求。


三、对于IA证据提交的要求


根据《最高人民法院关于民事诉讼证据的若干规定》(以下简称《证据规定》)第十四条第一款之规定,通过IA获取的网页证据属于电子数据,与传统证据有较大区别。电子数据本质上是一组组数据编码,在证明案件时,需要转化为常人可以识别的形式。就IA证据的提交要求,笔者将进行简要分析。


(一)提交IA获取证据的形式要求


依照《证据规定》第十五条第二款之规定,电子数据应提交原件,同时该条亦规定“直接来源于电子数据的打印件或其他可以显示、识别的输出介质,视为电子数据的原件。”根据该规定,在民事诉讼程序中,若当事人出示未经篡改的电子数据打印件,可视为出示了证据原件,但如何认定打印件与原件一致或打印件来源于电子数据,则可能成为各方争议的焦点。


(二)提交IA获取证据的实质要求


由于电子数据容易出现截取、修改、删除、伪造等情形,当事人提交打印件时应主动提交辅助证据证明该打印件确为原件,即直接来源于电子数据而未经篡改。对此,《证据规定》第九十三条[5]以电子数据的生成、存储、传输所依赖的计算机系统的硬件、软件环境和电子数据是否被完整地保存、传输、提取,保存、传输、提取的方法等方面作为标准,对电子数据的取证提出了较为严格的要求。


为准确理解电子数据的提交要求,笔者摘取最高法民一庭《民事审判实务问答》[6]中对于电子数据真实性的要求的部分回答对证据提交进行指引:“法官可以依据以下情形考察电子数据副本是否可视为原件:(1)可准确反映原始数据内容的输出物或显示物;(2)具有最终完整性和可供随时调取查用的电子副本;(3)双方当事人均未提出原始性异议的电子副本;(4)经公证机关有效公证,不利方当事人提供不出反证推翻的电子副本;(5)附加了可靠电子签名或其他安全程序保障的电子副本;(6)满足法律另行规定或当事人专门约定的其他标准的电子副本。”根据此问答,提交能够准确反映原始数据内容的输出物或显示物、具有完整的电子副本、经有效公证或附加了可靠电子签名等属性的电子证据更可能被司法机关采信,实践中对于提交此类证据亦有多种尝试,以下进行分析。


四、司法实践中互联网档案馆的取证分析总结


经前论述,通过“翻墙”行为自域外网站获取的电子证据虽然具有证据能力,但因其无法通过常规手段进行查证,故不具有完全的证明力,并非“最佳证据”,不能单独作为认定事实的依据,其证明力需要其他证据补强,因此当事人往往在提交IA获取证据的同时也会提交辅助证据以证明取证过程的真实性。


(一)证据补强方式分析


笔者使用Alpha平台、威科先行数据库与裁判文书网等平台检索包含关键词“互联网档案馆”、“网页时光机”、“InternetArchive”等关键词,共检索到117份裁判文书,其中人民法院明确阐明使用IA获取的证据之证据能力及证明力的裁判文书共30份,以下将以此30份裁判文书作为基础数据进行分析。


从整体情况来看,30个案例中使用IA获取的证据受到采信的案例数量为19个,比例为63.33%,采信度较高。从各证据补强方式来看,在30个案例中,通过公证方式补强的案例数量为18个,直接提交IA网页截图或打印件而未进行补强的案例数量为9个,通过可信时间戳[7]补强的案例数量则为3个。可以看到,公证是大多数当事人或律师首选进行IA所获取证据补强的途径,可信时间戳作为近年来推广兴起的取证手段,使用者较少,而有接近三分之一当事人或律师未提供其他证据证明使用IA所抓取数据的真实性,而各补强证据方式的效果也各不相同。


(二)证据补强效果分析


从各补强方式效果来看,采用公证方式补强的18个案例被采信者为12个,采信比例为66.67%,未被采信者多是由于公证流程不规范或公证内容不完整,如(2021)京73民终559号[8]、(2021)京0115民初10493号[9]等;采用可信时间戳方式补强证据的3个案例均被采信,采信比例为100%,补强效果最好,当然,这也与其样本数量最少有关;而直接提交网页截图(打印件)的9份证据仅被采信4份,采信比例为44.44%,采信概率最低,且受采信者多是因为当事人提交的各个证据形成完整证据链,可以彼此印证,如(2019)粤0192民初1573号[10]、(2016)京73行初792号[11]等。总体而言,IA所取得证据需要补强,而通过公证及可信时间戳方式补强IA所取得证据是较为可行的方式。


image.png


五、提交证据各方式之比较


各证据补强方式除补强效果有差异外,其操作流程、取证时限也各不相同,笔者以下将主要对有补强效果的公证与可信时间戳进行分析。


(一)公证


公证是公证机构根据自然人、法人或者其他组织的申请,依照法定程序对民事法律行为、有法律意义的事实和文书的真实性、合法性予以证明的活动。适用在IA网页取证情形下,即在独立行使公证职能、承担民事责任的公证处或港澳台地区具有中国委托公证人资格的公证人的监督见证下,将从IA网页取证的全过程进行实时记录并获取公证书的方式。


通常来说,对于IA网页取证应在公证处具有联网功能的电脑上进行,公证员要对完整的电脑操作步骤、时间和点击网页的先后顺序及对出现在电脑屏幕上的网页内容的复制过程实时现场进行监督、打印或拍照。取证完成后,公证处依法向申请人出具具有法律效力的网页证据保全公证书。公证的优点是其作为传统的证据补强方式广受认可并同时适用于海内外(符合国外公证程序的公证书也为我国法院所采信[12]),缺点是费用较高且满足IA网页取证公证条件并有此类业务经验的公证处较少,当事人需要寻找合适的公证处并留意公证过程的规范性。


(二)可信时间戳


可信时间戳是由联合信任时间戳服务中心根据国际时间戳标准《RFC3161》签发的,能证明数据电文(包括电子文件和电子数据)在一个时间点是已经存在的、完整的、可验证的并具备法律效力的电子凭证。可信时间戳服务的本质是将用户的电子数据的Hash值和权威时间源绑定,在此基础上通过联合信任时间戳服务中心数字签名,产生不可伪造的时间戳文件。


image.png


可信时间戳的存证方式较为简单,即打开“联合信任时间戳服务中心”官方网站(https://www.tsa.cn/)或在手机端下载权利卫士app,根据所需要取证的类型点击相应类目进行证据固化。用户存证成功后,会得到相应的可信时间戳认证证书,记载申请人、取证时间、时间戳认证码及取证位置等信息。相较于传统的公证存证方式而言,可信时间戳等电子存证方式具有成本低、效率高、易操作等优势,尤其在涉知识产权纠纷的取证过程中得到了广泛运用。


对可信时间戳的采信问题,《最高人民法院关于互联网法院审理案件若干问题的规定》第十一条第二款进行了规定:“当事人提交的电子数据,通过电子签名、可信时间戳、哈希值校验、区块链等证据收集、固定和防篡改的技术手段或者通过电子取证存证平台认证,能够证明其真实性的,互联网法院应当确认。”[13]当事人使用可信时间戳进行妥善取证的方式是能够被法院所认可采信的,笔者接下来就可信时间戳的存证操作问题做简要介绍。


使用可信时间戳等电子取证工具进行取证时需根据具体取证目的设计合理的取证流程和合适的取证方式,用以证明取证过程和还原事实真相,避免证据存疑、进而导致时间戳证据无法认定待证事实的情况。对此,北京互联网法院法官经雯洁亦在案件审理时释明:“不同于传统的证据形式,电子数据具有易篡改,易复制的特征。尽管时间戳取证能确保自保存时起数据不被更改,但可信时间戳对于取证数据来源的可靠性并非当然具有证明效力,这一待证事项是否能够被可信时间戳固化,有赖于取证主体对具体的取证流程及操作的设计和选择。”取证人对具体的取证流程及操作的选择也对证据是否能够被采信起到至关重要的作用。


具体到本文所分析的IA网页取证中,由于“联合信任时间戳服务中心”网站或权利卫士app进行存证及证据固化要求关闭VPN等可能影响时空定位的软件,而在国内浏览IA网站又需要使用VPN技术,这意味着使用时间戳固化IA证据不能在一个设备(电脑或手机)上独立完成。因此,笔者在实务中所采取的方式为:使用一电脑开启VPN并访问IA网站进行浏览取证,于此同时,使用另一手机端权利卫士app对具体的取证流程及操作进行全过程多角度的“录像取证”,即先将电脑周边及外部环境、电脑本体进行多角度拍摄,并把在浏览器输入http://web.archive.org并检索网页的全过程进行记录,直至将相应网页页面保存至特定位置,完成整个过程。

综上所述,操作规范,内容完整的公证、可信时间戳存证均是对该电子数据打印件进行补强的有效手段,当事人可以在比较各方式之成本、形式等条件后选择最为合适的方式。


结语:今人不见古时月,古月依旧照今人,于常理上已消失的网页通过IA再度完整的呈现在世人面前,这得益于一众计算机科学家与档案馆爱好者的努力。而如何在案件中利用好这一资源,进行妥善取证与证据提交、形成完整证据链,进而服务于整体法律服务目标的实现,就要依靠实务工作者大胆的思路、缜密的论证与高效的行动了。


注释

[1] 杨道玲.web资源保存现状与思考[J].图书馆杂志,2004,(10):32-36.

[2] 吴倩,王运彬 . 网站时光机:美国网页存档模式探索——以 Internet Archive 为例 [J]. 图书馆,2021(7):91—97.

[3] 最高人民法院关于适用《中华人民共和国民事诉讼法》的解释(2022修正)第一百零六条:“对以严重侵害他人合法权益、违反法律禁止性规定或者严重违背公序良俗的方法形成或者获取的证据,不得作为认定案件事实的根据。”

[4] (2021)粤0192民初36849号-广州互联网法院:“本院认为,该录屏证据涉及以VPN访问“互联网档案馆”网站,实际上是以非正常渠道突破网络管制措施,对在中国大陆地区有访问限制的网站进行访问,违反了行政性管理规定,但是后续取证操作,并没有违反法律的禁止性规定,通过该行为取得的证据,并非《最高人民法院关于适用<中华人民共和国民事诉讼法>的解释》第一百零六条所规定的“以严重侵害他人合法权益、违反法律禁止性规定或者严重违背公序良俗的方法形成或者获取的证据”。尽管该录屏证据存在一定的取证瑕疵,但鉴于悠扬公司作为争议域名的持有人,本应对网站历史信息有更强的举证能力,相对而言,不应对喜临门公司的举证过分苛求。故在悠扬公司未举反证的情况下,不应排除喜临门公司该证据。”

[5] 《最高人民法院关于民事诉讼证据的若干规定》第九十三条 人民法院对于电子数据的真实性,应当结合下列因素综合判断:(一)电子数据的生成、存储、传输所依赖的计算机系统的硬件、软件环境是否完整、可靠;(二)电子数据的生成、存储、传输所依赖的计算机系统的硬件、软件环境是否处于正常运行状态,或者不处于正常运行状态时对电子数据的生成、存储、传输是否有影响;(三)电子数据的生成、存储、传输所依赖的计算机系统的硬件、软件环境是否具备有效的防止出错的监测、核查手段;(四)电子数据是否被完整地保存、传输、提取,保存、传输、提取的方法是否可靠;(五)电子数据是否在正常的往来活动中形成和存储;(六)保存、传输、提取电子数据的主体是否适当;(七)影响电子数据完整性和可靠性的其他因素。人民法院认为有必要的,可以通过鉴定或者勘验等方法,审查判断电子数据的真实性。

[6] 《民事审判实务问答》最高人民法院民事审判第一庭编.北京:法律出版社,2021版第288页

[7] 联合信任时间戳服务中心根据国际时间戳标准《RFC3161》签发的,能证明数据电文(各种电子文件和电子数据)在一个时间点是已经存在的、完整的、可验证的并具备法律效力的电子凭证

[8] (2021)京73民终559号-北京互联网法院:“百度网讯公司用以证明上述网站不稳定的主要证据为‘互联网档案馆’网站(https//archive.org)的抓取记录,但在涉案期间即2018年1月19日至2018年4月13日,百度网讯公司仅提交了三个时间点的页面抓取情况,且均显示为302状态码。在百度网讯公司未提交充分证据对‘互联网档案馆’网站的资质、性质、管理规范性予以证明的情况下,仅凭上述证据不足以支持百度网讯公司的主张。”

[9] (2021)京0115民初10493号-北京市大兴区人民法院:“宝融公司虽提交了从Internet Archive waybackmachine网站下载的新华网网页快照,但宝融公司提交的网页快照仅是十余天的网页,并非是新华网与宝融公司合同履行期内日期连续、完整的网页;案涉《专题设计、发布委托合同》约定系在新华网广告位置投放,系静态文字广告或者静态图片广告,宝融公司提交的网页有部分位置内容未能显示或者未能显示完整;因此,宝融公司提交的网页快照时间不连续、所展示的网页内容不完整,并不能证明其关于新华网公司未能履行合同义务的主张。”

[10] (2019)粤0192民初1573号-广州互联网法院:“虽然被告否认进行了相关跳转,可互联网档案馆上显示的2015年8月16日××的网页情况截图说明及刘勇于2015年8月4日对广州华多网络科技有限公司的律师函回函能够证实如下两点,第一,刘勇曾将被诉域名跳转至龙珠直播平台××;第二,刘勇称被诉域名已经转让他人为不实陈述。”

[11] (2016)京73行初792号-北京互联网法院:“虽然会议现场照片、会议展板设计稿等基于证据性质无法确定具体时间,但是能够与互联网档案馆记载的华夏邓白氏公司官方网站上体现的标志相互引证,可以证明华夏邓白氏公司在举办上述会议时使用了诉争商标。”

[12] (2017)京73行初2105号判决书:“第三人环球公司在无效宣告程序中提交的证据1-3均为在美国取得的证人证言及其附件的公证认证文件,虽然公证人员并不对证人陈述和附件的真实性负责,但该取证方式符合美国的公证保全证据的方式,故第三人环球公司已经完成了其对于证据1-3真实性的举证义务。”

[13] 最高人民法院关于互联网法院审理案件若干问题的规定 法释〔2018〕16号 第十一条第二款

当事人提交的电子数据,通过电子签名、可信时间戳、哈希值校验、区块链等证据收集、固定和防篡改的技术手段或者通过电子取证存证平台认证,能够证明其真实性的,互联网法院应当确认。