用户数据的使用与隐私保护:认知误区与规则界限

——从近日TikTok的辟谣事件说开去

作者:教育部长江学者特聘教授、北京师范大学新闻传播学院执行院长、中国新闻史学会传媒经济与管理专业委员会会长喻国明

近日,“TikTok背后是7亿中国用户数据隐私”的视频在某网站上发布,8月9日,字节跳动官方账号发表声明,澄清称“TikTok”是字节跳动旗下一款面向海外市场的短视频应用,在产品运营过程中不会涉及国内用户数据。此后,尽管原视频已被发布者删除,但其引发的舆论热议并未在短时间内平息。众所周知,智能时代是建立在大数据基础上的,这其中当然也包括对于用户数据的使用。站在国家和时代发展大格局的角度看,这一问题显然并不仅限于一家互联网公司发展的市场安全和舆论环境,而是关涉所有国内的或出海企业的数据使用与智能化处理的现实运作和未来发展,所以值得我们本着科学严谨的方式,以及对个人、对企业、对社会和对未来负责任的态度加以理性探讨。

从目前看来,这一问题可以通过如下三个层面来观察和分析:

一、个人数据使用的必要性和可能性

以这次事件为例,面向海外用户群体的TikTok是否需要并且可以获取字节跳动在中国的用户隐私数据?从字节跳动的公开回复和技术逻辑的角度看,答案是否定的。

1.数据使用的闭环逻辑是“一把钥匙开一把锁”

传播学的研究表明,不同性别、年龄、教育程度,特别是居住地的政治、经济、文化、社会背景等因素,都会对于用户的媒介产品使用行为产生重要影响。因此,不同传播市场的用户洞察需要与其自身的用户数据相对应才是适配的。显然,世界各地的用户都有自己独特的传统、行为特点与兴趣偏好。对于国内用户使用抖音数据集进行训练所生成的模型,其推荐算法并不能实质性地让使用TikTok的海外用户产生更好的使用体验、提高用户粘性,甚至会对于模型的准确性造成干扰。因此,使用国内数据实际上并无必要和价值。

2.智能算法中“迁移学习”的建模与运营需要全面的数据打通

根据字节跳动的公开信息,TikTok所有数据均为海外用户,训练数据集与中国区的抖音分属两个不同的产品,并且由两个互不交叉的团队独立运营,其用户数据是严格隔离的。TikTok使用的是国外当地用户数据来进行建模。在这个前提下,所谓“迁移学习”就不成立了,因为推荐系统主要依赖协同过滤,而协同过滤的核心是基于人(指用户)和物(指视频)两个维度进行推荐。由于TiKTok与国内的产品内容和用户数据是彼此隔离的,不但迁移学习的收益非常小,而且跨越数据隔离的成本收益也是完全不匹配的。因此,从底层技术逻辑上,两个产品共享用户数据或模型既无必要,也无可能。TikTok不但无法获取字节跳动在中国的用户隐私数据,而且其价值动因也不成立。

二、用户数据与智能算法上的创新

以TikTok为例,TikTok基于海外用户数据,做了哪些算法上的创新应用?我们可以看到,TikTok以及字节跳动的算法优势在于其“推荐”系统,即TikTok上的“For You”。

根据2020年TikTok就推荐算法所公开发表的文章,推荐系统会根据用户与应用程序互动过程中表现出来的偏好,例如发布的评论或关注的账号等,来为用户推荐内容。从新用户表现出的兴趣“冷启动”开始,推送系统根据推荐算法对相关视频进行排序,以确定用户对某条视频所产生兴趣的概率,最终形成个性化的“推荐”页。

“推荐”基于多个因素,包括用户互动,例如用户点赞或分享的视频,关注的账号,发布的评论和自己创作的内容等;视频信息,可能包括文字说明、声音和标签等详细信息;设备和账户设置,比如语言偏好、国家设置和设备类型等。推荐系统对这些因素进行处理,并根据它们对于用户的价值进行加权计算,权重赋予的最为重要的指标是兴趣指标,比如用户是否从头到尾看完了一条长视频等。

因此,开发和维护TiKTok的推荐系统是一个连续的过程。算法的关键是采自服务对象的数据,有了当地产品算法的基础框架后,持续增长的当地数据会不断训练优化算法。字节跳动基于海外用户信息,将根据用户、研究和数据的反馈来改进准确性,调整模型并重新评估有助于推荐的因素和权重,这也有助于做好各区域市场的在地化,更好地服务当地用户,进一步提升用户体验,帮助用户发现APP使用的乐趣,这样的产品才可能受到所在地用户的欢迎。

三、智能化服务的商业公司使用用户数据的合法的、可持续的前提是对于相关法律要求的合规化

伴随着技术的迅猛发展,人工智能领域的数据隐私问题,逐渐成为专家学者和普通网民用户共同关心的领域。特别是“脸书泄密门”发生之后,个人数据隐私、算法“黑箱”等信息伦理问题的相关探讨与研究日益增多。

人工智能自动化决策的过程,成为个人数据隐私的最大隐患。因为人工智能程序并不像传统分析一样,对数据进行线性分析,而是学习数据、调整算法、智能回应新数据,来作出新的决策,这使得信息的处理过程往往成为一个算法黑箱,很难为一般人所理解,甚至也很难为专业人士所理解。

全国人大常委会《关于加强网络信息保护的决定》指出,国家保护能够识别公民个人身份和涉及公民个人隐私的电子信息。那么,在国内用户使用抖音短视频产品时,我们的搜索、浏览、播放、互动等相关信息是否能够受到保护呢?答案是肯定的。

原文链接:http://www.citreport.com/content/102415-1.html

最后修改日期:2020年8月14日