【新媒体.二】强大又无力的演算法:“人”的主体价值须被确立
都说演算法是只温柔的巨兽,因为它在潜移默化中决定了用户的“所见所闻”,改变着人们对信息的接收及对产品的需求,也为媒体转型带来转机。不过,《香港01》首席技术总监王龙潇认为,“演算法一点也不温柔,它是‘恶毒巨兽’才对!”在《香港01》的数码化战略中,根据数据、运用算法为读者推送、展示适切内容是重要的一环。然而,被算法操控,与有质素、有温度的内容,似乎总是相悖。作为媒体,应如何处理这样的矛盾?又该如何对读者负责,对内容生产者负责?
此为新媒体转型系列报道三之二
承接上文:【新媒体.一】寻找摆脱科网霸权之路 数码时代下的媒体转型
王龙潇表示,传媒非要“反制”霸权,而是先要摆脱“受制”,亦需“相互利用”达至互利:“Facebook、Google这样的大平台,用了很多时间发展出海量的人流及访问量,在不同的市场会有不同的策略。当他们的市场策略有红利,为什么不去利用?”
2019年,直播是Facebook主推的功能形式之一,《立场新闻》等网媒也借着直播的“东风”做出不俗的成绩。对此,王龙潇指出,这便是“有红利”的时刻,香港01亦在“直播潮”生产出许多此形式的内容。在可控范围内利用平台的势头,是需要、值得去做的。但他也表示,不应将所有鸡蛋放在同一个篮子里,更不可将自己的“脖子”放在别人手中——也就是说,不能将“命脉”交于他人,既要会“乘东风”,又要稳固自己。
与霸权抗衡,并非将其视为“敌人”。他直言,香港01亦有与Facebook、Google、Apple等公司合作的意愿,比如他们想在亚洲推动一些计划时,就需要本地互联网公司协助。对这些公司而言,这样可令计划的落实变得容易些,而对香港01来说,也能够“乘势而上”。“但我们要先抓住自己的内核—会员和数据。快餐很容易吃,但我们不能只吃快餐。”他表示。但问题是,如何抓住自己的内核?这就需要有数据分析能力。
“玩转”数据之余小心“反噬”
创刊时期,为帮同事完成从传统媒体到互联网媒体思维模式的过度,《香港01》互联网经营高级总监覃纯健会构建一个“报摊场景”供大家想像:当一个人站在报摊前,会用一两分钟去筛选报纸杂志,不同的封面与头条就是一面讯息墙,可将其视为线下的“Facebook feed wall”,只不过“购买”的行为变成了“点击”。报摊的布置亦有玄机,新闻类报刊通常会被摆在最前面,娱乐类在旁边,生活与体育类则比较靠后。他笑言:“当时哪有什么大数据,只是凭经验、销量去布局报摊。但可以看出,香港读者资讯消费的主力内容是新闻与娱乐,其次就是副刊,直到现在也是如此。”
也就是说,“数据分析”其实一直都在。可以说,覃纯健带领团队反复试验,透过数据反馈作出调整,是报摊透过销量来布局的更科学、更细致延伸。
然而, 数据、算法亦会带来负面效应。正如王龙潇所言,算法是恶毒的。人类“玩转”数据的同时,亦有可能被算法“反噬”。覃纯健对此表示认同:“当然,过度追求流量的点击最后有可能会‘走火入魔’。标题党、content farm(内容农场)等泛滥时,无论对媒体本身还是对读者而言,都会很危险。”
那么,这是否意味着作为严肃内容的新闻才应是媒体内容生产的全部?覃纯健表示并非如此,连报摊都会将娱乐与新闻摆在差不多的位置,足以说明娱乐内容亦是香港读者十分买账的。他指出,当下资讯消费的主力仍是新闻与娱乐,但并不意味着生活类的部份不重要。因为吃喝玩乐、旅游、亲子、旅游、美容等版块或许单个来计远不足以与新闻、娱乐抗衡,但将这些内容合起来,数据就很可观了。
况且,流量数据的反馈显示,严肃内容带来的流量远不及轻松内容。“假设我们的整体流量为5,000万,当中严肃内容带来了1,000万便已是‘大胜’。但值得注意的是,这1,000万的流量是轻松内容无法顶替的。两者无法替代,相辅相成。”也就是说,读者需要的是综合性内容。当读者基数变多,流量变大,大家自然会在当中寻找自己想看的内容。
然而, 综合性内容的增加,不免会带来content farm的争议。王龙潇表示,自己从不避讳谈这个话题,但他认为,作为媒体,除了有大众消费的内容外,还应有“头部内容”,这是包含一定价值观的,代表了公司的态度。“所以不能定义《香港01》就是content farm。因为content farm并无立场,亦无明确的价值观。”他笑着反驳道。
在覃纯健看来,具误导、错误成份的内容才是严格定义上的content farm,读者被欺骗多了,便不再买账,故需尽量避免这种不健康的模式。但他直言:“若你问恶性content farm的情况会不会在《香港01》发生?其实是有的,这是不能否认的。因为公司的导向而追逐点击率时,确实会发生……但这并不是记者和编辑的责任,而是整间公司需要去修正的。”
但同时,他认为类似“十个你不知道的××”、“六个你必须关注的××”、“三个会令你震惊的××”等content farm的“始祖性”标题,早期确实收获了一大批关注度,故可从中健康地学习其表达、传播逻辑,为自己所用。“网络新闻中是有红线的,比如说,不能做‘标题党’。但我们不应惧怕这条红线,反之,应该无限接近但不越过。对网络新闻而言,愈是接近这条红线,标题效果就会愈好。”他具体解释道。
从content farm、标题党类内容的传播中可以看到,在互联网世界,中规中矩的标题易令内容石沉大海,故不宜因躲避“红线”而在文字上采取安全措施。他指出,如“中美会谈舌剑唇枪”这样的标题,在互联网世界中就是不易被看到的。覃纯健直言,所谓中规中矩的标题更易写出,若在整篇文章中精心选取具体的激烈对话,会更耗时耗力。
算法再强也须“人”存在
“恶毒”的算法、“双刃剑”数据,都是对媒体的考验。当你以为已经脱离科技巨头的规则时,很有可能开始被数据操控。人类应将数据、算法作为工具,自己掌握主导地位,而非被牵着走向另一个“别人的主场”。所以,需对技术保持警惕,并始终保留“人”的作用。
为帮助用户更高效地发现、接触到想要的内容,《香港01》亦会提供个性化的内容、产品与服务。确实,算法技术的开发是为了精准匹配用户的个性化需要,降低在海量信息中的筛选难度,并节省用户的时间。然而,算法却有机会在潜移默化中操纵人的信息接收与认知。北京字节跳动科技有限公司旗下产品,如为人熟知的“今日头条”系产品及“抖音”等,便是透过算法推荐稳稳地抓住用户眼球的典型。然而,这样的做法在近年屡遭质疑。
西北师范大学传媒学院教授赵丽瑾在《光明日报》撰写《读者变为用户,别掉进“算法”的陷阱》一文,指算法在技术上的数据导向,在根本上是资本利益导向,它将用户转化为数据与字符,试图了解人的喜好并进行过滤,强化了认知窄化与数字鸿沟。对此,王龙潇表示:“我们与‘头条系’不同,他们有着超级海量的内容,‘千人千面’的特质会更明显,我们的内容量则主要依靠自产与合作。”除坚持自产内容,避免令人类被算法技术“反噬”外,更需在海量数据、强大的算法中确立、肯定人的主体价值。
内容生产者是否会被数据“绑架”?方可成认为,现代的媒体的确会在页面浏览量( PV)上背负更多压力,但这在报刊时代亦存在。报刊时代并非一个毋须关注报纸销量的乌托邦,只要是商业性质的媒体,定会有此考量。但他亦表示,当时的数据仅有报纸销量,现在可以看到每篇文章的数据,虽可令媒体了解读者行为,但同时又像是一个“诅咒”,将数据展示得太具体、太赤裸裸。而当这个商业逻辑侵入到新闻生产过程之中,数据便成为了协助商业的力量,将老板营业的压力转移到了记者的身上。
对此,王龙潇指出,早年有关于“数据驱动”(data driven)与“数据知情”(data informed)的讨论,《香港01》选择了后者。“数据驱动”意味着数据是团队决策过程的中心,决策者会依据数据作为操作标准;而“数据知情”则指数据在决策中起辅助作用,取得数据后仍需考虑不同因素再作决定。
什么是完全按照数据的指示行动?王龙潇以“自动化SEO”解释,先透过Google分析出近期“热词”,写文时便可使用这些有更大机率被搜索到的字眼,技术团队会给出“taging”(标签)建议,但不会自动设置标签,因为要留给编辑人员足够灵活性:“我们的做法是向编辑提供三个热词标签以作参考。我们把‘人’放在重要位置,即使算法发展再强,都不会没有人的存在,因为算法只是帮助人的工具。新闻的自主性、独立性并不会被算法冲淡。”
他举例道:“有个很经典的算法——推荐算法,即你喜欢ABC,我喜欢BCD,我们会分别倾向于摄取这些部份的信息。于是,算法就会认为我们两个都看BC,是一类人,开始向你推荐D内容,而向我推荐A内容。”实际上,这亦是微信、头条会使用的算法模式。他续称,这样的模式,会出现“圈子”愈来愈小的问题,因此,在做算法的时候,便需要一些可变的量去引导,除了以纯科技的方法操作外,更需要人去引导,并不断调整。
方可成认为数据本身其实不强大,即使可看到点击率、点击时间,甚至“跳出率”,但无法展示读者的心理感受,他们是否得到知识的提升?获得了怎样的营养?对媒体的品牌认知发生了什么变化?他指出:“这些我们无从得知。但只有知道这些, 我们才能判断一篇文章的商业价值。所以,数据看上去很强大,但实际上却只是很片面、很虚弱的评判标准,不足以真正地衡量一篇文章的价值。”
上文刊登于第268期《香港01》周报(2021年6月7日)《强大又无力的演算法: “人”的主体价值须被确立》。如欲阅读全文请按此试阅周报电子刊,浏览更多深度报道。