数据诚信:亟需斩断商业利益链
国务院新闻办公室门户网站 www.scio.gov.cn | 发布:2011-05-13 | 来源: | 作者:金兼斌 廖望
商业利益:屁股决定脑袋
与传统的社会调查或市场调查相同的是,互联网数据的应用始终包含数据的获取和解读两个环节。在整个数据的生产和传播过程中,如何保证数据获取方法的信度和效度,是第三方数据最重要却也是最脆弱的部分;而不同类型的互联网数据及其获取方法,其信度、效度也各不相同。目前常见的互联网第三方数据可以分为三类:旨在获取网络用户态度和情感信息的网络调查数据,旨在客观监测用户网络使用行为的监测数据,以及对网络用户可能消费的网络内容的挖掘数据。其中,网络调查可看作是传统社会调查方法的线上延续,以了解用户的态度、认知等主观心理;而后二者则着重从用户的浏览行为和内容生产、消费行为入手,自下而上的对用户行为进行客观描述和总结。这三类数据及其获取方法,在信度、效度上可能存在问题是各不相同的,其遭到误用和误读的可能性,既有相似之处也各有特殊性。 从社会科学的方法论角度而言,量化数据往往是为了归纳各种经过操作化定义的概念在特定总体中的一般情况。无论是网民的态度,还是特定网站的受欢迎程度,其背后的方法论意涵仍然是对研究者感兴趣的现象进行概念化和操作化,并通过科学的方法进行测量以获得具有代表性且可信的数据。实际上,第三方数据之争的背后往往是人们过于关注经过归纳的数据对抽象概念的反映——也就是结论,而忽视方法论层面的数据获取的过程和其中的各种推断逻辑的合理性。
无论是针对用户的态度还是行为,数据总是同各种概念以及其具体的算法和指标联系在一起的,而这往往是最容易引发争论之处。流量、活跃用户、用户群、独立用户,亦或是页面浏览量、视频浏览量、有效浏览量……无论是北京奥运四大门户自封冠军,还是世界杯优酷和酷6的流量之争,都或多或少涉及到这些名称各异、具体定义也并无公认标准的多样化指标。一些常见的概念常常可以有多种操作化定义,各个监测机构之间有时各取所需加以采用,相互之间在同一名称下实际上遵循并不完全对应的操作定义,导致名义上类似的项目的测量,其实际结果并不具有可比性。例如“流行程度”这一概念,既可以用页面浏览量来测量,也可以用独立用户数来反映,因为“流行程度”这一概念本身足够抽象,提供了不同的理解空间。委托方往往倾向于选择对自己有利的指标,而媒体、受众则容易忽视指标本身的含义而刻板地将其同相对抽象的概念联系起来——无论是出于利益还是认知省力,人们都可能倾向于对数据反映的概念进行泛化或不当地比较,而忽视指标是否真的能够完全反映这些概念。这是基于概念的不同定义而出现的算法问题。
具体而言,不同机构在提供所谓的第三方数据时,对一些具有重要社会意涵的概念的测量往往过于简单化,或者泛化,看似指标林立,却常常难以深入揭示数据背后的现象和规律。另一方面,海量数据的挖掘也面临诸多问题,而目前大多数第三方数据提供机构往往以牺牲有效性作为降低算法复杂性之代价。例如,关于一个网站的影响力,往往被操作化为浏览量、独立用户数目等。这些指标当然能够从不同侧面反映出网站的受欢迎程度,但显然,还不足以完整的反映一个网站的影响力,因为同样的浏览量下,浏览者人口特征的差异,以及平均驻留时间等,都应该在网站影响力的测量中加以考虑。这种指标设计上的缺陷,有时也同目前第三方咨询机构本身的定位有关。目前绝大部分的咨询机构或多或少都定位于市场调查,其关注的指标也有限地集中在反映网站流量或关键词频等相关方面。
然而,流量和词频显然不能揭示全部的互联网现象,这些概念本身也常常在不同情境中需要进行调整。与之对应的,更丰富的用户浏览行为,传播行为,以及其创制的内容的差异性,却往往得不到应有的重视。当然,从技术上言,这也部分地受制于目前基于服务器日志,页面嵌入代码,或在线问卷调查方法本身的局限性。加上指标设计的细节往往不受媒介、受众重视,使得一些机构在发布监测报告时,对数据的获取方法的交代语焉不详,让人无从判断其数据结果的有效性和可信度。
责任编辑:焦飞