主页 > 资源互动 > 中国数据产量占全球10.5% 巨量信息催生“算法创新”

中国数据产量占全球10.5% 巨量信息催生“算法创新”

tp官网下载 资源互动 2024-01-30 11:08

中国数据产量占全球10.5%,巨量信息催生算法创新

网络大数据,不只数据大(融观中国)

——透视算法系列报道之一

本报记者 卢泽华

在各类网络平台上,算法成为一项广泛应用的技术。通过数据分析和精准推荐,它改变了过去人找信息的搜索模式,逐步实现信息找人。

关于算法,人们观点不一。有人认为,它方便了用户,提供了更精准的网络服务;有人认为,它在算计用户,造成信息偏食等问题;还有人认为,作为一项技术,它并无好坏之分,关键在于如何用正确价值和规范去驾驭。

自今日起,本版推出透视‘算法’系列报道,解读算法带来的变化与影响。系列报道第一篇,关注大数据时代网民获取信息惯的变迁。

现状

内容更丰富,平台更多元

以前遇到问题,第一反应是打开浏览器搜一下。现在除了搜索网页,也会去微信或短视频平台找答案。北京市民王瑛向记者展示了一段短视频:你看,前两天下厨,想做一道鱼香肉丝,抖音一找,教学视频就出来了。

王瑛今年36岁,从2000年左右开始接触互联网。最初10多年,她获取信息的方式主要有两种,一是在搜索引擎上检索,二是浏览门户网站。但最几年,这种惯开始改变。现在网上信息太多,让人眼花缭乱,甄别起来比较费力。有时需要特定信息时,在手机软件中更容易找到结果。她边介绍,边打开手机界面:比如,想找购物信息,就去淘宝逛逛;想看电影,就去猫眼找找;想了解明星动态,就去微博看看;想获取专业知识,就去知乎搜搜……

在王瑛看来,这种改变是不知不觉形成的。每天频繁使用各类手机软件,顺手搜一下并不费力。久而久之,就形成了用多个平台搜索信息的惯。最重要的是,搜完之后,手机应用会记住自己的需求,主动推荐感兴趣的信息,省时省力。

王瑛的用网经历具有一定代表性。记者针对120名用户的搜索行为作了一项小型调研,结果显示:所有人均有使用搜索引擎的惯,但将其作为唯一选择的仅占15%。多数人表示,自己会在各类手机应用中检索信息,并时常浏览各平台推荐的信息。比如,获取生活经验类信息,很多人都会选择刷短视频,遇事不决,视频来学。

行业数据也印证了这一点。截至2023年6月,中国搜索引擎用户规模已达8.41亿人。但七成用户也会通过短视频完成搜索,微信搜一搜月活跃用户也已超过8亿,几乎与搜索引擎用户总量相当。另一项调查也显示,用户平均每天会在 3.8个平台上搜索信息。

挑战

信息杂芜与平台壁垒

虽然网上信息量更大了,获取信息的渠道更多了,但不少用户仍表示存在使用体验不佳的情况。

信息杂芜是原因之一。现在网上营销信息较多,虽然大多标注了‘广告’字样,但毕竟需要甄别,影响使用效率。王辉是一名金融分析师,经常需要在网上检索信息,且对信息质量要求较高。但他发现,现在找到一张纯净的网页非常困难,这在一定程度上拖慢了他的工作节奏。

王辉的情况并非个例。记者调查发现,在网上检索信息时,显示结果中很多都是广告链接。比如,搜索培训二字,排名最靠前的两个结果均为商业培训机构广告。

据了解,各大搜索网站也都注意到这个问题,但如何改变行之有年的商业模式,还是个尚待破解的命题。广告是网站主要盈利来源,目前业界只能尽量优化广告信息,提升用户体验,但要彻底转型,还需一定时间探索。一家互联网公司的销售经理告诉记者。

除了信息杂芜,互联网界还不同程度存在平台壁垒现象。

据了解,过去,综合类搜索网站是各类网络平台获取流量的主要入口,通过一个搜索框、一个关键词,用户可以搜到全网各个平台的信息。而随着移动互联时代来临,美食、家居、旅游、短视频等垂直平台用户规模越来越大,每个平台都形成了自己独有的大数据库,这个大数据库不仅包含海量优质信息,还囊括了用户使用惯等数据。动辄坐拥上亿用户的网络平台不再需要其他平台引流,这些数据便被视为独家资源,不再对外开放。这导致用户很难通过综合类平台搜到所有需要的信息。

趋势

向智能化与精准化发展

如今,中国已经成为数据量最大、数据类型最丰富的国家之一。国家数据局日前发布的信息显示:我们数据产量已占全球数据总量的10.5%。更有研究机构预测,到2025年,中国数据总量或占全球30%。

数据作为新型生产要素,已快速融入生产、分配、流通、消费和社会服务管理等各环节,但目前在发展过程中也存在数据应用潜力释放不够、数据供给质量不高、流通机制不畅等问题。国家数据局副局长沈竹林表示。

在这一背景下,仅仅数据大已经无法满足社会需要,还要进一步实现数据精数据准,从而有效降低用户获取信息成本,提供更加个性化、精细化的内容服务。在这种需求驱动下,算法技术应运而生。

算法是人工智能技术与大数据技术的关联节点。中国科学院科技战略咨询研究院院长潘教峰认为,人工智能正在科研、贸易、交通、医疗等诸多场景中改变人们沟通的方式。其活字典、移动的大百科全书的特性,加上越来越接人类水平的语言理解和生产能力,让其答复既有常识性,又呈现出集成创新性。

因此,在互联网海量数据基础上,算法可以通过人工智能技术对用户兴趣偏好和需求进行分析归纳,描绘出用户画像,打上特性标签,进而以此为依据,进行精准化、个性化的定制推荐。

在算法技术的调配下,用户每次打开手机应用,都可以收到针对个人需求的信息推送。同时,平台通过不间断收集信息,会变得越来越懂用户——打开购物网站,期想要购买的产品已被推荐到首页;进入短视频平台,接踵而至的都是自己喜欢的视频内容;浏览旅游软件,想去的地方一一列在眼前,连机票购买链接都放好了……这一切,正是凭借日渐成熟的算法技术才得以实现。

然而,有人担心,算法在大数据时代精准调配网络信息、提升服务水准的同时,也带来了信息偏食、网络沉迷、数据泄露、技术滥用等隐患。这些问题多大程度存在?又有哪些破解之道?我们将在透视‘算法’系列报道第二篇进行解读,请大家持续关注。

中国数据产量占全球10.5%,巨量信息催生算法创新

网络大数据,不只数据大(融观中国)

——透视算法系列报道之一

本报记者 卢泽华

在各类网络平台上,算法成为一项广泛应用的技术。通过数据分析和精准推荐,它改变了过去人找信息的搜索模式,逐步实现信息找人。

关于算法,人们观点不一。有人认为,它方便了用户,提供了更精准的网络服务;有人认为,它在算计用户,造成信息偏食等问题;还有人认为,作为一项技术,它并无好坏之分,关键在于如何用正确价值和规范去驾驭。

自今日起,本版推出透视‘算法’系列报道,解读算法带来的变化与影响。系列报道第一篇,关注大数据时代网民获取信息惯的变迁。

现状

内容更丰富,平台更多元

以前遇到问题,第一反应是打开浏览器搜一下。现在除了搜索网页,也会去微信或短视频平台找答案。北京市民王瑛向记者展示了一段短视频:你看,前两天下厨,想做一道鱼香肉丝,抖音一找,教学视频就出来了。

王瑛今年36岁,从2000年左右开始接触互联网。最初10多年,她获取信息的方式主要有两种,一是在搜索引擎上检索,二是浏览门户网站。但最几年,这种惯开始改变。现在网上信息太多,让人眼花缭乱,甄别起来比较费力。有时需要特定信息时,在手机软件中更容易找到结果。她边介绍,边打开手机界面:比如,想找购物信息,就去淘宝逛逛;想看电影,就去猫眼找找;想了解明星动态,就去微博看看;想获取专业知识,就去知乎搜搜……

在王瑛看来,这种改变是不知不觉形成的。每天频繁使用各类手机软件,顺手搜一下并不费力。久而久之,就形成了用多个平台搜索信息的惯。最重要的是,搜完之后,手机应用会记住自己的需求,主动推荐感兴趣的信息,省时省力。

王瑛的用网经历具有一定代表性。记者针对120名用户的搜索行为作了一项小型调研,结果显示:所有人均有使用搜索引擎的惯,但将其作为唯一选择的仅占15%。多数人表示,自己会在各类手机应用中检索信息,并时常浏览各平台推荐的信息。比如,获取生活经验类信息,很多人都会选择刷短视频,遇事不决,视频来学。

行业数据也印证了这一点。截至2023年6月,中国搜索引擎用户规模已达8.41亿人。但七成用户也会通过短视频完成搜索,微信搜一搜月活跃用户也已超过8亿,几乎与搜索引擎用户总量相当。另一项调查也显示,用户平均每天会在 3.8个平台上搜索信息。

挑战

信息杂芜与平台壁垒

虽然网上信息量更大了,获取信息的渠道更多了,但不少用户仍表示存在使用体验不佳的情况。

信息杂芜是原因之一。现在网上营销信息较多,虽然大多标注了‘广告’字样,但毕竟需要甄别,影响使用效率。王辉是一名金融分析师,经常需要在网上检索信息,且对信息质量要求较高。但他发现,现在找到一张纯净的网页非常困难,这在一定程度上拖慢了他的工作节奏。

王辉的情况并非个例。记者调查发现,在网上检索信息时,显示结果中很多都是广告链接。比如,搜索培训二字,排名最靠前的两个结果均为商业培训机构广告。

据了解,各大搜索网站也都注意到这个问题,但如何改变行之有年的商业模式,还是个尚待破解的命题。广告是网站主要盈利来源,目前业界只能尽量优化广告信息,提升用户体验,但要彻底转型,还需一定时间探索。一家互联网公司的销售经理告诉记者。

除了信息杂芜,互联网界还不同程度存在平台壁垒现象。

据了解,过去,综合类搜索网站是各类网络平台获取流量的主要入口,通过一个搜索框、一个关键词,用户可以搜到全网各个平台的信息。而随着移动互联时代来临,美食、家居、旅游、短视频等垂直平台用户规模越来越大,每个平台都形成了自己独有的大数据库,这个大数据库不仅包含海量优质信息,还囊括了用户使用惯等数据。动辄坐拥上亿用户的网络平台不再需要其他平台引流,这些数据便被视为独家资源,不再对外开放。这导致用户很难通过综合类平台搜到所有需要的信息。

趋势

向智能化与精准化发展

如今,中国已经成为数据量最大、数据类型最丰富的国家之一。国家数据局日前发布的信息显示:我们数据产量已占全球数据总量的10.5%。更有研究机构预测,到2025年,中国数据总量或占全球30%。

数据作为新型生产要素,已快速融入生产、分配、流通、消费和社会服务管理等各环节,但目前在发展过程中也存在数据应用潜力释放不够、数据供给质量不高、流通机制不畅等问题。国家数据局副局长沈竹林表示。

在这一背景下,仅仅数据大已经无法满足社会需要,还要进一步实现数据精数据准,从而有效降低用户获取信息成本,提供更加个性化、精细化的内容服务。在这种需求驱动下,算法技术应运而生。

算法是人工智能技术与大数据技术的关联节点。中国科学院科技战略咨询研究院院长潘教峰认为,人工智能正在科研、贸易、交通、医疗等诸多场景中改变人们沟通的方式。其活字典、移动的大百科全书的特性,加上越来越接人类水平的语言理解和生产能力,让其答复既有常识性,又呈现出集成创新性。

因此,在互联网海量数据基础上,算法可以通过人工智能技术对用户兴趣偏好和需求进行分析归纳,描绘出用户画像,打上特性标签,进而以此为依据,进行精准化、个性化的定制推荐。

在算法技术的调配下,用户每次打开手机应用,都可以收到针对个人需求的信息推送。同时,平台通过不间断收集信息,会变得越来越懂用户——打开购物网站,期想要购买的产品已被推荐到首页;进入短视频平台,接踵而至的都是自己喜欢的视频内容;浏览旅游软件,想去的地方一一列在眼前,连机票购买链接都放好了……这一切,正是凭借日渐成熟的算法技术才得以实现。

然而,有人担心,算法在大数据时代精准调配网络信息、提升服务水准的同时,也带来了信息偏食、网络沉迷、数据泄露、技术滥用等隐患。这些问题多大程度存在?又有哪些破解之道?我们将在透视‘算法’系列报道第二篇进行解读,请大家持续关注。

标签: