从开放数据到众包:这些是数据记者使用的来源
Posted: Mon Feb 10, 2025 3:19 am
数据记者实际上应该处于淘金热的情绪中。人类从未生成过如此大量的数据。根据硬盘制造商希捷和IT市场研究公司IDC的研究结果,仅去年一年,全球产生的数据量就达到了16ZB 。这是一个有 21 个零的数字。要获得如此庞大的数据,你必须观看 Netflix 上的所有电视剧和电影约 5000 万次。
然而,海量的数据并不能说明其新闻潜力。大部分数据根本不公开。那么问题来了:记者该如何在剩余的数据海洋中航行?为了找到相关信息,了解最重要的来源肯定是有帮助的。这样,您就可以在研究开始时就考虑谁拥有您需要的数据。数据新闻项目由以下来源提供:
1. 开放数据——来自政府机构的数据
当然,国家掌握着大量与公众相关的数据。如今这些信息比以前更容易获取。当局正在慢慢开放。开放政府和开放数据是关键词。第一个联系点可以是 联邦统计局 和各州统计局。有些城市(例如莱比锡)也运营相应的门户网站。利用这些数据来制作独家新闻非常困难,毕竟这些信息是任何人都可以获取的,而且当局也有自己的公共关系工作。尽管如此,数据新闻运用也有一些成功的例子。
例如,《每日镜报》利用参议院管理局、联邦机动车运输管理局和运输公司提供的各种数据,将柏林市区划分为各个部分。柏林晨报的互动团队最近获得了“数据新闻奖”,他们研究了所有 250 条公交、地铁和城市轻轨线路的环境。用户可以查看“柏林在你线路上的运行情况”,看看他们站点附近的租金有多高,或者他们的邻居投票支持什么。 《施瓦本报》评估了警方的统计数据,以显示该地区交通事故最常发生的地方。
2. 组织、协会和其他机构的特别数据出版物
德国无数的协会和非政府组织以及许多大公司也 西班牙 WhatsApp 数据 布各种主题的数据。有时相关机构甚至不知道他们的数据是公众感兴趣的。数据记者可以在这里发掘一些宝藏。
这也可以通过从新的角度评估数据来实现。例如,瑞士电视台(SRF)最近分析了公开的 飞行雷达数据,以展示政府如何使用无人机监视其边境。
体育报道中一个有趣的例子也来自瑞士。 《每日新闻》评估了专业信息服务 transfermarkt.ch 提供的大量数据,以了解瑞士足球人才的最终去向以及哪家足球俱乐部的青训工作最为成功。
7月份,德国周报《时代周刊》利用一家专门研究房地产市场的研究机构的数据,对德国租金价格的发展情况进行了备受关注的分析。读者可以查阅到各城市、各区房地产市场的发展情况。
3. 信息自由法案——释放数据
记者可以根据信息自由法提出请求,在联邦一级以及一些联邦州获取非公开的官方信息。这种形式的数据研究当然要复杂一些,但它为记者提供了独家数据。“问国家”网站提供有关该主题的信息,并发布被公民“解放”的数据。
在 Zeit 上也可以找到使用示例。该报成功向柏林参议院行政部门申请获取有关日托中心监管的文件。这导致了一篇题为《最主要的是父母没有发现》的文章,记录了监管机构的失败。
4. 众包——社区的力量
社交网络为数据新闻提供了巨大的机会。记者可以向读者和用户寻求帮助,研究相关数据。该领域的潜力尚未开发,但已经有一些方法了。
例如,研究项目 Correctiv 已多次向其社区寻求支持。该门户网站专门为此设立了一个所谓的群体新闻编辑室。最新项目针对的是多特蒙德学校课程缺失的问题。进行这项研究的原因在于,官方对此事的表述与学生和家长的看法存在很大差异。在一个月的时间内,Correctiv 收集了用户有关课程取消的信息。结果是:多特蒙德取消的上课时间显然是学校当局声称的两倍。
在 Zeit-Online 上也可以找到一个略有不同的例子。一段时间以来,该新闻门户网站的主页上都会询问用户的近况。随着时间的推移,我们能得出什么具体结论还有待观察。但结果是每个人都能看到的,而且是以一种非常有趣的方式呈现的。
5. 项目工作——自己生成数据
如果在任何地方都找不到有关新闻问题的所需数据,记者也可以自己收集。当然,这需要适当的资源,但编辑团队可以独家呈现结果。
“汉娜和伊斯梅尔”这个例子展示了这是如何运作的。巴伐利亚广播公司和《明镜周刊》的数据记者调查了有移民背景的人在德国住房市场上遭受歧视的程度。他们自己就发出了2万份住房咨询。不幸的是,结论并不令人意外:“任何想用外国名字找公寓的人都比德国申请者困难得多。”
6. 泄露数据——来自内部人士的信息
爱德华·斯诺登致意:人们直接向记者提供爆炸性数据的情况一再发生。当然,这通常会影响著名记者和知名媒体公司。其中许多国家都建立了自己的匿名数字邮箱,例如《时代周报》或《每日镜报》。
一个至今仍存在的例子就是被世界各地报道的巴拿马文件。一位匿名举报人最初向《南德意志报》发送了150万份文件。结果,一桩涉及离岸公司、腐败和逃税的国际丑闻被揭露。
然而,海量的数据并不能说明其新闻潜力。大部分数据根本不公开。那么问题来了:记者该如何在剩余的数据海洋中航行?为了找到相关信息,了解最重要的来源肯定是有帮助的。这样,您就可以在研究开始时就考虑谁拥有您需要的数据。数据新闻项目由以下来源提供:
1. 开放数据——来自政府机构的数据
当然,国家掌握着大量与公众相关的数据。如今这些信息比以前更容易获取。当局正在慢慢开放。开放政府和开放数据是关键词。第一个联系点可以是 联邦统计局 和各州统计局。有些城市(例如莱比锡)也运营相应的门户网站。利用这些数据来制作独家新闻非常困难,毕竟这些信息是任何人都可以获取的,而且当局也有自己的公共关系工作。尽管如此,数据新闻运用也有一些成功的例子。
例如,《每日镜报》利用参议院管理局、联邦机动车运输管理局和运输公司提供的各种数据,将柏林市区划分为各个部分。柏林晨报的互动团队最近获得了“数据新闻奖”,他们研究了所有 250 条公交、地铁和城市轻轨线路的环境。用户可以查看“柏林在你线路上的运行情况”,看看他们站点附近的租金有多高,或者他们的邻居投票支持什么。 《施瓦本报》评估了警方的统计数据,以显示该地区交通事故最常发生的地方。
2. 组织、协会和其他机构的特别数据出版物
德国无数的协会和非政府组织以及许多大公司也 西班牙 WhatsApp 数据 布各种主题的数据。有时相关机构甚至不知道他们的数据是公众感兴趣的。数据记者可以在这里发掘一些宝藏。
这也可以通过从新的角度评估数据来实现。例如,瑞士电视台(SRF)最近分析了公开的 飞行雷达数据,以展示政府如何使用无人机监视其边境。
体育报道中一个有趣的例子也来自瑞士。 《每日新闻》评估了专业信息服务 transfermarkt.ch 提供的大量数据,以了解瑞士足球人才的最终去向以及哪家足球俱乐部的青训工作最为成功。
7月份,德国周报《时代周刊》利用一家专门研究房地产市场的研究机构的数据,对德国租金价格的发展情况进行了备受关注的分析。读者可以查阅到各城市、各区房地产市场的发展情况。
3. 信息自由法案——释放数据
记者可以根据信息自由法提出请求,在联邦一级以及一些联邦州获取非公开的官方信息。这种形式的数据研究当然要复杂一些,但它为记者提供了独家数据。“问国家”网站提供有关该主题的信息,并发布被公民“解放”的数据。
在 Zeit 上也可以找到使用示例。该报成功向柏林参议院行政部门申请获取有关日托中心监管的文件。这导致了一篇题为《最主要的是父母没有发现》的文章,记录了监管机构的失败。
4. 众包——社区的力量
社交网络为数据新闻提供了巨大的机会。记者可以向读者和用户寻求帮助,研究相关数据。该领域的潜力尚未开发,但已经有一些方法了。
例如,研究项目 Correctiv 已多次向其社区寻求支持。该门户网站专门为此设立了一个所谓的群体新闻编辑室。最新项目针对的是多特蒙德学校课程缺失的问题。进行这项研究的原因在于,官方对此事的表述与学生和家长的看法存在很大差异。在一个月的时间内,Correctiv 收集了用户有关课程取消的信息。结果是:多特蒙德取消的上课时间显然是学校当局声称的两倍。
在 Zeit-Online 上也可以找到一个略有不同的例子。一段时间以来,该新闻门户网站的主页上都会询问用户的近况。随着时间的推移,我们能得出什么具体结论还有待观察。但结果是每个人都能看到的,而且是以一种非常有趣的方式呈现的。
5. 项目工作——自己生成数据
如果在任何地方都找不到有关新闻问题的所需数据,记者也可以自己收集。当然,这需要适当的资源,但编辑团队可以独家呈现结果。
“汉娜和伊斯梅尔”这个例子展示了这是如何运作的。巴伐利亚广播公司和《明镜周刊》的数据记者调查了有移民背景的人在德国住房市场上遭受歧视的程度。他们自己就发出了2万份住房咨询。不幸的是,结论并不令人意外:“任何想用外国名字找公寓的人都比德国申请者困难得多。”
6. 泄露数据——来自内部人士的信息
爱德华·斯诺登致意:人们直接向记者提供爆炸性数据的情况一再发生。当然,这通常会影响著名记者和知名媒体公司。其中许多国家都建立了自己的匿名数字邮箱,例如《时代周报》或《每日镜报》。
一个至今仍存在的例子就是被世界各地报道的巴拿马文件。一位匿名举报人最初向《南德意志报》发送了150万份文件。结果,一桩涉及离岸公司、腐败和逃税的国际丑闻被揭露。