找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 731|回复: 0

坏数据的 10 个迹象:如何发现质量差的数据

[复制链接]

1

主题

0

回帖

5

积分

新手上路

积分
5
发表于 2023-11-2 12:54:24 | 显示全部楼层 |阅读模式


随着数据革命继续改变我们所知道的世界,企业开始意识到,在这个时代蓬勃发展需要维护执行良好的数据架构。数据架构描述了组织数据资产的结构,并映射了数据如何在组织中流动。本质上,数据架构作为管理数据的蓝图,以确保所有业务数据得到相应的管理并满足业务需求。但是当他们遇到不良数据时会发生什么? 如果没有明确定义的数据架构,企业就不可能释放数据的真正价值,并可能在此过程中浪费大量资源。他们还可能会输给拥有更成熟数据策略的竞争对手。为了避免这种命运,企业领导者必须认识到的最重要的事情之一是不良数据的存在并会带来后果。 在这里,我们探讨什么是不良数据、数据质量为何重要以及不良数据的迹象是什么。 什么是不良数据? 如果我们可以将高质量的数据定义为适合目的的数据,那么我们可以说质量差的数据不适合目的。这意味着数据不足以支持其所使用的结果。

通常,原始数据可能被认为是坏数据。例如,从 Twitter 等社交媒体网络中提取的数据是非结构化的,在原始状态下,无法进行分析或用于其他有洞察力的目的。 然而,原始数据可以通过数据清理和处理变成好数据,这通常需要时间。 最简单的说法是,任何缺乏结构并存在质量问题(例如不准确、不完整、不一致和重复)的数据都可以被视为坏数据。 为什么数据质量很重要 数  法国手机号码清单  据质量是指定性或定量数据的状态:它在给定特定因素(例如准确性、完整性、一致性、可靠性以及数据是否更新)的情况下衡量数据的状况。除了客户数据外,还包括产品数据、公司数据、供应商数据等等。 确保您拥有的数据具有良好的质量至关重要。为了从数据中获取价值,我们需要它准确、足够有用以支持我们希望使用它实现的结果,并且足够好以充分利用可用资源。



为什么会出现数据质量差的情况? 直接影响运营效率的数据质量问题主要有以下三类: 人为错误。数据质量差的最常见原因之一是人为错误。当数据输入过程缺乏标准化或员工手动将值输入电子表格时,通常会发生这种情况。这两种情况都会增加出错的机会。 不同的系统。组织通常将数据存储在由自己的规则组成的多个不同系统中。构建数据集可能涉及集成来自不同系统的多个源,从而导致数据重复、字段缺失或标签不一致。不同的字段也可能具有相同的含义,但由另一个系统以不同的方式处理。 无效数据。变化发生,企业不断发展。发生这种情况时,必须对数据进行更改(即更改数据结构中的详细级别、折旧字段或更新数据字段)。然而,分析师可能只有在要使用数据时才会意识到所需的更改。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|DiscuzX

GMT+8, 2024-11-23 09:59 , Processed in 0.175425 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表