
人们采集的数据往往是数量巨大而且杂乱无章的,有趣的部分可能还会有人来凑凑热闹。别把生活排挤在它之外——去探索!
Fearmongers告诫道,捕获数据,就意味着捕获噪声和精心照料的花园是管理数据的唯一方法。仔细想想看?有时,噪声才是重点。
阅读一些费专业技术人员撰写的文章——或者从任何一个害怕立方体希望借助PL/SQL退休的居民在我文章中的评论中——你会听到可怕的警告,他们告诉你你所捕捉的所有数据在你分析之前就将会被诅咒厄运和灾难。注意!很多数据是噪音!噪音是坏的,你冒着可怕的错误的险!
用你冒险的任何方法去尝试。万一捕捉到的数据中某一项噪音会比你想的更有价值呢?
恰好最近发生的事情与Jawbone相关的最多,一个流行的活动跟踪腕带。去年,Jawbone聘请了一位数据副总裁Monica Rogati,开始去挖掘迄今为止积累的数据采空区。自从上周纳帕发生地震后,伴随着他们的清醒时间和接近震区的人们苏醒的比例,Jawbone的出版图表呈现出较大的比例增加。例如,旧金山比纳帕人数还少的一部分人醒的稍迟。
不久前华尔街日报指出,Twitter发现地震比地震仪快——侦测灾难与Twitter比较的工作已不可思议的速度增加。这有明显的局限性和问题。(见鬼,我仍希望Jawbone能告诉我Up24与Up Gen 2相比谁更可靠,但它不肯说。)但可以想象一下这股潜力!
看看野生动物追踪。多年来,人们一直用无线电标记捕获和释放的动物。难道他们不会从震中逃走?也许这正是我们所需要的噪音。我觉得在数量足够或者有足够的范围活动时他们可能不会被标记,,但也只是一个想法。
我们也看到其他噪音比数据更有趣的实力。近日,在观看板块运动时,全球定位系统记录显示西海岸正在上升。为什么呢?因为所有的人搬进沙漠,种植棕榈树,喝可在通过管道输送更多的水。同时,每个人都在将更多的碳拍向天空,使得空气回暖和贫水加剧(不是危言耸听,确实闹过干旱)。GPS的读数显示水是如何压低地表的——和当时消失时徒弟上升的程度。现在我们这片土地上有一个新措施应对真正的水枯竭。
纯科学陶醉在这些副作用上——好奇的科学家或被支付钱的人们去解释这些数据,找出原因。这种“噪音”......是什么意思?是否有意义?
现在想象一下你正在为您的企业采集数据。可能它包含什么有用的噪音?其中的关键在于商业机会的发展,防止损失,降低成本,尤其是供应链计划。这些机会跨越业务单位,要求数据自由化,并需要超出我们计划的汇集数据。
他们还要求人们致力于挖掘数据,传统的数据挖掘人员往往实惠带上眼罩,做他们被告知要做的事情。你需要领域专家参与进来并寻找你不知道的重要的东西。这需要人们有保持好奇,提出问题,并寻求运气。当然,你可能会发现海盗对抗全球变暖,并注意相关性并不总是因果关系,但你也可能会发现,动物逃离震中的速度比你侦测地震的昂贵设备的速度还要快。
你也可能发现,你的客户或同事也在不知不觉中传达东西给你。从某种程度上说,这是一个游戏的数据块魂:您需要收集足够的数据来来创造一个明星。在那些噪音中会有窃窃私语。我们的工作就是努力倾听,并发现它们。
编辑:陈佳璐
来源:waibao.so