用微博账号登录:

以后地位:首页 > 2019-01 > 样本越多越好吗


样本越多越好吗

作者:萨姆·兰斯博撒姆 发表于>2019-05-18 样本越多越好吗

推荐度:

当波士顿学院的一群门生开端对UFO目击申报停止数据阐发时,他咱咱们发现位于美国华盛顿州的国度UFO申报中央自1974年开端跟踪UFO的动向以来,收到的UFO目击申报大幅增长。然而,这并不意味着天外来客的数目越来越多,而是因为该中央刚树立时,人咱咱们必需拿起电话来申报自己的发现,互联网普及后,人咱咱们只需上网填写一张表格,因此,UFO目击申报的数目急剧上升。

再看UFO以外的更多例子,咱咱咱们发现数据收集本钱的低落带来了多方面的价值。咱咱咱们比曩昔拥有了更多数据。然而,办理者必需清楚地了解数据是如何天生的,和这一天生过程会如何影响数据的价值。在可以或许或许获得的数据越来越多时,办理者应该留意哪些样本出现偏差?如下四点做法值得采纳:

了解数据的来龙去脉 本日的企业在阐发从网络论坛获得的丰富且低本钱的数据时,必需慎之又慎。它咱咱们必需考虑到,颠末过程社交媒体了解到的主顾环境,可能与以往电话或书面调查的数据所反映进去的趋向并不吻合。社交媒体固然为消费者运动供给了分外详细的数据,可以或许或许让企业获翟咱们八有的海量小我信息。然而,并不是每位主顾都应用社交媒体,同时出于刻意塑造自己形象的必要,也不是每一小我在社交媒体上都能做到坦诚。办理者必需了解自己应用的数据是来自哪里,和数据天生之后可能会因什么而发生变更。

承认数据数目标增长并不代表数据品德的晋升 庞大的数据量供给了一中榧侔参,让办理者误以为自己节制了“更好的”数据,而其实只不过是先前数据的权重增长。更糟糕的是,数据量的增长会让样本偏差更深地隐藏在海量信息中。办理者在试图获得更多数据之前,必要对额外数据将发生的新信息停止评估,可以或许或许先睁开小规模试验。他咱咱们必要知道从数据中可以或许或许获得什么,和如何以低本钱到达这一偏向。

认识到旧数据源的不完善 旧数据源自己也存在样本偏差。以上文提到的UFO目击申报为例:互联网普及之前,人咱咱们只能颠末过程电话与国度UFO申报中央联系。因为外州人不得不考虑长途电话的本钱,大多数申报都来自华盛顿本州。不管是新数据源还是旧数据源,对它咱咱们的了解都必要光阴。经验奉告咱咱咱们,新旧数据源各自都存在样本偏差,同时采纳它咱咱们可以或许互相扬长避短。

记住直觉仍然很重要 判断样本是否有偏差,归根结底是人类的工作。数据自己不会说话,咱咱咱们必要自行辨认缺失的部分。尽管人工智能和机械学习正在兴起,但咱咱咱们仍然必要人类的专业知识来纵观全局,确定某个数据源反映了全局哪母霾糠。办理者应当问自己:“对付业务,有哪些是数据无法奉告咱咱咱们的,但我自己很了解的?” 

跟着数据阐发在企的诓日益普及,越来越多的人必要在阐发结果前练就一副“火眼金睛”。要做到这一点,办理者必需将两种分歧范例的知识结合起来:一是对数据天生过程眼前细节的了解,这关乎数据的代表性;二是对业务的微观节制和全体认知。

《商业评论》网iPhone客户端

请存眷咱咱咱们的新浪微博官方帐号:

@商业评论网(http://weibo.com/ebusinessreview

@商业评论杂志(http://weibo.com/hbrc)

无觅相干文章插件,疾速晋升流量
[  标签: 决定  样本  magazinehot  2019-01  ] 2581 次阅读0 次评论

读者评论

(评论内容为网友针对本词条睁开的讨论,与本网站的概念立场无关。)


    该文章只要登录后能力评论。请先登录

    分享到:QQ空间 腾讯微博

    评论

    声明:本文由 @商业评论网 (转载请保留)拥有版权或由内容合作同伴受权供给,未经商业评论网书面许可,对付商业 评论网拥有版权和/或其余知识产权的任何内容,任何人(包含博客及小我空间)不得复制、转载、摘编或在商业评论网所属的服 务器上做镜像或以其余任何办法停止应用。


    您也可以或许或许间接 在线订购 或致电 800 820 5396 购买刊登本文的当期杂志。 电子版全文将于本月内更新发布,届时您可购买在线阅读卡阅读全文。

    帐户如果还没有点数?立刻 购买阅读卡,在线阅读更多精彩文章 注册冲值后仍打不开全文?请点击“ 常见成就”。如需更多信息,请进入 帮助页面
    订阅热线: 800-820-5396    邮局订阅代码: 2019-05-185
    共0人分享过本文,他咱咱们是:
    友情链接:文山民族新闻网  四川绵阳职业技术学院  中国建筑装饰网  中国算命网  鸟类大全网  鸟类大全网  红心音乐网  奇书小说网  智迪污水处理新闻网  节能消费领跑信息网