雪领新媒体讯(微信号:ixueling)假如大数据中的社交媒体数据是一座金矿,那么他的实质含金量比重是多少?
大数据的不确定性之一,就是不确定性。
并且关于人的数据,有高达80%的不确定性。
比如你在微信朋友圈晒出刚买的东西,朋友A觉得好看点了赞,朋友B觉得不怎么样,但是出于礼貌,还是点了赞。
每个人对于事件的定义、评论和想法都不同,在社交媒体上发言也可能还有所保留,只是一种社交礼节。
当把这些礼节创造出的数据做成一张报表时,你有多少信心,可以根据这样的数据质量做出决策?
数据越庞杂,不确定性就越大。假设交易数据的准确度为80%,那么社交媒体的数据的准确度,可能降低到50%,再将另一个准确度也是50%的问卷数据一同评估,3个数据结合所剩下的准确度只有20%,而其中对于社交媒体和问卷数据50%的准确度估计,仍然可能是过于乐观的预估。
因此,在分析数据时,应该深入情境,获悉人在不同情境中的变化,掌握“厚数据”。
厚数据:人文社会科学研究中,深入情境运算出的数据。
数字并不等于人,人的行为产生数据,充满不确定性,心里想的、说出口的还有实际做的,三者不一定是对等关系。
这些不确定性,需要通过人所建立的观点与模型来解释,在何种情况下的话语是比较可信的,或者说了多少次,可信度才会提高。
因此,做数据需要拥有并横跨三大领域的知识:
最后,运用“厚数据”思维,做出既有科学根据又洞悉人心的决策。(作者:kiki)