视频文件可能成为大数据的秘密武器
燕麦云   2012-07-19
视频文件可能成为大数据的秘密武器

大数据蒸蒸日上

听到“大数据”三个字,人们脑海中会立即浮现出一页又一页的统计数据,也会让人联想到很多大数据被搜集到一起形成结构更加鲜明、组织更加严密的统计表,来帮助企业了解消费者的行为。数据搜集和分析公司在费劲脑汁地搜索可能的数据来源还有新的智能数据分析方法来吸引客户。然而,这些公司似乎忽略了一些数据资源,尽管这些资源很受欢迎。

视频文件固有的缺陷

现如今,视频资料很大程度上被忽视了,因为它没有清晰显示当前的数据搜集方式。数据收集工具在文本文件或者其他格式的文件上可以发挥作用,而今天视频资料还没有任何可以将其分解成若干小部分并分析其内容的程序。

这缺陷是我们的损失

然而,这并不是说视频文件里没有我们要收集和详细了解的关键信息。思考一下我们检查视频资料时所忽略的信息,这是很关键性的一步,美国思科的首席信息官兼高级副总裁Rebecca Jacoby 就首先发现了这点。

每分钟上传到YouTube 上的视频多35小时,每小时上传视频总时长就是2,100 小时,并且都是有YouTube 用户上传的。

这些视频内容五花八门:他们所穿的服装品牌,正在使用语言,他们的民族、性别,以及四者的关系,家具品牌,头发颜色,正在行走的街道,使用的表达,他们的欲望和梦想,讨厌的东西,还有其他许许多多的主题。

这些信息都很重要,还很可能是最原生态的数据形式。

图片是不会撒谎的

这是已在诸如体育和娱乐行业盛行的道理。

跟试下流行的概念相比,大数据不是一个新概念。我们今天在研究一种现象和市场行为的时候会用到大数据,过去很多人已经以这种方式利用大数据的概念了。

例如,专业体育团队雇佣视频分析师研究运动员移动的方式,教练如何设计团队的比赛策略,场上的变化会怎样改变比赛的节奏。

企业也有类似的需求,遗憾的是目前尚未开发出能够代替视频分析师角色的应用程序。还没有一种程序如此智能,可以通过视频来分析市场走向。

截至今天,尽管我们已经设想出先进的数据收集工具,但是尚未解开如何分析视频的秘密。

视频的自发性

也许正是用户拍摄的视频内含的原生态信息具有解开这一秘密的法力。不要忘记,YouTube网站上的很多视频都是人们用价值50美元的录像机拍摄的。他们没有造型师为自己设计着装打扮,没有导演告诉他们怎样讲台词。这就是原生态信息里面包含的最真实的情感。

这就是我们能够收集的最直接的数据,可惜我们还不知道怎么处理这些数据。