丁雷的话,也代表了船舱中其他几个人的心声。
大数据,是互联网企业发展到一定规模的产物,在国外已经成为了前沿,而在国内,只闻其名,不见其形,并没有成规模的研究。
所谓大数据说白了就是数据挖掘,数据分析,朝小了做,随便哪家互联网企业的数据库,都能号称‘大数据’,但数据量样本太少显然没有任何意义。
web1.0时代,用户从运营商处获得信息,2.0时代,运营商通过收集用户信息,无论在哪个时代,互联网都是围绕着‘用户’服务的,因此2.0时代的用户信息,是宝贵的财富之一。
大数据这项前沿技术,到底如何研究,怎么应用,对互联网会产生什么影响?
这是在场的互联网大佬都迫切想要知道的。
“说起数据中心的具体位置,也是巧了。当初我们三家商议到底放在哪里,争议不下,最后还是赵总一言而定,选了一个折中的地方。”李总呵呵一笑,轻轻一敲桌子,“就在杭城!”
“原来就是阿里巴巴的眼皮子底下,难怪人家盯着你呢。”新浪的曹总半开玩笑对马芸说。
马芸一愣。
杭城那么大,高科技企业众多,那三家又明显有保密意识,之前没有任何宣传,多出一家科技公司,他不知道也很正常。
只是,这未免有些巧合了吧?
前段时间,腾讯和百度都流露出入股阿里巴巴的意向,可都被拒绝了。
而偏偏这个数据中心恰好就在杭城,这两者会不会有什么关联?
看了赵泽君一眼,难道在很早以前,这个年轻的赵总,就对阿里巴巴有什么想法?
赵泽君冲马芸微微点头,然后说:“既然就在杭城,不如吃完螃蟹,大家一起去参观参观嘛。”
“螃蟹回来再吃也不着急嘛,马总,晚上这顿还是你的。”张超阳有些迫不及待的说。
……
由于数据中心的横空杀出,泛舟西湖的计划提前结束,一行人奔赴数据中心。
数据中心似乎早就料到会来,早就布置好了大会议室,在简单的内部参观后,由目前数据中心首先科学家,也是百度方面的代表专家,毛总工程师在会议室里,向在场来宾,大致介绍了数据中心的科研方式和成果。
目前,数据中心已经创建了有效的模型153个,这些模型中,有12个能直接投入应用的,一部分还在不断完善中,大部分是基础模型,并且每个月的数据模型都在高速的增长中。
根据这些模型,总结出有效的数据采集渠道超过五百种,分析、运算公式接近一万个,三方提供的各类数据在清洗后留下的‘有用’内容,存储在整整两层楼的近两百台高端服务器中。
毛总工程师还在现场,做了几个应用展示。
游戏用户模型,可以帮助游戏运营商,找到网络中对游戏感兴趣的用户,通过各种方式宣传,并且在游戏中,诱导消费。
用户浏览习惯模型,可以分析出用户网页的浏览频率、次数、类型等信息,确定一个用户在这段时间内的浏览偏好。这点如果应用到门户网站上,可以帮助网站确定下一步的发展重心,有针对性的进行工作。
至于阿里巴巴方面,毛总也展示了两项相关应用。
当然,这些模型,某一家网站,比如新浪自己也可以单独完成,但是只是针对自身用户,无论在用户的范围、分析的深入程度和模型的概括性上,都远远不能和目前的数据中心相提并论。
百度搜索、泽联科博客、腾讯QQ以及他们的一系列产品,几乎囊