大数据也在落地,这位百度数据最早的员工,把企业服务玩出了新高度

大数据也在落地,这位百度数据最早的员工,把企业服务玩出了新高度

2016-04-12 10:38B座12楼 特邀作者
「过去,用户提一个需求让工程师去跑数据,一来一回需要两个星期,现在两分钟就能提取用户想要的数据。」桑文锋说,数据的价值,首先是帮助决策,而这一点只使用了数据20%的价值,更重要的是数据对产品的驱动。

文/B12 满满

在桑文锋心目中,李彦宏最重视的,一直是百度的自然语言处理技术。2009年,是桑文锋在百度的第3年,他给自己定了一个目标,要让百度的数据团队和自然语言处理团队的地位一样重要。彼时,桑文锋的数据团队,只有4个人。

那时还没有大数据的概念,桑文锋的团队基于Hadoop做了一套日志统计的平台,解决百度流量分析的问题。「这个产品原本只有我们自己的部门在用,一年半之后,整个公司都在用。」桑文锋说。

2014年初,百度成立了大数据部门,大数据平台的影响力也大了起来。一年之后,桑文锋觉得继续做下去都在预期范围之内。

8年间,桑文锋在百度换了很多部门,每次都是带着团队一起换。这一次,跟着他多年的兄弟,跟他一起跳了出来,做数据驱动产品的事情。

 私有化部署

2014年下半年,桑文锋负责百度对外的企业大数据服务。在与银行、电力、电信、交通这些传统大客户接触时,一旦方案涉及到让客户把数据放到百度云上,最后都会谈崩。「他们对数据安全的隐患顾虑很大。」

「与国外相比,国内的数据环境还是落后很多。在这种情况下,我们只能顺势而为。」桑文锋的顺势而为,是坚持数据的私有化部署。

2015年9月,神策数据产品正式发布。发布当天,桑文锋对媒体投了一篇稿件,在朋友圈转发了一下。「我当时想能有100个用户就已经很好了,结果前几天就有500多个用户申请试用。」目前,神策数据拥有40家企业用户,包括A站、秒拍在内。

一般的数据分析平台是标准的SaaS,用户需要把数据传到第三方平台上,但是很多用户对数据安全顾虑较大,尤其涉及交易数据等核心业务数据,不想放到第三方平台上。「很多公司在初创期会使用这些SaaS产品,大了之后就不愿用了。」桑文锋说。

神策数据是「PaaS+SaaS」的模式,提供私有化部署,神策数据的整套产品可以部署在客户自己的服务器上。「用户不用担心数据安全问题,因为数据不出他们的环境。」桑文锋说。

「传统的SaaS,只需部署一套服务。我们这种方式,是有多少客户,就部署多少套。维护代价完全不是一个量级。」桑文锋说,这就像针对安卓机不同的屏幕宽高,App开发者需要做好每一种前端,投入很大。

「在初期,这确实比其他数据公司难做,但是做好了之后就会成为我们优势。」桑文锋说。

解决运营上的数据分析问题

一个用户在百度和优酷分别投了10万的广告,百度带来1000个客户,优酷带来500个。桑文锋说,很多平台的分析就止于此了,但神策数据可以分析出从不同渠道而来的客户,哪个渠道的客单价更高,哪个渠道的留存更高。

「越往深度分析,数据的面貌就越不一样。」桑文锋说。

神策数据在数据源上的获取渠道,比其他平台更全面。神策的获取途径有三类:

一是将SDK嵌入服务中,采集数据。

二是可视化埋点,通过可视化的界面配置去取出来。

三是后台导入数据。用户数据库里的数据,可以通过神策提供的数据导入工具,批量导入进来。

在百度做了8年的数据平台,桑文锋总结的最重要的一点是,「如果数据的源头不好,后面即使用再复杂的算法,也不能做好。」在更丰富的数据源基础上,神策可以提供灵活、实时、多维度分析。

「对数据的利用,绝对不是看简单的运营报表,要从数据里面挖掘价值。」桑文锋说。

 数据驱动产品

2011年,大数据的概念刚刚火起来,所有人都在提大数据。「以前许多的大数据产品是假大空的东西,只是包装了一个大数据的概念。」桑文锋认为,2015年是大数据落地年,与大数据相关的创业公司都在围绕具体的一个点去做。「就像神策,围绕用户行为,去解决运营分析这个点,这样的价值就很明显。」

「任何新事物都会先经历一轮泡沫,跌落下去,再逐渐抬头。大数据产业已经在抬头的阶段了。」桑文锋说。

在PaaS+SaaS的模式下,神策逐渐把数据生态的轮廓描摹清晰。

数据处理有5个环节:采集,传输,建模&存储&管理,查询,以及数据可视化。「在SaaS化产品上,用户只能看到可视化的数据,前面的环节都被屏蔽了。用户只能看到几个统计好的维度,没办法用原始的基础数据,而神策把这5个环节全部开放给客户。」桑文锋说。

神策其实是帮用户把整个数据资产的体系建好了。「我们帮客户把底子打好了,他可以在我们的基础上开发,挖掘数据的价值。」

「过去,用户提一个需求让工程师去跑数据,一来一回需要两个星期,现在两分钟就能提取用户想要的数据。」桑文锋说,数据的价值,首先是帮助决策,而这一点只使用了数据20%的价值,更重要的是数据对产品的驱动。

「就拿百度搜索来说,用户点击量高的搜索结果在前排,这个过程是把经过处理之后的数据套上机器学习算法,让产品更加智能。这是数据更大的价值。」桑文锋说。

*本文由新芽NewSeed合作伙伴新芽NewSeed授权发布,转载请联系原出处。如内容、图片有任何版权问题,请联系新芽NewSeed处理。

相关专辑

让赚钱更容易

让赚钱更容易