启航大厦A座29层,杨帆的豪华办公室内,宁静正在给杨帆和钱振华冲泡着今年新上的雨前龙井。袅袅的茶香总扑面而来,杨帆忍不住向钱振华夸耀着宁静的茶艺。 钱振华此时略显拘束,他想着再和董事长聊一聊,于是摸着门就过来了。到了前台的时候,遇到宁静问他是否有预约时他才傻眼了。好在宁静去机场接的他,两个人是认识的,宁静也知道杨帆很重视这个米国回来的留学生,所以让他稍等便直接去通报了。 杨帆在在办公室的会客区热情的招待了他,还让宁静一展茶艺,让两人的交谈更加的写意。 杨帆在谈笑间显得很是亲切,虽然按年龄来说,他是师弟,比年过三十的钱振华要小好几岁。但在交流中却是杨帆稳稳的掌握着主动权,这大概就是身份和地位带来的话语权的一种体现。 他问了钱振华的家里情况,父母健在他是家中长子。他还畅快的和钱振华回忆斯坦福校园里的奇闻趣事,两人随不是同一时间在斯坦福留学,但杨帆在斯坦福就是一个传奇,钱振华还真不少听闻杨帆的传说。还有那校内网是真的好用,简直就是为米国大学生量身定做的。 钱振华虽然刚开始略显得拘谨,但渐渐的心里就放松下来。他知道董事长日理万机的,拉家常是一种话术,但他还是很受用,效果也的确好。 所以在聊到钱振华的探亲计划时,钱振华就主动的把话题引到了淘宝网的项目上来。 听了钱振华表述的来意,杨帆很是满意的,认定了这是一个愿意做事的人。这样的人才他爱用,何况还有一层同在他国留学校友的情怀。所以钱振华能现在找过来,就值得让杨帆更加看重他。 杨帆:“振华,搭建一个电子商务网站并不困难,难的是我对这个网站的高要求。归结起来就是两个,第一个要求是要有巨大数据量的处理能力,同时要保证后台系统负载稳定;第二个是网站的智能化技术开发,这个技术我给它起个形象一点的名字,就叫用户画像技术吧。”
谈到了具体的技术问题,这算是进入了钱振华最擅长的领域,杨帆明显感觉到这位师兄就像是换了一个人似的,全身都开始散发自信的光芒。 可在如果在这个电商刚刚起步的阶段,淘宝网就能搞出用户画像功能来,辅助算法给用户推商品,那绝对能带给用户带来飞一般的网购体验。 杨帆看着钱振华似懂非懂,知道自己需要讲的再具体一些。 杨帆:“很好,人员调配和开发进度你来掌握,我等着看结果。接下来我们说说这网站智能化的概念,我敢说即便是放在现在的米国,都是一个非常新的课题。 用户画像的总体思路,是通过用户在网站的搜索浏览行为,通过数据分析和逻辑判断,初步判断顾客的需求和爱好,并以此为依据,安排数据算法给用户推荐更加符合用户兴趣爱好的产品,从而提高网站的客单成交量。 钱振华点了点头,要做到这一点很容易,他问道:“明白,类似于Cookies分析,他的心中似乎能把握住杨帆的思路了,这就像是一层窗户纸,只要一撮就能破。”
这样的一组数据中心服务器,每天理论上能处理50亿条系统请求量,这样的数据中心我们先在京城和魔都设立两处。京城数据中心主要处理来自北方各省的数据信息,魔都主要处理南方地区的数据信息。 杨帆:“振华,指教谈不上,我相信单论技术开发,你怕是要比我强,我对你能有信心,方案做好了我们一起讨论定夺。 用户登录我们的淘宝网时,就会被要求留下一些基础的个人信息,比如说姓名、性别、年龄、职业。这些都是我们画像的素材,有了它们我们可以为一个用户建立起基本的数据库。 用户在网站上操作的行为越多,我们能够得到着信息数据就越多,将这些行为碎片组合在一起并加以分析,就能够得出我们想要的一些信息。这就是我说的用户画像技术。 杨帆就笑了,这钱振华懂就是懂,不懂不藏着直接就请教,这是个搞技术的大才。他现在有种捡到宝的畅快感觉。 接下来网站要做的就是分析用户每一次搜索和点击查看的商品内容,从而分析他的兴趣点、消费能力以及个人爱好。配合数据库中的已有的信息比对,描绘这个用户的购物习惯和兴趣爱好。”
对于现在的程序员来说,用户画像技术还非常的陌生,这是前世电商发展到相当的水平才开发出来的技术。以后只要是个好一点的网站,都能够做到一定程度的为用户画像,主动记录用户的行为。这样的技术实现的难度并不算高,主要是思路和创意。 钱振华:“数据处理和系统稳定主要是涉及到数据库架构的搭建和分层处理算法的设计,在这方面我心中有很多的想法,回头我把它们写成技术方案发给您审阅,这方面的开发工作我很熟悉。不过您说的这个用户画像技术我有些陌生,还请指教。”
你需要开发一套后台架构,将淘宝网的整个运算力能高效监管快速调度起来,网站后台的信息处理能量和系统承压稳定要能达到上亿人同时访问下单无卡顿的水准。”
在硬件方面我已经向甲骨文公司订购了两套服务器系统,每套都由1台Master服务器和6台Slave服务器用于数据分析和处理,Master流量在5Mbps,Slave的平均处理流量为60Mbps,峰值可达到120Mbps,平均每天能处理约4T的原始数据。 钱振华在心中大致思考了一下后点头道:“没问题,给我两个月的时间肯定能完成系统开发。”
就像是通过一笔又一笔的描绘,让这个人能够清晰的呈现在画纸上的过程。我们的网站在给用户画像,只不过用来描画的不是笔,而是一条条数据,用来承载的也不是纸,而是我们的后台。