解读优酷土豆的大数据工程
每个去视频网站看过视频的用户,都知道,在看完一个视频之后,会有相关的视频推荐,这个不足为奇的功能,就是大数据的体现,视频行业在不留意间早就成为了大数据的弄潮者。
琢磨用户喜欢什么样的视频,提高寻找内容的效率,这是大数据在视频行业应用的一个小小案例,本期《数读》聚焦视频行业,看大数据在视频中的数字游戏。优酷土豆集团CTO姚健向我们娓娓道来优酷土豆在大数据上的实践。
推荐视频:看上去简单的高深应用
姚键是优酷土豆集团CTO,据他介绍,优酷新上线的首页页面上,光是导航栏上的视频分类就有21个,21个不同类型的内容,这意味着会有各种不同的用户来优酷看视频,要想给不同的用户推荐他们喜欢的视频,这靠的是一个叫做“协同过滤推荐”的技术。
百度百科上这样介绍协同过滤推荐(Collaborative Filtering recommendation):“是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。”
这是亚马逊、谷歌等互联网巨头都在使用的技术。亚马逊会告诉你“买了A商品的顾客也同时购买了B商品”,Youtube上,一个视频播放结束,马上就会出现相关推荐视频。
看上去简单的相关推荐,其实在优酷的视频推荐中涉及上百个参数,每次要调整参数,都要手动调整十几甚至几十个参数,每天推荐视频的数据模型中要涉及的数据高达几十亿。
一次小小的参数调整,带来的后果,可能是当天视频观看带来几百万的增长,也可能是在算法稳定后的未来几周,甚至几个月带来视频观看量的曲线变化。
当然,数字证实,通过这种协同过滤推荐给用户的视频是靠谱的,因为在海量的视频中寻找自己喜欢的视频成本是很高的,推荐视频的打开率也令人满意。
优酷土豆心中的“大数据”
数据的挖掘、分析,用在推荐视频上,还只是个小意思。优酷在2010年推出的“优酷指数”把大数据精神进一步强化,把视频播放周期、用户核心特征、用户播放行为、视频热度排行等数据进行展示。
姚键这样介绍优酷指数诞生的背景:“2010年的时候,优酷在PC互联网时代已经成为最有影响力的视频网站,优酷希望能够在行业内树立一个标杆,在强化优酷品牌的同时,也打造优酷指数这样一个概念。”
今年,优酷指数进而演变成“中国网络视频指数”,加入了土豆网以及移动客户端的视频数据,对数字感兴趣的用户,可以从这个指数里读出很多内容。
作为一款平台化的产品,“中国网络视频指数”在优酷土豆集团中的参考价值无处不在,从广告售卖,到版权购买,再到播放器产品的优化,等等,处处都能够作为指导依据。
据姚键透露,优酷土豆集团推出的数据报告给节目制作方、影视剧公司、第三方分析机构等了解视频节目的播放信息,以及观众人群的分析提供了依据;在广告销售方面,能够为广告主呈现出用户行为特征,提供广告投放价值的分析;在进行版权购买的时候,可以根据指数的走向来帮助决策;公司内部,哪怕是播放器产品的用户体验优化,都可以查看数据分析结果,查看按钮的摆放和使用频率等。
这些价值都是显而易见的,还有我们在表面看不到的,通过数据分析的结果来指导优酷土豆集团的自制内容。
相关文章
赞助商推广链接
文章随机推荐
- 谷歌地图跌出中国前五
- 两公司开发QQ外挂被控侵权 共赔偿50万元
- PE频现IPO排队企业 三成投资市盈率低于10倍
- Facebook广告系统将覆盖网站主要功能动态消息
- 分析称Twitter5亿注册用户中仅1.7亿活跃用户
- 传谷歌CEO赴华盛顿与FTC商讨反垄断调查事宜
- 多部委鼓励民间投资物流 土地金融仍是两大难题
- 连锁经营协会:传统零售业进军网售现状不乐观
- Twitter上市加注移动终端
- 腾讯宣布因开发商原因 QQ仙境将于6月停运
- 欧莱雅正式授权电商:化妆品大牌博弈全渠道
- 纽约时报称绝不出售 股价小幅下跌
- 美男子被控杀妻 谷歌地图暴露其犯罪证据
- 谷歌称各国政府内容删除请求次数上半年猛增71%
- 电商“金主”时代价格战:背靠大佬烧钱