阿里巴巴首席架构师谈海量数据分析平台
创始人
2024-07-27 05:10:26
0

4月16日,2011数据库技术大会在京召开,来自在2011数据库技术大会的商业智能、数据分析专场上来自阿里巴巴数据仓库部首席架构师 姜迅 就阿里巴巴 海量数据分析平台作为了精彩的主题发言。

姜迅详细的介绍了阿里巴巴B2B业务的海量数据的信息抽取,数据挖掘以及通过分布式框架进行的具体实现等。

[[24623]] 
▲阿里巴巴数据仓库部首席架构师 姜迅

姜迅称,阿里巴巴2007年到现在,数据量翻了150倍。

 
▲数据分析1

WAL

(用户研究与用户信息服务)

基于用户信息与行为的挖掘分析实现对用户偏好及特性。

PKL

(文本挖掘与产品知识库)

基于产品信息、产品交易的挖掘分析实现对产品属性及产品关系的解析与标识

RE

(个性化推荐算法与服务)

基于用户及产品的特征、相关性及BT、内容匹配等推荐算法的个性化推荐系统。

 
▲数据分析1

 
▲数据分析2

  
▲数据分析3

 
▲计算两两频频繁相集

 
▲模型优化

演讲嘉宾:姜迅:阿里巴巴B2B 数据仓库部首席架构师

阿里巴巴B2B 数据仓库部首席架构师,资深专家

阿里巴巴B2B 大数据部技术委员会主席

阿里巴巴数据仓库首席架构师,负责阿里巴巴数据仓库系统架构,解决方案的相关工作;数据库、分布式数据库、分布式计算模式/框架的专家;互联网数据模型专家;多年大型数据仓库架构,模型设计以及系统调优的实践经验;关注于互联网海量数据的信息抽取,数据挖掘以及通过分布式框架进行的具体实现。

【编辑推荐】

  1. 数据库标准化与范式
  2. 数据库设计三大范式应用实例剖析
  3. 一步一步设计你的数据库2
  4. 一步一步设计你的数据库1

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...
《非诚勿扰》红人闫凤娇被曝厕所... 【51CTO.com 综合消息360安全专家提醒说,“闫凤娇”、“非诚勿扰”已经被黑客盯上成为了“木...