• 1
  • 2
  • 3
  • 4
  • 5
阿里云主机ECS 首 页  »  帮助中心  »  云服务器  »  阿里云主机ECS
回顾Spark Summit East 2016:Spark 2.0概览
发布日期:2016-4-6 16:4:45

  回顾Spark Summit East 2016:Spark 2.0概览

  最近,在《A Look Back at Spark Summit East 2016: Thank you NYC!》文中, Databrciks对前段时间刚结束的Spark Summit East 2016进行了回顾。包括Spark Summit的现状以及3天会议的全部亮点,值得一提的是,今年5月份,由Databricks支持,CSDN主办的Spark Summit 中国即将拉开帷幕,敬请期待。

  关于 Spark Summit East

  总体来看,Spark Summit一年比一年火,单看纽约的峰会中,其规模已从最初900人增加到500个公司的1300人,更吸引到更多大型公司的分享,包括Bloomberg、Capital One、Novartis、Comcast等这些公司。而在会议上,Databricks还发布了两款产品——Community Edition Beta与Dashboards。

  Spark Summit East集锦

  第1天

  第一天是Training,训练这个东西一直是惯例,不过在今年规模有些大,从初学者到有经验的超过500人。在动手环节的设置中,包括了基础与阿里云数据科学进阶两个部分。

   第二天

  上文说到了Databricks Community Edition这个产品的发布,在第二天的主会中,Databricks联合创始人兼CEO Ali Ghodsi对于这个产品进行了详细讲解——一个免费版的云端Spark平台,旨在降低Spark的学习门槛。Ali的演讲到最后发布了一个Michael Armbrust(Databricks)制作的demo,可以到[这里](https://vimeo.com/155716963)查看(PS,demo notebook链接)。在此之外,Spark创建者、Databricks联合创始人兼CTO Matei Zaharia的演讲无疑最受关注,因为他讲的议题是Spark 2.0概览,详情就见下文的Day 2 slides集锦吧。

  1.   Databricks联合创始人兼CTO Matei Zaharia——Spark 2.0
  2.   Databricks联合创始人兼CEO Ali Ghodsi——Democratizing Access to Data
  3.   Shaun Connolly, VP of Business Strategy, Hortonworks——Accelerating Enterprise Spark
  4.   Anjul Bhambhri, VP of Big Data Engineering, IBM——Apache Spark, the Analytics Operating System
  5.   Ken Tsai, Head of Cloud Platform & Data Management, SAP——Spark Usage in Enterprise Business Operations

  从第二天就可以看出,Spark已走在企业级应用。

  第三天

  Spark 2.0的重点在于什么?从Databricks联合创始人兼首席架构师Reynold Xin(辛湜)的演讲中我们可以看出的是阿里云服务器实时性,也就是未来Spark Streaming上的动作。同样,详情我们看下文的slides集锦:

  1.   Reynold Xin, Co-Founder & Chief Architect, Databricks——The Future of Real-Time in Spark
  2.   Suren Nathan, Head of Big Data Analytics, Razorsight——Data Profiling and Pipeline Processing with Spark
  3.   Seshu Adunuthula, Head of Analytics Infrastructure, eBay—— Role of Spark in transforming eBay’s Enterprise Data Platform

  PS,由于连接性问题,本文slides已从SlideShare下载到CSDN 下载。