Redesigning Apache Flink’s Distributed Architecture · Redesigning Apache Flink’s Distributed...

Till Rohrmann trohrmann@apache.org @stsffap

Redesigning Apache Flink’s Distributed Architecture

1001 Deployment Scenarios

▪ Many different deployment scenarios • Yarn • Mesos • Docker/Kubernetes • Standalone • Etc.

Different Usage Patterns

▪ Few long running vs. many short running jobs • Overhead of starting a Flink cluster

▪ Job isolation vs. sharing resources • Allowing to define per job credentials & secrets • Efficient resource utilization by sharing

Job & Session Mode

▪ Job mode • Dedicated cluster for a single job

▪ Session mode • Shared cluster for multiple jobs • Resources can be shared across jobs

Flink’s Current State

As-Is State (Standalone)

Standalone Flink Cluster

Client (2) Submit Job JobManager

TaskManager

(3) Deploy Tasks

(1) RegisterTaskManager

TaskManager

As-Is State (YARN)

YARNResourceManager

YARN Cluster

Client

(1) Submit YARN App.(FLINK)

Application Master

JobManager

TaskManager

(2) Spawn Application Master

(4) Start TaskManagers

(8) Deploy Tasks

(3) Poll status

(6) All TaskManager started

(5) Register

(7) Submit Job

Problems

▪ No clear separation of concerns ▪ No dynamic resource allocation ▪ No heterogeneous resources ▪ Not well suited for containerized

execution

Flink’s New Distributed Architecture

Flink Improvement Proposal 6

▪ Introduce generic building blocks

▪ Compose blocks for different scenarios

▪ Mainly driven by:

11Flip-6 design document: https://cwiki.apache.org/confluence/pages/viewpage.action?pageId=65147077

The Building Blocks

• ClusterManager-specific • May live across jobs • Manages available Containers/TaskManagers • Used to acquire / release resources

ResourceManager

TaskManagerJobManager

• Registers at ResourceManager • Gets tasks from one or more

JobManagers

• Single job only, started per job • Thinks in terms of "task slots" • Deploys and monitors job/task execution

Dispatcher

• Lives across jobs • Touch-point for job submissions • Spawns JobManagers • May spawn ResourceManager

The Building Blocks

ResourceManager

(3) Request slotsTaskManager

JobManager

(4) Start TaskManager

(5) Register

(7) Deploy Tasks

Dispatcher

Client

(1) Submit Job

(2) Start JobManager

(6) Offer slots

Building Flink-on-YARN

YARNResourceManager

YARN Cluster

YARN Cluster Client

(1) Submit YARN App.(JobGraph / JARs)

Application MasterFlink-YARN

ResourceManager

JobManager TaskManager

TaskManager

(4) StartTaskManagers

(6) Deploy Tasks

(5) Register(3) Request slots

Differences to old YARN mode

▪ JARs in classpath of all components

▪ Dynamic resources allocation

▪ No two phase job submission

Building Flink-on-Mesos

Mesos Master

Mesos Cluster

Mesos Cluster Client

(1) HTTP POST JobGraph/Jars

Flink Master ProcessFlink Mesos

ResourceManager

JobManager TaskManager

TaskManager

(3) Start Process (and supervise)

(7) DeployTasks

Flink Mesos Dispatcher

(2) Allocate containerfor Flink master

Master Container

Flink Master Process

Building Flink-on-Docker/K8S

Flink-ContainerResourceManager

JobManager

Program Runner

(2) Run & Start

Worker Container

TaskManager

Worker Container

TaskManager

Worker Container

TaskManager

(3) Register

(1) Container framework starts Master & Worker Containers

(4) Deploy Tasks

Containerized Execution

▪ Single dedicated Resource- and JobManager container and multiple TaskManager containers

▪ Generalization • Start N containers • Use leader election to determine JobManager role; remainder

TaskManager role

▪ Enabling auto-scaling groups by rescaling job to fill all available slots

Multi Job Sessions

Building Standalone

20Standalone Cluster

Flink Cluster Client

(2) Submit JobGraph/Jars

Flink Master ProcessStandalone

ResourceManager

TaskManager

(5) Deploy Tasks

JobManager JobManager

Dispatcher

(3) Start JobManager

Standby Master Process Standby Master Process

YARN Session

ApplicationMasterFlink-YARN

ResourceManager(5) Request

JobManager (A)

JobManager (B)

Dispatcher

(4) StartJobMngr

YARNResourceManager

YARN Cluster

Client

(1) Submit YARN App.(FLINK – session)

TaskManager

(8, 12) Deploy Tasks

(7) Register(3) Submit Job A (11) Request

(10) StartJobMngr

(9) SubmitJob B

Multi Job Sessions

▪ Dispatcher spawns for each job a dedicated JobManager

▪ Jobs run under session user credentials

▪ ResourceManager holds on to resources • Reuse of allocated resources • Quicker response for successive jobs

Miscellaneous

▪ Resource profiles • Specify CPU & memory requirements for individual

operators • ResourceManager allocates containers according to

resource profiles

▪ New RPC abstraction similar to Akka’s typed actors • Properly defined interface eases development • No longer locked in on Akka

Conclusion

▪ Different cluster environments have different deployment paradigms

▪ Support for “Job” as well as “Session” mode in various environments necessary

▪ Flip-6 architecture provides necessary flexibility to achieve both

Thank you!@stsffap @ApacheFlink @dataArtisans

We are hiring!

data-artisans.com/careers

Redesigning Apache Flink’s Distributed Architecture · Redesigning Apache Flink’s Distributed...

Documents

Transcript of Redesigning Apache Flink’s Distributed Architecture · Redesigning Apache Flink’s Distributed...

Redesigning learning spaces

REDESIGNING COGNITIVE TECHNOLOGIES

REDESIGNING HILLEL

Website redesigning essentials

Redesigning Leadership

Redesigning Trade Shows

Redesigning Professional Development

HISTORY OF AXIS SOAP. Apache SOAP 1.2, 2.1,3.0 refactoring ...twostarslost.com/y2014/archives/_2014feb/Web_Services_AXIS.pdf · Apache SOAP 1.2, 2.1,3.0 refactoring and redesigning

Redesigning India

Brand Rahul Redesigning

Redesigning the organization

Redesigning Redesign

Redesigning Preschool Classrooms

Redesigning Reservoir Ecosystems - oclwa.orgoclwa.org/pdf/2014Presentations/2_Patterson - Redesigning Reservoir... · Redesigning Reservoir Ecosystems For improved water quality &

Redesigning Civic Engagement

Website Redesigning Company

REDESIGNING WELFARE STATE

Redesigning America's Future

Website Redesigning Tips

Redesigning the Remote