Spark

Description

Big data Flashcards on Spark, created by Primo Deckers on 01/03/2017.
Primo Deckers
Flashcards by Primo Deckers, updated more than 1 year ago
Primo Deckers
Created by Primo Deckers over 7 years ago
20
1

Resource summary

Question Answer
Engine de execução generalista ? Spark
Sua exeção é baseada em Resilient Distributed Datasets? RDD
Outros Frameworks especializam O Spark generaliza
RDDs São coleções particionadas de dados; Criados por operações determinísticas (Transformações) em outro RDD ou arquivo; O usuário define o particionamento (otimizações de localidade) e armazenamento (RAM, disco).
É uma Engine de execução generalista Seu processamento é: Iterativo; em Batch; Streaming(simulado)
O Spark possui? Armazenamento Temporario em Ram ou disco; Leitura e escrita em diversos formatos: CVS; Json; Parquet; Arquivos de texto simples; Leitura escrita de diversas fontes: Arquivos locais; HDFS; S3; JDBC/ODBC;
O Spark possui? Mais de 80 operadores, intercambiaveis com consultas SQL: Map; reduceByKey; Filter; SortByKey; Três APIs principais de uso: RDDs; Datarames; Datasets (experimental)
Linguagens: Scala (principal); Java; Python; R;
O spark é executado em varios ambientes Standalone; Hadoop Yarn (gerenciador de recursos e tarefas do hadoop); Mesos;
Sub-projetos SPARK Spark Streaming (simula operações em tempo real utilizando mini batch); Spark SQL; MLLib (Aprendizado de maquina); GraphX (processamento de grafos com suporte a Pregel)
Comparativo com outros frameworks
Show full summary Hide full summary

Similar

Big Data
djalma.melo
BIG DATA
Eduardo Diniz
011 - Conceito - Big Data Analytics
Projetos Casal2004
A Level: English language and literature techniques = Lexis
Jessica 'JessieB
Romeo and Juliet: Key Points
mbennett
Haemoglobin
Elena Cade
Physics 1
Peter Hoskins
1_PSBD New Edition
Ps Test
2PR101 1.test - 3. část
Nikola Truong
1PR101 2.test - Část 4.
Nikola Truong