INF550 - Computação em Nuvem I
Experimento com Spark
Instalação do Spark
Na primeira parte do experimento, você deve instalar o Spark:
$ wget http://ftp.unicamp.br/pub/apache/spark/spark-2.1.1/spark-2.1.1-bin-hadoop2.7.tgz
Descompacte com
$ tar xzf spark-2.1.1-bin-hadoop2.7.tgz
Utilize o pyspark em:
$ bin/pyspark
Exercício para entrega:
Utilizando o arquivo tcpdump.list fornecido pela DARPA elabore no mínimo três manipulações/consultas interessantes sobre os dados. Tenha em mente que você está pensando em detectar um ataque.
Escreva um relatório contendo a motivação, o código das consultas e exemplos do resultado.
O trabalho pode ser feito em duplas e entregue pelo Moodle.