INF550 - Computação em Nuvem I
Experimento com Spark
Instalação do Spark
Na primeira parte do experimento, você deve instalar o Spark:
$ wget http://ftp.unicamp.br/pub/apache/spark/spark-1.6.2/spark-1.6.2-bin-hadoop2.6.tgz
Descompacte com
$ tar xzf spark-1.6.2-bin-hadoop2.6.tgz
Utilize o pyspark em:
$ bin/pyspark
Exercício para entrega:
Utilizando os arquivos fourhour-tcpdump.list e tcpdump.list fornecidos pela DARPA elabore no mínimo três manipulações/consultas interessantes sobre os dados. Tenha em mente que você está pensando em detectar um ataque.
Escreva um relatório contendo a motivação, o código das consultas e exemplos do resultado.
O trabalho pode ser feito em duplas e entregue pelo Moodle.