Skip to content

First Project of 2021-2022 Big Data course at Roma Tre University.

Notifications You must be signed in to change notification settings

mgranchelli/Progetto1BigData

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Corso di Big Data - Progetto 1

Specifiche dei Job:

  • Job1: Un job che sia in grado di generare, per ciascun anno, le dieci parole che sono state più usate nelle recensioni (campo text) in ordine di frequenza, indicando, per ogni parola, il numero di occorrenze della parola nell’anno.

  • Job2: Un job che sia in grado di generare, per ciascun utente, i prodotti preferiti (ovvero quelli che ha recensito con il punteggio più alto) fino a un massimo di 5, indicando ProductId e Score. Il risultato deve essere ordinato in base allo UserId.

  • Job3: Un job in grado di generare coppie di utenti con gusti affini, dove due utenti hanno gusti affini se hanno recensito con score superiore o uguale a 4 almeno tre prodotti in comune, indicando le coppie di utenti e i prodotti recensiti che condividono. Il risultato deve essere ordinato in base allo UserId del primo elemento della coppia e non deve presentare duplicati.

Il dataset utilizzato è il seguente: Amazon Fine Food Reviews.

About

First Project of 2021-2022 Big Data course at Roma Tre University.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published