Careers2018-11-27T15:21:40+00:00

Costruiamo insieme il tuo futuro

Concretizza i tuoi sogni

Scegli il percorso di tesi che più si avvicina alle tue passioni

Oltre a percorsi di tesi innovativi e tecnologicamente in linea con le richieste del mercato, offriamo la possibilità di ultimare il percorso di studi con stage curricolari, se sei interessato non devi farlo che candidarti!

Percorsi di tesi

copertina progetto di testi su fault management system on cloud

Fault Management System On Cloud

Ambito IoT & Cloud
Premessa: raccolta dati da 2 Raspberry PI, dotati di sensore SenseHat.
Scopo della tesi: inserimento dei dati su un sistema di Big data, Nosql (MongoDB su AWS), analisi in tempo reale dei parametri e previsione di futuri superamenti di soglia critici con conseguente invio di specifici alert.
Tecnologie da utilizzare: applicazione di algoritmi di Machine Learning, quali AWS, NoSql (Mongo su AWS), Python, Javascript, HTML.

Chiedi informazioni

Analisi predittiva su dati
clinici (applicabile a diversi contesti)

Ambito Deep Learning & Machine Learning
Premessa: dati clinici dei pazienti e identificazione di KPI che esprimano i fattori di rischio.
Scopo della tesi: identificazione e scelta degli algoritmi di clustering più opportuni, per selezionare gruppi di soggetti a rischio o potenziali malati.
Tecnologie da utilizzare: Python, Talend, Orange/R, Mysql/Postgress, PowerBI/Tableau.

Chiedi informazioni

Titolo: Implementazione di un’analisi predittiva su dati di tumore al seno mediante metodi di Data Mining.

Premessa: recupero dei dati dall’archivio dell’ Università del Wisconsin, descrizione e Data Cleaning attraverso l’utilizzo di Talend e PostgreSQL.
Scopo della tesi: sperimentazione di un processo che parte da un insieme di componenti software collegate in cascata in modo tale che il risultato del software precedente sia l’ingresso di quello successivo, al fine di giungere a un’analisi predittiva di ricorsività del tumore a partire da un set di dati di pazienti che sono stati già colpiti da tale malattia.
Tecnologie utilizzate: per la fase di Data Mining (ETL) è stato usato Talend (estrazione), PostgreSQL (trasformazione) e, infine, Orange (caricamento) utilizzato anche per la fase di Machine Learning.

L’obiettivo della mia Tesi di Laurea triennale è stato tentare di unificare delle componenti software collegate in cascata per creare un percorso tale per cui, inseriti alcuni dati nella prima componente ed eseguendo determinate operazioni, si potesse effettuare un’analisi predittiva di ricorsività di una malattia o di una determinata azione su persone o fatti.

A partire da un set di dati proveniente da un database consultabile negli archivi dell’Università del Wisconsin-Madison (USA), che ha per riferimento donne di età compresa tra i 10 e gli 80 anni affette da tumore al seno, è stata effettuata un’operazione di estrazione di dati trasformando il file in formato “.cvs” per favorire una migliore portabilità. Tale file è stato migrato da Talend a PostgreSQL attraverso un job automatico.

La prima fase di trasformazione è stata effettuata su PostgreSQL, attraverso un’operazione di Data Cleaning di dati incoerenti, errati e mancanti.

Il secondo step è consistito nella fase di caricamento. Ho richiamato il database con il set di dati pulito in Orange, avviando le operazioni di Machine Learning.
Per questi dati ho optato per un apprendimento supervisionato, scegliendo di confrontare tre Algoritmi di Classificazione: Albero di decisione, KNN e Naive Bayes

Nell’ultima fase ho inserito i risultati del miglior predittore in un Nomogramma, che permette una lettura facile e veloce degli elementi che più incidono nella ricorsività, mostrandone anche la percentuale.

Titolo:Progettazione e implementazione di un modello predittivo dell’incidenza di malattie tumorali basato su Machine Learning.

Premessa: Recupero e gestione dati sul portale ISTAT, attraverso l’utilizzo di Talend e Data Cleaning.
Tecnologie da utilizzare: Raccolta, gestione e filtraggio dati attraverso tecniche di Machine Learning & Data Visualization.
Scopo della tesi: Generazione di una proiezione riguardante la potenziale futura incidenza delle malattie tumorali sul territorio nazionale, effettuata grazie all’uso di Knime, ambiente orientato al Machine Learning. Finale miglioramento del grafico di previsione precedentemente prodotto al fine di creare un diagramma che meglio rappresentasse, a livello grafico e visivo, il concetto di Data Visualization.

Il mio progetto di Tesi di Laurea triennale ha l’obiettivo di creare un modello basato sul Machine Learning che sia in grado di eseguire previsioni a partire da un dataset contenente una grande quantità di informazioni circa i trascorsi sanitari relativi al territorio Italiano valutati nella finestra temporale 2003-2015.

Lo scopo finale della mia Tesi, in particolar modo, è stato quello di effettuare una proiezione in modo tale da ipotizzare la futura incidenza di malattie tumorali che potrebbe verificarsi sul territorio nazionale fino al decorrere dell’anno 2020.

La banca dati ISTAT ha rappresentato la fonte principale che ho utilizzato per il recupero delle informazioni necessarie alla mia ricerca; infatti, consultare questo portale mi ha permesso di estrarre le tavole della sanità con riferimento al fattore di mortalità assoluto.

Il workflow del progetto è stato suddiviso in tre fasi: recupero e gestione dei dati e generazione della previsione attraverso Machine Learning & Data Visualization.

Nella prima parte del progetto, realizzata in Talend, ho effettuato una ricerca delle informazioni sulla base delle quali ho poi sviluppato l’intero progetto. Una volta reperito il dataset di mio interesse, ho eseguito un primo filtraggio dei dati (in gergo tecnico, Data Cleaning) che mi ha permesso di eliminare tutte le informazioni che non erano rilevanti, in maniera tale da condurre l’indagine solo sui dati d’interesse, ossia quelli relativi alle malattie tumorali.

Nella seconda fase del workflow ho creato, attraverso l’uso di Knime, un ambiente orientato al Machine Learning, che mi ha permesso di analizzare le informazioni contenute all’interno del training set ed eseguire una previsione della futura evoluzione del modello selezionato.

Nella terza e ultima parte, invece, ho preso in input il grafico di previsione precedentemente prodotto al fine di creare un diagramma che meglio rappresentasse, a livello grafico e visivo, il concetto di Data Visualization.

copertina progetto di tesi su analisi predittiva sui dati
copertina progetto di tesi su analisi predittiva sui dati

Analisi predittiva su dati
clinici (applicabile a diversi contesti)

Ambito Deep Learning & Machine Learning
Premessa: dati clinici dei pazienti e identificazione di KPI che esprimano i fattori di rischio.
Scopo della tesi: identificazione e scelta degli algoritmi di clustering più opportuni, per selezionare gruppi di soggetti a rischio o potenziali malati.
Tecnologie da utilizzare: Python, Talend, Orange/R, Mysql/Postgress, PowerBI/Tableau.

Chiedi informazioni

Titolo: Implementazione di un’analisi predittiva su dati di tumore al seno mediante metodi di Data Mining.

Premessa: recupero dei dati dall’archivio dell’ Università del Wisconsin, descrizione e Data Cleaning attraverso l’utilizzo di Talend e PostgreSQL.
Scopo della tesi: sperimentazione di un processo che parte da un insieme di componenti software collegate in cascata in modo tale che il risultato del software precedente sia l’ingresso di quello successivo, al fine di giungere a un’analisi predittiva di ricorsività del tumore a partire da un set di dati di pazienti che sono stati già colpiti da tale malattia.
Tecnologie utilizzate: per la fase di Data Mining (ETL) è stato usato Talend (estrazione), PostgreSQL (trasformazione) e, infine, Orange (caricamento) utilizzato anche per la fase di Machine Learning.

L’obiettivo della mia Tesi di Laurea triennale è stato tentare di unificare delle componenti software collegate in cascata per creare un percorso tale per cui, inseriti alcuni dati nella prima componente ed eseguendo determinate operazioni, si potesse effettuare un’analisi predittiva di ricorsività di una malattia o di una determinata azione su persone o fatti.

A partire da un set di dati proveniente da un database consultabile negli archivi dell’Università del Wisconsin-Madison (USA), che ha per riferimento donne di età compresa tra i 10 e gli 80 anni affette da tumore al seno, è stata effettuata un’operazione di estrazione di dati trasformando il file in formato “.cvs” per favorire una migliore portabilità. Tale file è stato migrato da Talend a PostgreSQL attraverso un job automatico.

La prima fase di trasformazione è stata effettuata su PostgreSQL, attraverso un’operazione di Data Cleaning di dati incoerenti, errati e mancanti.

Il secondo step è consistito nella fase di caricamento. Ho richiamato il database con il set di dati pulito in Orange, avviando le operazioni di Machine Learning.
Per questi dati ho optato per un apprendimento supervisionato, scegliendo di confrontare tre Algoritmi di Classificazione: Albero di decisione, KNN e Naive Bayes

Nell’ultima fase ho inserito i risultati del miglior predittore in un Nomogramma, che permette una lettura facile e veloce degli elementi che più incidono nella ricorsività, mostrandone anche la percentuale.

Titolo:Progettazione e implementazione di un modello predittivo dell’incidenza di malattie tumorali basato su Machine Learning.

Premessa: Recupero e gestione dati sul portale ISTAT, attraverso l’utilizzo di Talend e Data Cleaning.
Tecnologie da utilizzare: Raccolta, gestione e filtraggio dati attraverso tecniche di Machine Learning & Data Visualization.
Scopo della tesi: Generazione di una proiezione riguardante la potenziale futura incidenza delle malattie tumorali sul territorio nazionale, effettuata grazie all’uso di Knime, ambiente orientato al Machine Learning. Finale miglioramento del grafico di previsione precedentemente prodotto al fine di creare un diagramma che meglio rappresentasse, a livello grafico e visivo, il concetto di Data Visualization.

Il mio progetto di Tesi di Laurea triennale ha l’obiettivo di creare un modello basato sul Machine Learning che sia in grado di eseguire previsioni a partire da un dataset contenente una grande quantità di informazioni circa i trascorsi sanitari relativi al territorio Italiano valutati nella finestra temporale 2003-2015.

Lo scopo finale della mia Tesi, in particolar modo, è stato quello di effettuare una proiezione in modo tale da ipotizzare la futura incidenza di malattie tumorali che potrebbe verificarsi sul territorio nazionale fino al decorrere dell’anno 2020.

La banca dati ISTAT ha rappresentato la fonte principale che ho utilizzato per il recupero delle informazioni necessarie alla mia ricerca; infatti, consultare questo portale mi ha permesso di estrarre le tavole della sanità con riferimento al fattore di mortalità assoluto.

Il workflow del progetto è stato suddiviso in tre fasi: recupero e gestione dei dati e generazione della previsione attraverso Machine Learning & Data Visualization.

Nella prima parte del progetto, realizzata in Talend, ho effettuato una ricerca delle informazioni sulla base delle quali ho poi sviluppato l’intero progetto. Una volta reperito il dataset di mio interesse, ho eseguito un primo filtraggio dei dati (in gergo tecnico, Data Cleaning) che mi ha permesso di eliminare tutte le informazioni che non erano rilevanti, in maniera tale da condurre l’indagine solo sui dati d’interesse, ossia quelli relativi alle malattie tumorali.

Nella seconda fase del workflow ho creato, attraverso l’uso di Knime, un ambiente orientato al Machine Learning, che mi ha permesso di analizzare le informazioni contenute all’interno del training set ed eseguire una previsione della futura evoluzione del modello selezionato.

Nella terza e ultima parte, invece, ho preso in input il grafico di previsione precedentemente prodotto al fine di creare un diagramma che meglio rappresentasse, a livello grafico e visivo, il concetto di Data Visualization.

copertina progetto tesi su analisi di rischi idreogeologici

Analisi dei rischi idrogeologici

Ambito Data Mining & Machine Learning
Premessa: raccolta e incrocio dati sui fenomeni meteorologici e sul rischio idrogeologico, più altre fonti.
Scopo della tesi: identificazione dei fattori di rischio che, visualizzati su una distribuzione geospaziale, possano evidenziare zone di allerta e di pericolo.
Tecnologie da utilizzare: Python, Spark, talend, R / Orange.

Chiedi informazioni

Le tue passioni incontrano il mondo del lavoro

Scopri i nostri percorsi di stage extracurricolari e Academy

Il passaggio dal mondo universitario a quello lavorativo può presentare degli ostacoli. Il nostro obiettivo è quello di aiutarti a capire come le tue passioni possono trovare un riscontro effettivo nel mondo del lavoro.

Le nostre opportunità per i neolaureati