Let’s build your future together

Make your dreams come true

Choose the thesis path that is closest to your passions

In addition to innovative theses technologically in line with market demands, we offer the possibility of completing studies with curricular internships. If you are interested, all you have to do is apply!!

Thesis pathways with ThinkOpen

copertina progetto di testi su fault management system on cloud

Fault Management System On Cloud

Area: IoT & Cloud
Introduction: data collection from 2 Raspberry Pis, equipped with a SenseHat sensor.

Purpose of the thesis: data entry on a Big data system, Nosql (MongoDB on AWS), real-time analysis of the parameters, and forecast of future critical threshold exceedances with consequential sending of specific alerts.

Technologies to be used: application of Machine Learning algorithms, such as AWS, NoSql (Mongo on AWS), Python, Javascript, HTML.

ASK FOR INFORMATION

Predictive data analysis clinical (applicable to different contexts)

Area: Deep Learning & Machine Learning
Introduction: patient clinical data and identification of KPIs that express risk factors.

Purpose of the thesis: identification and choice of the most appropriate clustering algorithms, to select groups of subjects at risk or potential patients.

Technologies to be used: Python, Talend, Orange/R, Mysql/Postgress, PowerBI/Tableau.

 

ASK FOR INFORMATION

Titolo: Implementazione di un’analisi predittiva su dati di tumore al seno mediante metodi di Data Mining.

Premessa: recupero dei dati dall’archivio dell’ Università del Wisconsin, descrizione e Data Cleaning attraverso l’utilizzo di Talend e PostgreSQL.
Scopo della tesi: sperimentazione di un processo che parte da un insieme di componenti software collegate in cascata in modo tale che il risultato del software precedente sia l’ingresso di quello successivo, al fine di giungere a un’analisi predittiva di ricorsività del tumore a partire da un set di dati di pazienti che sono stati già colpiti da tale malattia.
Tecnologie utilizzate: per la fase di Data Mining (ETL) è stato usato Talend (estrazione), PostgreSQL (trasformazione) e, infine, Orange (caricamento) utilizzato anche per la fase di Machine Learning.

L’obiettivo della mia Tesi di Laurea triennale è stato tentare di unificare delle componenti software collegate in cascata per creare un percorso tale per cui, inseriti alcuni dati nella prima componente ed eseguendo determinate operazioni, si potesse effettuare un’analisi predittiva di ricorsività di una malattia o di una determinata azione su persone o fatti.

A partire da un set di dati proveniente da un database consultabile negli archivi dell’Università del Wisconsin-Madison (USA), che ha per riferimento donne di età compresa tra i 10 e gli 80 anni affette da tumore al seno, è stata effettuata un’operazione di estrazione di dati trasformando il file in formato “.cvs” per favorire una migliore portabilità. Tale file è stato migrato da Talend a PostgreSQL attraverso un job automatico.

La prima fase di trasformazione è stata effettuata su PostgreSQL, attraverso un’operazione di Data Cleaning di dati incoerenti, errati e mancanti.

Il secondo step è consistito nella fase di caricamento. Ho richiamato il database con il set di dati pulito in Orange, avviando le operazioni di Machine Learning.
Per questi dati ho optato per un apprendimento supervisionato, scegliendo di confrontare tre Algoritmi di Classificazione: Albero di decisione, KNN e Naive Bayes

Nell’ultima fase ho inserito i risultati del miglior predittore in un Nomogramma, che permette una lettura facile e veloce degli elementi che più incidono nella ricorsività, mostrandone anche la percentuale.

Titolo:Progettazione e implementazione di un modello predittivo dell’incidenza di malattie tumorali basato su Machine Learning.

Premessa: Recupero e gestione dati sul portale ISTAT, attraverso l’utilizzo di Talend e Data Cleaning.
Tecnologie da utilizzare: Raccolta, gestione e filtraggio dati attraverso tecniche di Machine Learning & Data Visualization.
Scopo della tesi: Generazione di una proiezione riguardante la potenziale futura incidenza delle malattie tumorali sul territorio nazionale, effettuata grazie all’uso di Knime, ambiente orientato al Machine Learning. Finale miglioramento del grafico di previsione precedentemente prodotto al fine di creare un diagramma che meglio rappresentasse, a livello grafico e visivo, il concetto di Data Visualization.

Il mio progetto di Tesi di Laurea triennale ha l’obiettivo di creare un modello basato sul Machine Learning che sia in grado di eseguire previsioni a partire da un dataset contenente una grande quantità di informazioni circa i trascorsi sanitari relativi al territorio Italiano valutati nella finestra temporale 2003-2015.

Lo scopo finale della mia Tesi, in particolar modo, è stato quello di effettuare una proiezione in modo tale da ipotizzare la futura incidenza di malattie tumorali che potrebbe verificarsi sul territorio nazionale fino al decorrere dell’anno 2020.

La banca dati ISTAT ha rappresentato la fonte principale che ho utilizzato per il recupero delle informazioni necessarie alla mia ricerca; infatti, consultare questo portale mi ha permesso di estrarre le tavole della sanità con riferimento al fattore di mortalità assoluto.

Il workflow del progetto è stato suddiviso in tre fasi: recupero e gestione dei dati e generazione della previsione attraverso Machine Learning & Data Visualization.

Nella prima parte del progetto, realizzata in Talend, ho effettuato una ricerca delle informazioni sulla base delle quali ho poi sviluppato l’intero progetto. Una volta reperito il dataset di mio interesse, ho eseguito un primo filtraggio dei dati (in gergo tecnico, Data Cleaning) che mi ha permesso di eliminare tutte le informazioni che non erano rilevanti, in maniera tale da condurre l’indagine solo sui dati d’interesse, ossia quelli relativi alle malattie tumorali.

Nella seconda fase del workflow ho creato, attraverso l’uso di Knime, un ambiente orientato al Machine Learning, che mi ha permesso di analizzare le informazioni contenute all’interno del training set ed eseguire una previsione della futura evoluzione del modello selezionato.

Nella terza e ultima parte, invece, ho preso in input il grafico di previsione precedentemente prodotto al fine di creare un diagramma che meglio rappresentasse, a livello grafico e visivo, il concetto di Data Visualization.

copertina progetto di tesi su analisi predittiva sui dati
copertina progetto tesi su analisi di rischi idreogeologici

Hydrogeological risk analysis

Area: Data Mining & Machine Learning

Premise: collection and crossing of data on meteorological phenomena and on hydrogeological risk, plus other sources.

Purpose of the thesis: identification of the risk factors that, displayed on a geospatial distribution, can highlight areas of alert and danger.

Technologies to use: Python, Spark, Talend, R/Orange.

ASK FOR INFORMATION

Your passions meet the labor market

Discover our extra-curricular internships and courses

The transition from university to the working world can present issues. Our goal is to help you understand how your passions can find effective feedback in the world of work.

Our opportunities for recent graduates