Cluster analysis
Mémoire : Cluster analysis. Rechercher de 53 000+ Dissertation Gratuites et MémoiresPar Alessandro Frigerio • 31 Mars 2020 • Mémoire • 5 522 Mots (23 Pages) • 629 Vues
Alessandro Frigerio 848692
Applicazione della Cluster Analysis nei farmaci antipertensivi
Indice:
- Introduzione pag. 2
- Costruzione del dataset pag. 3
- Analisi preliminare pag. 10
- Analisi descrittiva pag. 11
- Analisi cluster pag. 14
- Descrizione dei cluster pag. 25
- Conclusioni pag. 30
- Bibliografia pag. 31
Introduzione
L’analisi cluster consiste in un insieme di tecniche di analisi statistica multivariata dei dati atte ad individuare unità simi tra loro rispetto ad un insieme di variabili prese in considerazione e secondo un criterio specifico. L’obiettivo è dunque quello di riunire unità tra loro eterogenee in più sottoinsiemi tendenzialmente omogenei e mutuamente esaustivi. Le unità statistiche vengono suddivise quindi in un numero di gruppi a seconda del loro livello di somiglianza valutata a partire dai valori che la serie di variabili prescelte assume in ciascuna unità. La cluster analysis consente allora di pervenire ai seguenti obiettivi:
- Generazione di ipotesi di ricerca
- Riduzione dei dati, anche in forma grafica, in modo da rendere chiara e facile la lettura delle informazioni rilevate
- La ricerca tipologica per individuare gruppi di unità statistiche con caratteristiche distintive che facciano risaltare a fisionomia del sistema osservato
- La costruzione di sistemi di classificazione automatica
- La ricerca di classi omogenee, dentro le quali si può supporre che i membri siano mutuamente surrogabili
Questo tipo di analisi è utilizzata per diversi scopi tra la creazione di segmentazioni di mercato riferite a prodotti e consumatori.
Le fasi dell’applicazione dell’analisi cluster sono 5 e possono essere così elencat:
- La scelta delle variabili di classificazione e quindi la costruzione del dataset
- La scelta di una misura di dissomiglianza esistente fra le unità statistiche
- La scelta di un idoneo algoritmo di raggruppamento
- Valutazione della partizione ottenuta e fissazione del numero ottimale di gruppi
- Interpretazione dei risultati ottenuti e conclusioni
Gli algoritmi di clustering raggruppano i vari elementi sulla base della loro distanza reciproca in diversi gruppi. L’appartenenza al gruppo dell’elemento dipende perciò da quanto l’elemento preso in considerazione è distante dall’insieme stesso.
Lo scopo dell’analisi quindi è quello di minimizzare la distanza all’interno dei cluster e massimizzare la distanza tra i vari cluster in modo da identificare un minor un numero di gruppi tali che gli elementi appartenenti ad un gruppo siano più simili tra loro che non agli elementi appartenenti agli altri gruppi. La distanza viene quantificata per mezzo di misure di similarità/ dissimilarità definite tra le unità statistiche.
Costruzione del dataset
La ricerca effettuata è un’analisi cluster dei farmaci utilizzati nella terapia dell’ipertensione arteriosa nell’organismo umano.
L’ipertensione arteriosa è uno stato in cui la pressione arteriosa a riposo risulta più alta rispetto agli standard fisiologici considerati normali. Nei Paesi industrializzati l’ipertensione colpisce circa il 30% della popolazione adulta e rappresenta uno dei maggiori problemi clinici dei tempi moderni. L’ipertensione arteriosa non è una malattia ma un fattore di rischio, cioè una condizione che aumenta la probabilità che si verifichino altre malattie cardiovascolari; non comporta alcun sintomo nell’immediato, ma degenera spesso in complicanze severe talvolta dagli esiti irrimediabili. Per questo motivo l’ipertensione viene trattata opportunamente, oltre tramite un cambiamento dello stile di vita del paziente, con il ricorso a farmaci specifici.
I medicinali antiipertensivi si dividono in diversi gruppi farmaceutici: diuretici, beta-bloccanti, calcio-antagonisti, vasodilatatori, ACE- inibitori, antagonisti del recettore dell’angiotensina II e gli inibitori del sistema renina-angiotensina. Nella costruzione del dataset sono stati presi in considerazione farmaci dei vari gruppi.
Nell’elaborato sono stati presi in considerazione i principali farmaci in commercio in Europa in grado di controllare la pressione arteriosa.
Obiettivo di questa ricerca è dunque la classificazione e suddivisione in cluster dei farmaci utilizzati per la terapia dell’ipertensione.
Il dataset su cui è stata svolta l’analisi è stato ricavato dal database del sito Toxnet e dal database del sito My Personal Trainer. I prezzi dei farmaci sono in commercio è stato utilizzato il sito Farmaci.dottori.it.
Per la costruzione del dataset sono stati presi in considerazione esclusivamente farmaci antiipertensivi che vengono utilizzati solamente per un livello di ipertensione di livello medio. Quando si fa riferimento ad un farmaco, il nome del farmaco è sempre accompagnato dal nome del principio attivo contenuto nello stesso farmaco.
Inizialmente il dataset comprendeva circa 100 farmaci ma è stato poi ridotto in modo da rendere più leggera e semplice l’analisi dei vari elementi.
Nella prima fase della riduzione sono stati rimossi i farmaci fuori commercio o non più autorizzati. Nella seconda fase si è scelto di tenere i farmaci contenenti un solo principio attivo ed escludere quelli contenenti due o tre principi attivi. In seguito, per un’ulteriore riduzione di dati, si è scelto di escludere quei farmaci dalle proprietà molto simili tra loro, contenenti quindi lo stesso principio attivo. Perciò ogni principio attivo presente appartiene ad un solo farmaco, scelto in maniera casuale tra i farmaci che contengono quello specifico principio attivo.
Sotto sono riportati i farmaci esclusi a causa del contenimento di due o più principi attivi e che perciò non faranno parte del nostro dataset.
Atover | Enalapril | Lercanidipina |
|
Bivis | Olmesartan | Amlodipina |
|
Blopresid | Candesartan | Idroclorotiazide |
|
CoAprovel | Irbesartan | Idroclorotiazide |
|
Combisartan | Valsartan | Idroclorotiazide |
|
Copalia HTC | Amlodipina | Valsartan | Idroclorotiazide |
Coverlam | Perindopril | Amlodipina |
|
Coripren | Enalapril | Lercanidipina |
|
Dafiro HCT | Amlodipina | Valsartan | Idroclorotiazide |
Exforge HCT | Amlodipina | Valsartan | Idroclorotiazide |
Idroquark | Rampiril | Idroclorotiazide |
|
Imprida HCT | Amlodipina | Valsartan | Idroclorotiazide |
Karvezide | Irbesartan | Idroclorotiazide |
|
Kinzalkomb | Telmisartan | Idroclorotiazide |
|
Micardis Plus | Telmisartan | Idroclorotiazide |
|
Olmegan | Olmesartan | Idroclorotiazide |
|
Olprezide | Olmesartan | Idroclorotiazide |
|
Onduarp | Telmisartan | Amlodipina |
|
Plaunazide | Olmesartan | Idroclorotiazide |
|
Prelectal | Perindopril | Indapamide |
|
Preterax | Perindopril | Indapamide |
|
Pritor plus | Telmisartan | Idroclorotiazide |
|
Sprimeo HCT | Aliskiren | Idroclorotiazide |
|
Tenoretic | Atenololo | Clortalidone |
|
Teraxans | Perindopril | Indapamide |
|
Twinsta | Telmisartan | Amlodipina |
|
...