DissertationsEnLigne.com - Dissertations gratuites, mémoires, discours et notes de recherche
Recherche

Cluster analysis

Mémoire : Cluster analysis. Rechercher de 53 000+ Dissertation Gratuites et Mémoires

Par   •  31 Mars 2020  •  Mémoire  •  5 522 Mots (23 Pages)  •  607 Vues

Page 1 sur 23

Alessandro Frigerio 848692

Applicazione della Cluster Analysis nei farmaci antipertensivi

Indice:

  1. Introduzione                                                                                    pag. 2
  2. Costruzione del dataset                                                                 pag. 3
  3. Analisi preliminare                                                                          pag. 10
  4. Analisi descrittiva                                                                            pag. 11
  5. Analisi cluster                                                                                   pag. 14
  6. Descrizione dei cluster                                                                    pag. 25
  7. Conclusioni                                                                                        pag. 30
  8. Bibliografia                                                                                        pag. 31

Introduzione

L’analisi cluster consiste in un insieme di tecniche di analisi statistica multivariata dei dati atte ad individuare unità simi tra loro rispetto ad un insieme di variabili prese in considerazione e secondo un criterio specifico. L’obiettivo è dunque quello di riunire unità tra loro eterogenee in più sottoinsiemi tendenzialmente omogenei e mutuamente esaustivi. Le unità statistiche vengono suddivise quindi in un numero di gruppi a seconda del loro livello di somiglianza valutata a partire dai valori che la serie di variabili prescelte assume in ciascuna unità. La cluster analysis consente allora di pervenire ai seguenti obiettivi:

  • Generazione di ipotesi di ricerca
  • Riduzione dei dati, anche in forma grafica, in modo da rendere chiara e facile la lettura delle informazioni rilevate
  • La ricerca tipologica per individuare gruppi di unità statistiche con caratteristiche distintive che facciano risaltare a fisionomia del sistema osservato
  • La costruzione di sistemi di classificazione automatica
  • La ricerca di classi omogenee, dentro le quali si può supporre che i membri siano mutuamente surrogabili

Questo tipo di analisi è utilizzata per diversi scopi tra la creazione di segmentazioni di mercato riferite a prodotti e consumatori.

Le fasi dell’applicazione dell’analisi cluster sono 5 e possono essere così elencat:

  • La scelta delle variabili di classificazione e quindi la costruzione del dataset
  • La scelta di una misura di dissomiglianza esistente fra le unità statistiche
  • La scelta di un idoneo algoritmo di raggruppamento
  • Valutazione della partizione ottenuta e fissazione del numero ottimale di gruppi
  • Interpretazione dei risultati ottenuti e conclusioni

Gli algoritmi di clustering raggruppano i vari elementi sulla base della loro distanza reciproca in diversi gruppi. L’appartenenza al gruppo dell’elemento dipende perciò da quanto l’elemento preso in considerazione è distante dall’insieme stesso.

Lo scopo dell’analisi quindi è quello di minimizzare la distanza all’interno dei cluster e massimizzare la distanza tra i vari cluster in modo da identificare un minor un numero di gruppi tali che gli elementi appartenenti ad un gruppo siano più simili tra loro che non agli elementi appartenenti agli altri gruppi. La distanza viene quantificata per mezzo di misure di similarità/ dissimilarità definite tra le unità statistiche.

Costruzione del dataset

La ricerca effettuata è un’analisi cluster dei farmaci utilizzati nella terapia dell’ipertensione arteriosa nell’organismo umano.

L’ipertensione arteriosa è uno stato in cui la pressione arteriosa a riposo risulta più alta rispetto agli standard fisiologici considerati normali. Nei Paesi industrializzati l’ipertensione colpisce circa il 30% della popolazione adulta e rappresenta uno dei maggiori problemi clinici dei tempi moderni. L’ipertensione arteriosa non è una malattia ma un fattore di rischio, cioè una condizione che aumenta la probabilità che si verifichino altre malattie cardiovascolari; non comporta alcun sintomo nell’immediato, ma degenera spesso in complicanze severe talvolta dagli esiti irrimediabili. Per questo motivo l’ipertensione viene trattata opportunamente, oltre tramite un cambiamento dello stile di vita del paziente, con il ricorso a farmaci specifici.    

I medicinali antiipertensivi si dividono in diversi gruppi farmaceutici: diuretici, beta-bloccanti, calcio-antagonisti, vasodilatatori, ACE- inibitori, antagonisti del recettore dell’angiotensina II e gli inibitori del sistema renina-angiotensina. Nella costruzione del dataset sono stati presi in considerazione farmaci dei vari gruppi.

Nell’elaborato sono stati presi in considerazione i principali farmaci in commercio in Europa in grado di controllare la pressione arteriosa.

Obiettivo di questa ricerca è dunque la classificazione e suddivisione in cluster dei farmaci utilizzati per la terapia dell’ipertensione.

Il dataset su cui è stata svolta l’analisi è stato ricavato dal database del sito Toxnet e dal database del sito My Personal Trainer. I prezzi dei farmaci sono in commercio è stato utilizzato il sito Farmaci.dottori.it.

Per la costruzione del dataset sono stati presi in considerazione esclusivamente farmaci antiipertensivi che vengono utilizzati solamente per un livello di ipertensione di livello medio. Quando si fa riferimento ad un farmaco, il nome del farmaco è sempre accompagnato dal nome del principio attivo contenuto nello stesso farmaco.

Inizialmente il dataset comprendeva circa 100 farmaci ma è stato poi ridotto in modo da rendere più leggera e semplice l’analisi dei vari elementi.

Nella prima fase della riduzione sono stati rimossi i farmaci fuori commercio o non più autorizzati. Nella seconda fase si è scelto di tenere i farmaci contenenti un solo principio attivo ed escludere quelli contenenti due o tre principi attivi. In seguito, per un’ulteriore riduzione di dati, si è scelto di escludere quei farmaci dalle proprietà molto simili tra loro, contenenti quindi lo stesso principio attivo. Perciò ogni principio attivo presente appartiene ad un solo farmaco, scelto in maniera casuale tra i farmaci che contengono quello specifico principio attivo.

Sotto sono riportati i farmaci esclusi a causa del contenimento di due o più principi attivi e che perciò non faranno parte del nostro dataset.

Atover

Enalapril

Lercanidipina

 

Bivis

Olmesartan

Amlodipina

 

Blopresid

Candesartan

Idroclorotiazide

 

CoAprovel

Irbesartan

Idroclorotiazide

 

Combisartan

Valsartan

Idroclorotiazide

 

Copalia HTC

Amlodipina

Valsartan

Idroclorotiazide

Coverlam

Perindopril

Amlodipina

 

Coripren

Enalapril

Lercanidipina

 

Dafiro HCT

Amlodipina

Valsartan

Idroclorotiazide

Exforge HCT

Amlodipina

Valsartan

Idroclorotiazide

Idroquark

Rampiril

Idroclorotiazide

 

Imprida HCT

Amlodipina

Valsartan

Idroclorotiazide

Karvezide

Irbesartan

Idroclorotiazide

 

Kinzalkomb

Telmisartan

Idroclorotiazide

 

Micardis Plus

Telmisartan

Idroclorotiazide

 

Olmegan

Olmesartan

Idroclorotiazide

 

Olprezide

Olmesartan

Idroclorotiazide

 

Onduarp

Telmisartan

Amlodipina

 

Plaunazide

Olmesartan

Idroclorotiazide

 

Prelectal

Perindopril

Indapamide

 

Preterax

Perindopril

Indapamide

 

Pritor plus

Telmisartan

Idroclorotiazide

 

Sprimeo HCT

Aliskiren

Idroclorotiazide

 

Tenoretic

Atenololo

Clortalidone

 

Teraxans

Perindopril

Indapamide

 

Twinsta

Telmisartan

Amlodipina

 

...

Télécharger au format  txt (44.6 Kb)   pdf (326.3 Kb)   docx (142.3 Kb)  
Voir 22 pages de plus »
Uniquement disponible sur DissertationsEnLigne.com