WilmaSurvey

Statistica

Tutto il software per l’analisi statistica è sviluppato in R. E’ stata fatta questa scelta per le caratteristiche che R presenta, che possono essere così riassunte.

  • Anzitutto è particolarmente indicato per la didattica della statistica perchè, a differenza di altri software, induce ad un uso critico degli strumenti statistici. E’ un prodotto open source, scaricabile dalla rete a costo nullo, con disponibilità del codice sorgente.
  • E’ orientato alla programmazione ad oggetti e ciò rende estremamente semplice la gestione e la manipolazione dei dati statistici.
  • Dispone di strumenti di analisi statistica dai più elementari ai più sofisticati.
  • E’ estremamente versatile perchè può essere integrato con altri prodotti informatici. Questo ci ha permesso, con la scrittura di apposite funzioni, di accedere da R al data base per la lettura dei dati e di presentare i risultati delle elaborazioni in un formato adatto alla loro pubblicazione automatica sul sito.

Il software statistico mediante delle interrogazioni SQL fatte al database estrae i dati del sondaggio e grazie all’utilizzo di specifiche funzioni effettua le elaborazioni che vengono poi salvate in file di tipo XML. Questo consente di tenere separate l’ elaborazione dei dati e la visualizzazione dei risultati e quindi da la possibilità, mediante opportune trasformazioni, di presentare i risultati in diversi formati (pagine WEB, documento PDF).
Le funzioni da noi realizzate sono state organizzate, in base alle loro funzionalità, in librerie e strutturate secondo lo schema seguente: Ci sono le seguenti librerie di funzioni di base:

  • funzioni data base che leggono i dati contenuti nel data base;
  • funzioni statistiche che eseguono:
    statistiche di base; in particolare calcolano i vari tipi di frequenze per distribuzioni univariate e bivariate, la moda, la mediana, lo scarto quadratico medio, i quartili, gli indici di simmetria e curtosi,
    stime puntuali ed intervallari,
    test parametrici, funzionali e di indipendenza;
  • funzioni utili che contengono funzioni di utilità;
  • funzioni XML che creano file XML e, attraverso pagine PHP, le pagine del sito;

Queste librerie realizzano funzionalità di base per l’accesso ai dati, per la loro elaborazione statistica e per il salvataggio dei risultati su file. In particolare le funzioni statistiche e le funzioni utili sono del tutto generali in quanto non dipendono nè dal data base nè da una specifica indagine. Questo consente il loro utilizzo anche in ambiti diversi da quello per cui sono state create.
Componendo le funzioni di base sopra descritte sono state implementate delle funzioni più complesse che corrispondono alle tipologie di analisi che tipicamente vengono eseguite in ambito statistico. Esse sono:

  • macro_sing_qual_non_ordinabile: specificando, attraverso i parametri, il nome della domanda del questionario che si intende elaborare, riferita ad un carattere non ordinabile, produce la tabella delle frequenze assolute e relative, la moda e i dati necessari per la costruzione del grafico.
  • macro_sing_qual_ordinabile: specificando, attraverso i parametri, il nome della domanda del questionario che si intende elaborare, riferita ad un carattere qualitativo ordinabile, produce la tabella delle frequenze assolute, relative, cumulate, la moda, la mediana, i quartili e i dati necessari
  • per la costruzione del grafico. macro_sing_quant_discreta: specificando, attraverso i parametri, il nome della domanda del questionario che si intende elaborare, riferita ad un carattere quantitativo discreto, produce la tabella delle frequenze assolute, relative, cumulate, la moda, la mediana, i quartili, gli indici di asimmetria e curtosi e i dati necessari per la costruzione del grafico.
  • macro_sing_quant_continua: specificando, attraverso i parametri, il nome della domanda del questionario che si intende elaborare, riferita ad un carattere quantitativo continuo, produce la tabella delle frequenze assolute, relative, cumulate, organizzate in classi, la moda, la mediana, i quartili, gli indici asimmetria e curtosi e i dati necessari per la costruzione del grafico.
  • analisi_doppia: fa l’incrocio tra due domande, in particolare calcola le frequenze congiunte relative, le distribuzioni condizionate, esegue il test del chi-quadro per verificare l’indipendenza tra i due caratteri e produce i dati necessari per la costruzione del grafico.
  • macro_multipla: analizza una domanda a risposta multipla e produce una tabella con le frequenze assolute, relative e cumulate delle varie combinazioni delle risposte date dagli intervistati. Vengono considerate solo le combinazioni con maggior frequenza.
  • macro_ordinata: analizza una domanda in cui si richiede all’ intervistato di ordinare una serie di risposte. Restituisce una tabella in cui viene indicata per ciascuna risposta la frequenza assoluta o relativa della posizione in cui è stata collocata dagli intervistati.
  • macro_test_chi: esegue il test del chi-quadro per verificare la bontà di adattamento dei dati ad una distribuzione teorica specificata.
  • macro_test_p1_meno_p2: esegue il test per la verifica d’ ipotesi su due frequenze nei casi di maggiore, minore e diverso.

I file di output sono di tipo XML e sono organizzati nel seguente modo: per ogni domanda viene creato un file indice che contiene l’ elenco delle analisi fatte sulla domanda e ciascuna riga dell’ elenco contiene un riferimento (URL) al file dei risultati specifici dell’ analisi cui la riga si riferisce.

Sondaggi