PSPP non sostituisce SPSS, ma aiuta.
Di gLuKa (del 14/02/2009 @ 12:53:34, in come fare per..., visto 1489 volte)
blog reactions

Gli aggioramenti a questo post con i vari test e istruzioni, li trovate qui.



logo PSPP
Sono rimasto piacevomente colpito dalla distribuzione della nuova versione di PSPP (la 0.6.1), avvenuta ormai qualche mese fa, che solo oggi ho avuto modo di provare.

Per quanti non conoscano il software in questione, dicamo semplicemente che è un programma di analisi statistica (semplice) dei dati che si propone di intaccare il "monopolio" del famoso SPSS, il tutto secondo la filosofia GNU, quindi gratuito.

Direi che PSPP è il primo pensiero di quanti, come me, hanno l'esigenza di utilizzare SPSS, ma su sistemi diversi da Microsoft. Questo problema in realtà è stato parzialmente aggirato dai programmatori di SPSS stessi, che hanno lanciato dalla versione 16 in poi (attualmente la versione ultima è la 17), le distribuzioni per Linux.
Il problema grosso resta la licenza: (mi pare) attorno ai 1700 dollari dal negozio online USA e oltre 400 per il mantenimento. Niente di fattibile per chi, come me, ci lavora ma, precario, difficilmente ammortizzerebbe la spesa in un tempo ragionevole. La soluzione più facile di solito è quella di usare un SPSS regolarizzato, se ci viene messo a disposizione, e poi svolgere il lavoro di data entry su altri softwares... Come ad esempio excel o math.. o gnumeric.
Dopo, con un mega copia e incolla si potranno importare i dati sulla matrice di lavoro...
Il problema è ovvio: il lavoro è praticamente doppio: creare due matrici, una per SPSS e una per l'altro programma, aggiornarle entrambe nel caso di modifiche in corso...
Immaginate che casino quando ad inserire i dati sono più persone su diversi terminali, magari in luoghi diversi.

Bene... PSPP cade proprio come il cacio sui maccheroni.
La potenzialità del programma è infatti la compatibilità con il software di Chicago.

 

Le matrici .sav vengono tranquillamente aperte in PSPP, possono essere modificate e trattate come in SPSS, con un'interfaccia grafica del tutto simile e altrettanto user-friendly.
L'interfaccia grafica di PSPP è la grande novità delle ultime versioni. Anche più semplice di quella di SPSS avendo molte meno funzioni.

Ma cosa possiamo fare con PSPP?
Non lo so... :) o meglio, oltre le funzioni dell'interfaccia grafica ci sono tutte quelle da terminale, che ne ampliano le potenzialità, ma lo rendono più complesso ai neofiti, rischiando di cadere nel purgatorio dei programmi complicati... tipo stata, o R, o adamsoft... tutte soluzioni potentissime di analisi dei dati, ma ognuna con una propria sintassi, tutta da imparare ad usare.
PSPP invece offre nell'interfaccia le funzioni più semplici e, soprattutto, implementabili con la stessa sintassi di SPSS.



Alla versione 6.0.1 di PSPP è possibile senza alcuna difficoltà operare frequenze e incroci con le misure statistiche più diffuse, dal test del "K quadrato" alle classiche medie... Deviazioni standard... regressioni lineari etc. Mancando la possibilità di poter fare la cluster (almeno in grafica) si hanno le gambe un po' tagliate... Ma il progetto di PSPP è in progress e chissà se in poco tempo non dovessero arrivare le implementazioni di altre funzioni. Certo tutto sta a quanto gli utenti sono in grado di "punzecchiare" i programmatori, magari dimostrando il proprio interesse al progetto.
Tornando a noi, le funzioni di ricodifica sono invece perfettamente integrate, sia nella stessa variabile che in variabili diverse, con un funzionamento e una scrittura identica a quella di SPSS. Ho anche trovato molto utile il tasto "jump to variable", che permette di osservare le caratteristiche di una variabile anche dalla "data view", così da poter risolvere eventuali dubbi durante l'imputazione.
Se tutto questo non fosse abbastanza per renderlo interessante, aggiungerei che scavalca il problema della compatibilità dei file .sav tra le versioni (vedere questo articolo), aprendo tutte le matrici e potendole esportare nel formato portatile .por.

Non resta quindi che provarlo (qui la pagina dei download per Linux).
Per Ubuntu le istruzioni migliori le trovate sul blog di Matteo Vitali, anche perchè sulle istruzioni contenute nel file readme le librerie necessarie sono scritte diversamente da come dovrebbero essere cercate sul gestore dei pacchetti.

Per Windows trovate alla pagina dei downloads i links al sito di Cygwin, che vi permetterà di utilizzare le librerie di Linux, usate dai software GNU, su sistemi WIndows.

PSPP è disponibile anche per Mac OS e altri sistemi Linux...
e, come per tutti i programmi liberi, in rete trovate informazioni e manuali a non finire.
Insomma... Fatemi sapere cosa ne pensate.

Gli screen-shot di PSPP cho ho utilizzato fin qui sono tratti dal quick tour del sito ufficiale.

Aggiornamenti.

In questa sezione inserisco gli aggiornamenti con i vari test e prove che via via farò (o magari farete) sul programma.
Come detto prima le matrici .sav vengono tranquillamente aperte da PSPP, così come le .por.
Anche le sintassi prodotte con SPSS vengono aperte senza problemi e, sebbene non altrettanto traquillamente, eseguite.

Ricodificare.

Come saprete le ricodifche possono essere di diverso tipo, da variabile numerica a variabile numerica, da variabile stringa a numerica, e da stringa a stringa (diciamo che da numerica a stringa non ce ne frega nulla!), il tutto poi può essere fatto su variabili diverse dall'originale o sulla stessa variabile.
Per ora ho testato solo i primi due casi, come vedremo, ricodificare su variabili diverse o su una stessa, sono argomenti che possiamo trattare indistintamente.
Ho provato a far girare su una matrice in PSPP una sintassi di ricodifica da numero a numero. per SPSS.
Senza nessuna modifica il risultato è stato innanzitutto una finestra con dei messaggi di errore per alcuni caratteri usati nella sintassi. Comunque, ignorata quella, la ricodifica ha avuto successo.
Ma vediamo con ordine i vari punti da tenere presenti.
I caratteri errati nella sintassi sono dovuti al fatto che mentre su SPSS gli attributi della ricodifica sono specificati nel formato, ad esempio, (1=888) in PSPP si esprime con (1 = 888).
Per SPSS il . alla fine della riga va messo senza alcuno spazio, mentre in PSPP servirebbe uno spazio. Come detto però, oltre all'avviso di errore, non ho notato stranezze.

Altro punto FONDAMENTALE: mentre su SPSS basta indicare, tra gli attributi, i valori sulla base dei quai operare la ricodifica, in PSPP è necessario specificare il comportamento che il programma dovrà avere nei confronti dei casi con valori diversi da quelli specificati.
Se così non si facesse, si avrebbero degli ovvii missing nel caso della ricodifica su una variabile diversa, ma una ben più grave perdita dei dati nel caso di ricodifica sulla stessa variabile o su una variabile già esistente.
Nel secondo caso basterà specificare un banale (ELSE = COPY) in sintassi, o ottenerlo mediante l'opzione sulla finestra della ricodifica.
Nell'esempio qui sotto, ho specificato che per il valore 1 nella variabile di input, si mantenessero i vecchi dati in quella di destinazione. Come si vede, in basso c'è l'opzione "all other values" che da' luogo al comando (ELSE = COPY).

finetra della ricodifica

Questi accorgimenti vanno tenuti presente anche per le ricodifche da variabile a numero.
In particolare la sintassi letta da PSPP è quasi identica a quella di SPSS. Salvo che le stringhe sono racchiuse tra il doppio apice in PSPP e nell'apice singolo in SPSS. Vale anche lo tesso discorso fatto prima per gli spazi.
Quindi una sintassi del tipo
RECODE v_nazion ('romena'=1) ('italiana'=1) ('ungherese'=1) (ELSE=2) INTO r1_eu.r1_eu.
EXECUTE.
che ci darà in una seconda variabile l'assenza o la presenza della condizione "cittadino europeo".
Per PSPP dovrebbe essere del tipo RECODE v_nazion ("romena" = 1) ("italiana" = 1)
("ungherese" = 1) (ELSE = 2) INTO r1_eu .
Tuttavia, come nel caso descritto prima, l'uso della prima sintassi su PSPP non mi ha dato problemi, salvo l'avviso di errore.

Problemone da tener presente.. L'ho notato dopo.
Mentre su PSPP il comando (ELSE = COPY) è tradotto in "per tutti i casi diversi da quelli specificati mantieni i valori originali", in SPSS il comando (ELSE=COPY) è implementato come "qualora i valori di origine siano diversi da quelli specificati, copia qualsiasi altro valore di origine nella varabile di destinazione"... Ovvero un gran casino.
Ora, non so dire se questa interpretazione del comando è una prerogativa della versione 16 per linux o anche delle altre.
Appena avrò modo di provare aggiornerò...
Intanto se qualcuno ne avesse l'occasione, ci faccia caso.
 
Per ora è tutto...

Articolo Articolo  Storico Storico Stampa Stampa - Ti è piaciuto? Votalo qui votalo su wikio o su

Technorati tag  linux; pspp; spss; ubuntu;
 
Nessun commento trovato.

Anti-Spam: digita i numeri CAPTCHA
Testo (max 2000 caratteri)
Clicca per inserire le faccine:
Smile sorriso Smile timido Smile triste Smile occhiolino Smile risatona Smile shockato Smile pianto Smile linguaccia Smile arrabbiato Smile perplesso Smile assonnato Smile bacio Smile clown Smile occhiali Smile diavolo Smile morto
Nome
Link pubblico

e-Mail (non sarà pubblicata)

Salva i miei dati per futuri commenti
Ricevi in email la notifica di nuovi commenti

Disclaimer
L'indirizzo IP del mittente viene registrato, in ogni caso si raccomanda la buona educazione.
Development can be seen as a process of expanding the real freedoms that people enjoy.

Amartya Sen