Comment puis-je calculer ces statistiques?

J'écris une application pour aider à faciliter certaines recherches, et une partie de cela implique de faire des calculs statistiques. À l'heure actuelle, les chercheurs utilisent un programme appelé SPSS . Une partie de la sortie dont ils se soucient ressemble à ceci:

[Partie de la sortie SPSS

Ils ne sont vraiment concernés que par les valeurs F et Sig. . Mon problème est que je n'ai pas d'antécédents dans les statistiques, et je ne peux pas comprendre ce que les tests sont appelés, ou comment les calculer.

Je pensais que la valeur F pouvait être le résultat du F -test , mais après avoir suivi les étapes indiquées sur Wikipédia, j'ai obtenu un résultat différent de ce que donne SPSS .

0
Quelqu'un peut-il corriger l'image, il est en train de casser le formatage
ajouté l'auteur Eric Schoonover, source

5 Réponses

This website might help you out a bit more. Also this one.

Je travaille à partir d'un souvenir assez rouillé d'un cours de statistiques, mais ici rien ne va:

Lorsque vous effectuez une analyse de variance (ANOVA), vous calculez en fait la statistique F comme étant le rapport entre les variances des carrés moyens «entre les groupes» et les variances des carrés moyens «au sein des groupes». Le deuxième lien ci-dessus semble plutôt bien pour ce calcul.

Cela rend la mesure statistique F exactement la puissance de votre modèle, car la variance «entre les groupes» est un pouvoir explicatif, et la variance «au sein des groupes» est une erreur aléatoire. Haut F implique un modèle très significatif.

Comme dans de nombreuses opérations statistiques, vous back-déterminer Sig. en utilisant la statistique F. Voici où vos informations Wikipedia vient légèrement à portée de main. Ce que vous voulez faire est - en utilisant les degrés de liberté qui vous sont donnés par SPSS - trouver la valeur P appropriée à laquelle F table vous donnera la statistique F que vous avez calculée. La valeur P où cela arrive [F (table) = F (calculé)] est la signification.

Conceptuellement, une valeur de signification inférieure montre une très forte capacité à rejeter l'hypothèse nulle (qui à ces fins signifie pour déterminer que votre modèle a un pouvoir explicatif).

Désolé pour les maths si cela ne va pas. Je vais vérifier pour faire des modifications !!!

Bonne chance à toi. Les statistiques sont amusantes, mais peut-être pas cette partie. =)

0
ajouté
Ceci est une table de résultat multivariée - qui exclut ANOVA. Il peut s'agir d'une MANOVA, d'une analyse de fonction discriminante ou de l'un des nombreux autres tests multivariés. Longue histoire courte, les statistiques sont dures, travaillez en étroite collaboration avec les professionnels et le script SPSS à travers python au lieu de rouler le vôtre.
ajouté l'auteur Rob Allen, source

En bref: ne pas le faire à la main, lier / utiliser un logiciel existant. Et la réponse de sain_grocen est incorrecte. :(

Ce sont tous des tests de signification des estimations de paramètres qui sont généralement utilisés dans les régressions multiples à réponse multivariée. Ce ne seraient pas des choses simples à faire en dehors d'un environnement de programmation statistique. Je suggère soit d'obtenir le résultat d'un programme statistique préexistant, soit d'en utiliser un que vous pouvez lier à et utiliser ce code.

Je crains que la première réponse (sain_grocen) ne vous conduise sur le mauvais chemin. Son explication est susceptible d'un cas particulier de ce que vous avez réellement affaire. L'anova expliqué dans ses liens est pour une seule réponse variable, dans un design équilibré. Ce ne sont pas les statistiques F que vous voyez. Les noms dans votre sortie (Pillai's Trace, Hotelling's Trace, ...) sont quelques-unes des versions multivariées disponibles. Ils ont des distributions F sous certaines hypothèses. Je ne peux pas expliquer un livre de valeur de matériel ici, je vous conseille de commencer par regarder "Applied Multivariate Statistical Analysis" par Johnson et Wichern

0
ajouté

Les statistiques sont difficiles :-). Après une année de lecture et de relecture de livres et de documents, je ne peux que dire avec confiance que j'en comprends les bases.

Vous voudrez peut-être étudier les librairies prêtes à l'emploi pour le langage de programmation que vous utilisez, car il y a beaucoup de choses à apprendre en mathématiques en général et les statistiques en particulier (les erreurs d'arrondi étant un exemple évident).

A titre d'exemple, vous pouvez jeter un oeil à le projet R , qui est à la fois un environnement interactif et un bibliothèque que vous pouvez utiliser à partir de votre code C ++, distribué sous licence GPL (si vous ne l'utilisez qu'en interne et ne publiez que les résultats, vous n'avez pas besoin d'ouvrir votre code).

0
ajouté

Pouvez-vous expliquer plus pourquoi SPSS lui-même n'est pas une bonne solution au problème? Est-ce qu'il génère des tableaux croisés dynamiques en sortie difficiles à manipuler? Est-ce le coût du programme?

Les statistiques F peuvent provenir de n'importe quel nombre de tests particuliers. Le F est juste une distribution (vaguement: une description des "fréquences" de groupes de valeurs), comme un Normal (Gaussien), ou Uniforme. En général, ils proviennent des ratios de variances. Opinion: de nombreux statisticiens (y compris moi-même), trouvent que les tests basés sur F sont instables (jargon: non robuste ).

Les statistiques de sortie particulières (trace de Pillai, etc.) suggèrent que l'analyse originale est un exemple de MANOVA, qui, comme d'autres affiches le décrivent, est une procédure complexe et difficile à obtenir.

Je suppose aussi que, sur la base de la MANOVA, et de l'utilisation de SPSS, il s'agit d'un projet de psychologie ou de sociologie ... sinon s'il vous plaît éclairer. Il se pourrait que d'autres modèles plus simples soient réellement plus faciles à comprendre et plus reproductibles. Consultez votre groupe de consultation statistique universitaire local, si vous en avez un.

Bonne chance!

0
ajouté

Voici une explication de MANOVA ouptput, d'un très bon site sur les statistiques et sur SPSS:

Output with explanation: http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Comment et pourquoi faire MANOVA ou GLM multivarié: (même chemin que ci-dessus, mais se terminant par '/manova.htm')

Rédaction de logiciels à partir de zéro pour calculer ces sorties serait à la fois long et difficile; il y a beaucoup de problèmes numériques et d'inversions matricielles à faire.

Comme Henry l'a dit, utilisez des scripts Python, ou R. Je suggérerais de travailler avec quelqu'un qui connaît SPSS si vous utilisez un script. En outre, SPSS lui-même est capable d'exporter les tables de sortie vers des fichiers à l'aide de quelque chose appelé OMS. Un script dans SPSS peut le faire.

Découvrez qui dans votre groupe de recherche connaît SPSS et travaille avec eux.

0
ajouté