Как рассчитать эту статистику?

Я пишу приложение, чтобы облегчить некоторые исследования, и часть этого включает в себя некоторые статистические вычисления. Сейчас исследователи используют программу под названием SPSS . Часть вывода, о которой они заботятся, выглядит следующим образом:

[Часть вывода SPSS

Они действительно заботятся только о Fи Sig.ценностях. Моя проблема в том, что у меня нет опыта в статистике, и я не могу понять, как называются тесты или как их вычислять.

Я думал, что Fзначение может быть результатом F-теста , но после выполнения шагов, указанных в Википедии, я получил результат, который отличается от того, что SPSSдает.

4.08.2008 22:56:45
Может кто-то исправить изображение, оно нарушает форматирование
Эрик Шуновер 26.09.2008 08:04:59
6 ОТВЕТОВ
РЕШЕНИЕ

Этот сайт может помочь вам немного больше. Также этот .

Я работаю из довольно ржавой памяти курса статистики, но здесь ничего не идет:

Когда вы делаете анализ отклонений (ANOVA), вы фактически вычисляете статистику F как отношение среднеквадратичных отклонений «между группами» и среднеквадратичных отклонений «внутри групп». Вторая ссылка выше кажется довольно хорошей для этого расчета.

Это делает статистику F точным показателем того, насколько мощна ваша модель, потому что дисперсия «между группами» является объяснительной силой, а дисперсия «внутри групп» - случайной ошибкой. Высокий F подразумевает очень значимую модель.

Как и во многих статистических операциях, вы определяете Sig. используя статистику F. Вот где ваша информация из Википедии может пригодиться. То, что вы хотите сделать, - используя степени свободы, предоставленные вам SPSS, - найти правильное значение P, при котором таблица F даст вам F-статистику, которую вы рассчитали. Значение P, где это происходит [F (таблица) = F (рассчитано)], является значимым.

Концептуально, более низкое значение значимости показывает очень сильную способность отвергнуть нулевую гипотезу (что для этих целей означает, что ваша модель имеет объяснительную силу).

Извините всех математиков, если что-то из этого не так. Я буду проверять, чтобы внести изменения !!!

Удачи тебе. Stats это весело, просто, может быть, не эта часть. знак равно

3
4.08.2008 23:32:54
Это многомерная таблица результатов - которая исключает ANOVA. Это может быть MANOVA, анализ дискриминирующих функций или один из многих других многомерных тестов. Короче говоря, статистика сложная, работайте в тесном контакте с профессионалами и пишите SPSS через python вместо того, чтобы раскручивать свои собственные.
Роб Аллен 2.03.2009 01:22:39

Из вашего вопроса я предполагаю, что ваши коллеги-исследователи хотят автоматизировать процесс, с помощью которого выполняется определенный статистический анализ (т. Е. Они хотят группировать наборы данных процесса). У вас есть два варианта:

1) SPSS теперь можно писать через python (начиная с версии 15) - перейдите на spss.com и найдите python. Вы можете написать сценарии Python для автоматизации анализа данных и извлечения ключевых значений из сводных таблиц, а затем обрабатывать ответы любым удобным для вас способом. Это дает возможность точного сравнения между результатами вашего скрипта на python и вручную рассчитанными усилиями SPSS ваших соавторов. Таким образом, вам не нужно знать статистику, чтобы выполнять эту работу (что является ключевым преимуществом)

2) Вы можете сделать это в R, свободной статистической среде, которая, вероятно, может быть написана на скрипте. Это имеет тот недостаток, что вам придется изучать статистику, чтобы убедиться, что вы делаете это правильно.

3
22.09.2008 03:29:26
Приятно знать, что SPSS теперь можно писать через Python напрямую! Может ли теперь выводить результаты в виде простого текста? Кроме того, R также является сценарием (хотя R или через Python, используя RPy).
Грегг Линд 10.10.2008 21:13:13

Статистика сложная :-). После года чтения и перечитывания книг и статей могу только с уверенностью сказать, что я понимаю самые его основы.

Возможно, вы захотите исследовать готовые библиотеки для любого языка программирования, который вы используете, потому что они имеют много математических навыков в целом и статистики в частности (ошибки округления являются очевидным примером).

В качестве примера вы можете взглянуть на проект R , который является одновременно интерактивной средой и библиотекой, которую вы можете использовать из своего кода C ++, распространяемого по лицензии GPL (то есть, если вы используете его только для внутреннего использования и публикуете только результаты, вам не нужно открывать свой код).

2
18.08.2008 06:01:11

Вкратце: не делайте этого вручную, связывайте / используйте существующее программное обеспечение. И ответ sain_grocen неверен. :(

Это все тесты на значимость оценок параметров, которые обычно используются в многовариантных ответах множественных регрессий. Это не будет простым делом вне среды статистического программирования. Я бы предложил либо получить результат от уже существующей статистической программы, либо использовать ту, на которую вы можете ссылаться и использовать этот код.

Я боюсь, что первый ответ (sain_grocen's) приведет вас по неверному пути. Его объяснение, вероятно, является частным случаем того, с чем вы на самом деле имеете дело Анова, объясненная в его ссылках, предназначена для одного варианта ответа, в сбалансированном дизайне. Это не статистика F, которую вы видите. Имена в вашем выводе (Pillai's Trace, Hotelling's Trace, ...) являются одними из доступных многомерных версий. Они имеют F-распределения при определенных предположениях. Я не могу объяснить ценность учебников здесь, я бы посоветовал вам начать с изучения «Прикладного многомерного статистического анализа» Джонсона и Вихерна.

2
16.09.2008 23:17:17

Можете ли вы объяснить больше, почему сам SPSS не является хорошим решением проблемы? Это то, что он генерирует сводные таблицы в качестве выходных данных, которыми трудно манипулировать? Это стоимость программы?

F-статистика может возникнуть из любого количества конкретных тестов. F - это просто распределение (в общих чертах: описание «частот» групп значений), например, Normal (Gaussian) или Uniform. В целом они возникают из соотношений отклонений. Мнение: многие статистики (включая меня) считают, что основанные на F тесты нестабильны (жаргон: ненадежный ).

Конкретная выходная статистика (след Пиллая и т. Д.) Предполагает, что исходный анализ является примером MANOVA, который, как описывают другие авторы, является сложной и трудной для получения правильной процедуры.

Я предполагаю также, что, основываясь на MANOVA и использовании SPSS, это проект по психологии или социологии ... если не просвещаете, пожалуйста. Возможно, другие, более простые модели могут быть проще для понимания и более повторяемыми. Обратитесь в местную университетскую статистическую консультационную группу, если она у вас есть.

Удачи!

0
17.09.2008 13:48:44

Вот объяснение о выходе MANOVA, с очень хорошего сайта по статистике и по SPSS:

Выход с объяснением: http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Как и зачем делать MANOVA или многовариантный GLM: (тот же путь, что и выше, но заканчивается на «/manova.htm»)

Написание программного обеспечения с нуля для расчета этих результатов было бы длительным и сложным; есть много числовых задач и матричных инверсий.

Как сказал Генри, используйте скрипты Python или R. Я бы посоветовал поработать с кем-то, кто знает SPSS, если он пишет. Кроме того, сама SPSS способна экспортировать выходные таблицы в файлы, используя нечто, называемое OMS. Сценарий в SPSS может сделать это.

Узнайте, кто из вашей исследовательской группы знает SPSS, и поработайте с ними.

0
22.12.2009 01:56:52