Вообще, кажется, мой отзыв будет похож на какой-то самоучитель)) не знаю. Или справочник. Но тут мой опыт использования функций спсс. Для всех функций и десяти отзывов не хватит. Приложение ОГРОМНОЕ. с огромными возможностями. То, что я тут опишу, это самая база, может, процентов десять. Для большинства пользователей этого хватит. Я напишу про то, чем пользуюсь больше всего и считаю самым важным и нужным в программе. Также делюсь отзывом на книгу Наследова про СПСС - тык
Преимущество программы - огромные возможности анализа и ранжирования данных + возможности работы с очень большими базами данных. Оно в ходит в ТОП лучших программ для научной работы.
Самое важное: если вы только скачали программу или собираетесь скачать и читаете мой отзыв, то помните, что одни и те же вещи могут называться немного иначе в программе, так как она НА АНГЛИЙСКОМ и у неё автоматический перевод на русский. Поэтому местами могут быть странные словосочетания и небольшие несостыковки.это нормально
Ярлык у меня выглядит так. Может выглядеть как-то иначе, но этот стандартный, так сказать.
Покупка
Сама программа не бесплатная) Скачать, думаю, можно где-то в интернете, но я без понятия, где)) я покупала с лицензией за 3830 долларов США на официальном сайте. Да, не дёшево, но что поделать..Это ещё самый дешёвый базовый вариант, так цена может доходить до 25 200 долларов США за пользователя - пакет премиум. Уж не знаю, что там, но стоит дофига, конечно.
Установка
Скажу честно, процедура установки не простая, сложнее, чем тот же qgis или STATA. Сама я ничего не поняла и не запомнила в этом плане, так как мне помогали. Но если у вас есть опыт в установке программ, то вы справитесь.
Последнее действие всегда сохраняется во всех диалоговых окнах.
В кнопке "вставка" можно посмотреть программный код, можно его менять. Есть кнопка для запуска - зелёный треугольник.
Все данные заносятся в таблицу
Функции статистики
Часто используются слова при выборе статистики через частотный анализ:
Mean это среднее значение.
Max и min соответственно максимальное и минимальное значения
Проверка на нормальность и выбросы
Используется:
критерий Шапиро-Уилка, выборка менее 2000
критерий Колмогорова-Смирнова с поправкой Лильефорса, если выборка более 2000
Я обычно выбираю критерий Шапиро-Уилка, так как мои выборки, как правило, выборки малые. Эти критерии помогают понять, принимаемое распределение нормальное или не нормальное. И нет, "не нормальное " не значит, что плохое, это значит, что для выборки будет затруднительно использовать лапласиану, с которой многие из нас так любят работать.
Стоит помнить, что проверка на нормальность всегда комплексная: 1) в критерии нормальности вероятность менее 0,1 2) нет выбросов
3) эксцесс и асимметрия имеют значения по модулю не более 1, в крайнем случае, 2
4) на скатерограмме все точи на линии ровно
5) выполняются все перечисленные выше свойства
проверка на нормальность
Грубые наблюдения (выбросы)
Есть два вида выбросов:
1) относительно медианы (звёздочки боксплота ***) - дальше чем на 3 квартильных размаха. 2) относительно среднего арифметического - те значения, которые находятся дальше, чем на 3 средних квадратических отклонения.
Грубые наблюдения относительно среднего арифметического считаются с помощью стандартизированного значения (= z-значение), они считаются легко в спсс есть отдельная функция, выводтся они прямо в таблицу, не в вывод
Как это сделать в СПСС?
проверка на нормальность: анализ - описательные статистики - разведочный анализ. нужно ставить галочку у "критерии проверки нормальности"
проверка на наличие грубых наблюдений: анализ - описательные статистики - описательные. обязательно ставить галочку у "сохранять стандартизированные ....". номер у кружочка боксплота - номер строчки, где находится значение.
Направление и сила (теснота) связи
r>0 - связь прямая
r<0 - связь обратная
Если выборка нормальная (про это написано выше), нет грубых наблюдений/выбросов и при этом связь меду переменными прямолинейна, то можно пользоваться коэффициентом корреляции r-Пирсона.
Корреляции
Корреляции, пожалуй, самое главное для базового понимания статистики. Без них дальше никуда и никак.
Корреляция, простыми словами, показатель вероятности связи между переменными. Это ВЕРОЯТНОСТЬ. Обозначается r.
Самый распроостранённый коэффициент корреляции в СПСС - корреляции Пирсона. Но тут оговорочка - только для нормальных распределений. Если у вас все точки на скатерограмме расположены приемлемо, но есть выброс - стоит его удалить. Если без выброса эксцесс, ассиметрия, медиана в норме - то можно и Пирсона взять. Он такой, прихотливый, скажем так.
Если у вас распределение не нормальное, есть выбросы, медиана съехала или асимметрия слишком больщая по модулю - на помощь придут корреляции Спирмена и Кендалла.
Прежде чем проводить корреляцию, подумайте, а стоит ли делать это с точки зрения здравого смысла?
Показатель корреляции. Вот СПСС посчитал вам корреляцию и выдал какое-то число. Что делать дальше? сравниваете его и 0,05. если больше, то, значит, всё худо. Меньше - хорошо. Этот показатель демонстрирует вероятность того, сколько связей могут быть случайными. Т.е. 10% (0,1) - значит, что 10% связей могут быть случайными и результат статистически не достоверен.
программа выводит таблицу по тому критерию, которому хотите. даже если вы захотите Пирсона, при том, что у вас обе выборки с выбросами и экцссом более 2, он все равно посчитает, пусть эти результаты и не будут достоверны.
Дисперсии
Дисперсии - важный показатель в статистике. Это характеристика разброса значений в выборке относительно среднего. Вычислить можно вручную - сложить все квадраты стандартных отклонений и поделить на число измерений, уменьшенное на 1.
Критерий, по которому определяется равенство дисперсий выборок - критерий Ливиня. Также на дисперсии будет работать критерий Фишера. Для многомерного случая нужен будет критерий "М Бокса"
АНОВА считается довольно хорошо, в выводе мы видим таблицу
Графика
Мне очень нравится, как можно легко и красиво строить диаграммы, а также их редактировать. Видов разных графиков ну очень много. Экселю до СПСС в этом далеко. Можно:
вставлять значения столбца в определённые столбцы, не обязательно в каждый
менять шаг шкалы
менять мастами столбцы и строки таблицы, по которой делаете график для изменения его представления
представлять значения в процентах и в частотах на ваше усмотрение
цвет, сетка, цвет фона, стиль и цвет границы, все надписи, их шрифты и цвет - менять можно ВСЁ, нужно лишь ткнуть дважды в нужное место
и многое другое
так выглядит столбиковая диаграмма до редактирования
и так после. данные одини и те же, но, согласитесь, после редактирования мы лучше видим разницу в показателях
Боксплоты
Боксплоты или усиковые диаграммы - очень важные элементы математической статистики. Они визуально дают нам понять, нормальное ли распределение. Конечно, если оно окажется нормальном по боксплотам и описательным статистикам, то мы вычисляем Z-число, но если медиана на боксплоте знатно уехала, то всё) дальше ничего можно не делать - распределение не нормальное 100%
и так, вот у нас боксплот:
Что мы видим:
усики - показывают квартильный размах
сам ящик - основная масса показателей
медиана - значение числа, находящегося в середине выборки, т.е. значение, которое "делит" выборку ровно пополам - с одной стороны все значения меньше, а с другой - все меньше.
звёздочки - грубые наблюдения или выбросы
кружочки - значения, не входящие в основной интервал, но входящие в доверительный.
По усам мы видим квартили. Напомню, что квартили - это 25, 50 и 75 процентили
Параметкика, сравнение выборок
для работы с параметрикой, распределения должны быть нормальными, без выбросов.
Дальше смотрим: выборка зависимая или независимая. В независимой используется коэффициентСтьюдента, а также АННОВА.
Непараметрика, сравнение выборок
Если хоть одна выборка имеет не нормальное распределение, то тогда используем непараметрику. Здесь работают критерии и коэффициенты Манна-Уитни, Уилкоксона, Колмогорова-Смирнова, Н Крускала-Уоллеса, Фридмана.
Прогнозирование данных получается довольно качественным и точным. Для научных исследований очень важная функция.
Вывод
Если вы занимаетесь научной деятельностью в сфере естественных или социальных наук, то эта программа точно для вас! с её помощью легко перерабатывать огромные базы данных, делать множество кореляций, регрессий, преобразований. В разы более простая и умная, чем эксель, а диаграммы отсюда выглядят намного презентабельее на стендовых докладах и в презентациях, чем из пакета майкрософт.