Чтобы добавить путаницы вокруг графиков QQ и графиков вероятностей в мирах Python и R, вот что говорится в руководстве SciPy :
« probplot
генерирует вероятностный график, который не следует путать с графиком QQ или PP. Statsmodels имеет более обширную функциональность этого типа, см. statsmodels.api.ProbPlot».
Если вы попробуете scipy.stats.probplot
, вы увидите, что он действительно сравнивает набор данных с теоретическим распределением. Графики QQ, OTOH, сравнивают два набора данных (выборки).
R имеет функции qqnorm
, qqplot
и qqline
. Из справки R (версия 3.6.3):
qqnorm
- это универсальная функция, метод по умолчанию для которой создает нормальный график QQ значений y. qqline
добавляет строку к «теоретическому», по умолчанию нормальному графику квантиль-квантиль, который проходит через квантили вероятностей, по умолчанию первый и третий квартили.
qqplot
создает график QQ из двух наборов данных.
Короче говоря, R qqnorm
предлагает те же функции, что scipy.stats.probplot
и настройки по умолчанию dist=norm
. Но тот факт, что они назвали это qqnorm
и что он должен «производить нормальный график QQ», может легко запутать пользователей.
Наконец, одно предупреждение. Эти графики не заменяют надлежащего статистического тестирования и должны использоваться только в иллюстративных целях.
probplot
? docs.scipy.org/doc/scipy/reference/generated/…