Контекст:
За это время я приобрел набор эвристик о том, как эффективно построить связь между двумя числовыми переменными. Я полагаю, что большинство людей, которые работают с данными, будут иметь подобный набор правил.
Примеры таких правил могут быть:
- Если одна из переменных имеет положительный перекос, рассмотрите возможность построения этой оси в логарифмическом масштабе.
- Если точек данных много (например, n> 1000), выберите другую стратегию, например, с использованием некоторой формы частичной прозрачности или выборки данных;
- Если одна из переменных имеет ограниченное количество отдельных категорий, рассмотрите возможность использования графика дрожания или подсолнечника;
- Если есть три или более переменных, рассмотрите возможность использования матрицы рассеяния;
- Подгонка некоторой формы линии тренда часто полезна;
- Отрегулируйте размер графического символа до размера выборки (для большего n используйте меньший графический символ);
- и так далее.
Вопрос:
Я хотел бы иметь возможность направлять студентов на веб-страницу или сайт, где объясняются эти и другие приемы для эффективного построения связей между двумя числовыми переменными, возможно, с примерами.
- Есть ли в Интернете какие-либо страницы или сайты, которые хорошо справляются с этой задачей?