Рекомендуемые книги или статьи в качестве введения в кластерный анализ?


12

Я работаю над небольшим (200 МБ) корпусом текста, который я хочу изучить с помощью некоторого кластерного анализа. Какие книги или статьи на эту тему вы бы порекомендовали?

Ответы:


6

Возможно, стоит взглянуть на книги М. В. Берри:

  1. Обзор Text Mining I: кластеризация, классификация и поиск (2003)
  2. Обзор Text Mining II: кластеризация, классификация и поиск (2008)

Они состоят из серии прикладных и обзорных работ. Последняя версия доступна в формате PDF по следующему адресу: http://bit.ly/deNeiy .

Вот несколько ссылок, связанных с CA в применении к интеллектуальному анализу текста:

Вы также можете взглянуть на скрытый семантический анализ , но посмотрите на мой ответ: проработка проблемы кластеризации .


5

Поиск групп в данных. Введение в кластерный анализ от профессоров Леонарда Кауфмана и Питера Дж. Руссеу.

Я читаю книгу и считаю ее очень полезной, потому что:

  • Как указано авторами в предисловии:

Нашей целью было написать прикладную книгу для обычного пользователя. Мы хотели сделать кластерный анализ доступным для людей, которые не обязательно имеют сильный математический или статистический опыт.

  • Он предоставляет теоретическое содержание для понимания функций, доступных в Rпакете Cluster .

  • Главы могут быть прочитаны индивидуально согласно кластерному методу.
    исключением является глава 3, которая построена на главе 2

Главы книги:

  1. Вступление
  2. Разделение вокруг Medoids (программа PAM).
  3. Кластеризация больших приложений (программа CLARA).
  4. Нечеткий анализ (программа FUNNY).
  5. Агломеративное гнездование (программа AGNES).
  6. Разделительный анализ (программа DIANA).
  7. Монотетический анализ (программа MONA).

Ссылки:

Kaufman, L. & Rousseeuw, PJ (2005). Поиск групп в данных. Введение в кластерный анализ (с. 342). John Wiley & Sons Inc.

Maechler, M. (2013). Кластерный анализ Extended Rousseeuw et al. КРАН.


Эта книга действительно дает хороший обзор области. Он фокусируется на нескольких алгоритмах / методах (например, на известном силуэте, который, как оказалось, был разработан одним из авторов книги) и широко их охватывает. Он также поставляется с некоторым кодом, но в стиле 1990 года. К вашему сведению: полное оглавление .
Франк Дернонкур


2

Кластерный анализ Брайана С. Эверитта - это прекрасная книга по кластерному анализу.



Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.