Вопросы с тегом «clustering»

5
Можно ли проверить, является ли вычислимое число рациональным или целым?
Можно ли алгоритмически проверить, является ли вычисляемое число рациональным или целым? Другими словами, возможно ли для библиотеки, которая реализует вычислимые числа, предоставлять функции isIntegerили isRational? Я предполагаю, что это невозможно, и что это как-то связано с тем, что невозможно проверить, равны ли два числа, но я не вижу, как это …
18 computability  computing-over-reals  lambda-calculus  graph-theory  co.combinatorics  cc.complexity-theory  reference-request  graph-theory  proofs  np-complete  cc.complexity-theory  machine-learning  boolean-functions  combinatory-logic  boolean-formulas  reference-request  approximation-algorithms  optimization  cc.complexity-theory  co.combinatorics  permutations  cc.complexity-theory  cc.complexity-theory  ai.artificial-intel  p-vs-np  relativization  co.combinatorics  permutations  ds.algorithms  algebra  automata-theory  dfa  lo.logic  temporal-logic  linear-temporal-logic  circuit-complexity  lower-bounds  permanent  arithmetic-circuits  determinant  dc.parallel-comp  asymptotics  ds.algorithms  graph-theory  planar-graphs  physics  max-flow  max-flow-min-cut  fl.formal-languages  automata-theory  finite-model-theory  dfa  language-design  soft-question  machine-learning  linear-algebra  db.databases  arithmetic-circuits  ds.algorithms  machine-learning  ds.data-structures  tree  soft-question  security  project-topic  approximation-algorithms  linear-programming  primal-dual  reference-request  graph-theory  graph-algorithms  cr.crypto-security  quantum-computing  gr.group-theory  graph-theory  time-complexity  lower-bounds  matrices  sorting  asymptotics  approximation-algorithms  linear-algebra  matrices  max-cut  graph-theory  graph-algorithms  time-complexity  circuit-complexity  regular-language  graph-algorithms  approximation-algorithms  set-cover  clique  graph-theory  graph-algorithms  approximation-algorithms  clustering  partition-problem  time-complexity  turing-machines  term-rewriting-systems  cc.complexity-theory  time-complexity  nondeterminism 

2
Евклидово-квадратный макс-разрез в низких размерах
Пусть x1,…,xnx1,…,xnx_1, \ldots, x_n - точки на плоскости R2R2\mathbb{R}^2 . Рассмотрим полный граф с точками в виде вершин и весами ребер . Вы всегда можете найти вес, который составляет не менее \ 2 2 от общего веса? Если нет, то какая константа должна заменить \ frac 2 3 ?2∥xi−xj∥2‖xi−xj‖2\|x_i - …

5
алгоритм кластеризации для безразмерных данных
у меня есть набор данных из тысяч точек и средство измерения расстояния между любыми двумя точками, но точки данных не имеют размерности. я хочу алгоритм, чтобы найти кластерные центры в этом наборе данных. Я полагаю, что поскольку данные не имеют измерений, центр кластера может состоять из нескольких точек данных и …

2
Кластеризационные формализации, отличные от K-средних для разделяемых данных
Данные реального мира иногда имеют естественное количество кластеров (попытка сгруппировать их в число кластеров, меньших, чем какое-либо волшебство k, приведет к значительному увеличению стоимости кластеризации). Сегодня я посетил лекцию доктора Адама Мейерсона, и он назвал этот тип данных «разделяемыми данными». Какие еще формализации кластеризации, кроме K-средних, могут быть применимы к …

1
Нахождение похожих векторов в субквадратичном времени
Позволять d:{0,1}k×{0,1}k→Rd:{0,1}k×{0,1}k→Rd:\{0,1\}^k\times \{0,1\}^k \to \mathbb{R}быть функцией, которую мы называем функцией подобия . Примерами функции подобия являются косинусное расстояние,l2l2l_2 норма, расстояние Хэмминга, сходство Жакара и т. д. Рассматривать nnn двоичные векторы длины kkk: v⃗ ∈({0,1}k)nv→∈({0,1}k)n\vec{v} \in (\{0,1\}^k)^n, Наша цель - сгруппировать векторы, которые похожи. Более формально, мы хотим вычислить граф подобия, …

1
Разделение множества точек на два оптимальных подмножества
Я хочу разделить набор точек на два подмножества одинакового размера так, чтобы сумма квадратов внутри кластера была минимальной. Можно предположить, что точки находятся в двумерном евклидовом пространстве. Я надеюсь на что-то более быстрое, чем обычный алгоритм кластеризации k-средних, учитывая, что k = d = 2. Может кто-нибудь указать мне в …

4
Непрерывная кластеризация
Поэтому у меня возникла проблема, связанная с кластеризацией с живыми непрерывно потоковыми данными. Поскольку у меня постоянно растущий набор данных, я не уверен, что это лучший способ запустить эффективную и действенную кластеризацию. Я придумал несколько возможных решений, в том числе: Установка ограничения на количество точек данных, которое разрешается, поэтому при …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.