Вопросы с тегом «data-streams»

5
Сокращение использования пространства st-подключения с несколькими проходами?
Предположим, что граф с вершинами представлен как поток из ребер, но допускается несколько проходов по потоку.н мграммGGNnnмmm Моника Раух Хензингер, Прабхакар Рагхаван и Шридар Раджагопалан отметили, что пространство необходимо, чтобы определить, существует ли путь между двумя заданными вершинами в , если для данных разрешено проходов. (См. Также версию технического отчета …

2
Алгоритм для 'k' 'наиболее часто встречающихся чисел
Я искал наиболее эффективный (потоковый ??) алгоритм, который сообщает мне «k» наиболее часто встречающихся элементов в потоке данных в любой момент времени. Этот пост: «Разделяй и властвуй» алгоритмы потока данных заинтересовали меня. Например, предположим, что есть числа: (4,3,5,1,6,2,4,3,3,8,9,1), и я запрашиваю 3 наиболее часто встречающихся числа (скажем), тогда я должен …

2
Требования к хранилищу для медианного выбора (двухпроходные алгоритмы)
В классической статье Манро и Патерсон изучают проблему того, сколько памяти требуется алгоритму для нахождения медианы в случайно отсортированном массиве. В частности, они ориентированы на следующую модель: ввод читается слева направо в течение числа P раз. Показано, что O ( n12 П)О(N12п)O(n^{\frac{1}{2P}}) ячеек памяти достаточно, но соответствующая нижняя граница известна …

5
Какой предел сжатия данных без потерь? (если такой предел существует)
В последнее время я имел дело с алгоритмами, связанными со сжатием, и мне было интересно, какая наилучшая степень сжатия может быть достигнута при сжатии данных без потерь. До сих пор единственным источником, который я мог найти по этой теме, была Википедия: Сжатие без потерь оцифрованных данных, таких как видео, оцифрованные …

6
Алгоритмы потока данных «разделяй и властвуй»
Какие существуют полезные алгоритмы, которые работают с огромными потоками данных, и их результаты довольно малы, и можно вычислить результат для смеси двух потоков, каким-то образом объединив их результаты? Я могу назвать несколько: Очевидные вещи, как сумма, мин, макс, кол, топ-К и т. Д Приближенные так называемые «основанные на эскизах» потоковые …


4
Непрерывная кластеризация
Поэтому у меня возникла проблема, связанная с кластеризацией с живыми непрерывно потоковыми данными. Поскольку у меня постоянно растущий набор данных, я не уверен, что это лучший способ запустить эффективную и действенную кластеризацию. Я придумал несколько возможных решений, в том числе: Установка ограничения на количество точек данных, которое разрешается, поэтому при …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.