Пример обновления статистики для SQL Server пропускает самое высокое значение RANGE_HI

10

Я пытаюсь понять, как работает выборка статистики, и ожидаемо ли приведенное ниже поведение при выборочных обновлениях статистики.

У нас есть большая таблица, разделенная по дате, с парой миллиардов строк. Дата раздела является предшествующей рабочей датой и, следовательно, является восходящим ключом. Мы только загружаем данные в эту таблицу за предыдущий день.

Загрузка данных происходит в одночасье, поэтому в пятницу, 8 апреля, мы загрузили данные за 7-е.

После каждого запуска мы обновляем статистику, хотя берут образец, а не FULLSCAN.

Возможно, я наивен, но я ожидал, что SQL Server определит самый высокий ключ и самый низкий ключ в диапазоне, чтобы обеспечить точную выборку диапазона. Согласно этой статье :

Для первого сегмента нижняя граница - это наименьшее значение столбца, по которому генерируется гистограмма.

Тем не менее, он не упоминает последний сегмент / наибольшее значение.

С обновленным статистическим обновлением утром 8-го числа выборка пропустила самое высокое значение в таблице (7-е).

Поскольку мы выполняем большое количество запросов к данным за предыдущий день, это привело к неточной оценке мощности и истечению времени ожидания ряда запросов.

Разве SQL Server не должен определять максимальное значение для этого ключа и использовать его как максимальное RANGE_HI_KEY? Или это только один из ограничений обновления без использования FULLSCAN?

Версия SQL Server 2012 SP2-CU7. В настоящее время мы не можем выполнить обновление из-за изменения в OPENQUERYповедении в пакете обновления 3, который округлял числа в запросе связанного сервера между SQL Server и Oracle.

sql-server sql-server-2012 statistics

— Марк Синкинсон
источник

11

Разве SQL Server не должен определять максимальное значение для этого ключа и использовать его как максимальное RANGE_HI_KEY? Или это только один из ограничений обновления без использования FULLSCAN?

Это ограничение текущей реализации выборочной статистики. В существующем случае используется выборочный сбор статистики TABLESAMPLE SYSTEM, который использует сканирование в порядке распределения и выбирает страницы из сканирования в выборку. Только выбранные страницы вносят вклад в гистограмму.

Так как сканирование упорядочено по порядку (а не по индексу), нет способа дать предпочтение первой и последней страницам в ключевом порядке.

Для получения дополнительной информации см. Этот связанный вопрос:

Как работает выборка при обновлении статистики?

и моя статья, Сканирование заказа на размещение

Временные решения см. В разделе « Статистика восходящих столбцов», автор Fabiano Amorim.

— Пол Уайт 9
источник

2

Быстрое предположение: включить флаг трассировки 4139.

Вы уже используете SP2-CU1, так что это должно работать

Обратите внимание на рекомендации относительно TF 2389 и 2390, а также см. Http://sql-sasquatch.blogspot.com.mt/2013/06/mssql-plan-guides-to-address-ascending.html.

(Заметьте, я не очень разбирался в этой проблеме и не углублялся в это глубоко)

— ГБН
источник

Пример обновления статистики для SQL Server пропускает самое высокое значение RANGE_HI_KEY в столбце восходящего ключа