Вы не можете действительно удалить знающего человека из цикла и ожидать разумных результатов. Это не означает, что человек должен смотреть на каждый отдельный элемент в отдельности, но в конечном итоге требуются некоторые реальные знания, чтобы узнать, являются ли резюме / графики данных разумными. (Например: может ли переменная A быть отрицательной, может ли переменная B быть больше, чем переменная A, или есть 4 или 5 вариантов выбора для категориальной переменной C?)
Как только вы ознакомитесь с данными, вы, вероятно, сможете выработать ряд правил, которые вы могли бы использовать для автоматического тестирования данных. Проблема в том, что могут возникнуть другие ошибки, о которых вы не задумывались. (Например, ошибка программирования в процессе сбора данных, которая дублирует переменную A в переменную C.)