Было бы трудно окончательно доказать одно преимущество в производительности по сравнению с другим с научной точки зрения.
Ваша гипотеза заключается в том, что парное программирование повышает производительность разработчика и улучшает качество. Ваш тест будет включать в себя предоставление паре набора требований, ограниченных конкретной архитектурой, и их реализацию.
В этом случае вы контролируете то, что вы предъявляете одинаковые требования к одному разработчику с равным положением, навыками и опытом (что объективно оценивается его коллегами), а также ограничены в рамках одной архитектуры.
Чтобы проверить вашу гипотезу о производительности по времени, пара программистов должна выполнить свою работу менее чем за половину времени в качестве контроля. Чтобы проверить свою гипотезу о качестве, необходимо, чтобы экспериментальная пара и контрольный код были проверены объективной третьей стороной, а объективная группа обеспечения качества проверила результаты обеих групп, не сообщая им, какая команда что произвела. Группа парного программирования должна иметь лучший код и меньше ошибок.
Это не идеальный эксперимент, но я был бы рад услышать, если бы кто-нибудь пытался сделать что-то подобное.
Однако, кроме этого, я не вижу, как вы можете на самом деле доказать, что парное программирование превосходит одного программиста в данной функции.