Вы не должны использовать традиционные движки баз данных, если вам нужны действительно масштабируемые возможности.
Традиционные базы данных SQL довольно хорошо масштабируются (вы найдете множество примеров больших сайтов, использующих MySQL, SQL Server или Orcale), но в определенный момент вы достигнете предела масштабируемости. То, когда это произойдет, будет зависеть от уровня спроса, сложности ваших требований к приложениям, того, сколько вы готовы потратить на дорогие серверы, и насколько вы способны оптимизировать использование базы данных. Многие сайты никогда не достигнут этого предела, но если вы это сделаете, то это довольно болезненно, и вы столкнетесь с большой инженерной проблемой, чтобы решить эту проблему.
Помимо этого, вам действительно нужна полностью распределенная база данных NoSQL - например, что-то вроде Cassandra , которая фактически была разработана в Facebook для решения некоторых проблем с большими данными. Базы данных NoSQL явно жертвуют некоторыми традиционными возможностями баз данных SQL (обычно вокруг транзакций, блокировок и возможной согласованности), чтобы обеспечить практически неограниченную горизонтальную масштабируемость.
В целом, я бы посоветовал выяснить, действительно ли вам нужна масштабируемость, и соответственно выбрать свой технологический путь.