Тактика использования PHP на сайтах с высокой нагрузкой


243

Прежде чем ответить на этот вопрос, я никогда не разрабатывал ничего настолько популярного, чтобы достигать высоких нагрузок на сервер. Относитесь ко мне как к инопланетянину, который только что приземлился на планете, хотя он знает PHP и несколько методов оптимизации.


Я разрабатываю инструмент на PHP, который может привлечь довольно много пользователей, если он работает правильно. Однако, хотя я полностью способен разрабатывать программу, я почти ничего не понимаю, когда дело доходит до создания чего-то, что может иметь дело с огромным трафиком. Итак, вот несколько вопросов (не стесняйтесь также превратить этот вопрос в ветку ресурсов).

Базы данных

На данный момент я планирую использовать функции MySQLi в PHP5. Однако как мне настроить базы данных по отношению к пользователям и контенту? Действительно ли мне нужно несколько баз данных? На данный момент все перемешано в одну базу данных - хотя я рассматривал возможность распространения пользовательских данных в одну, фактического контента в другую и, наконец, основного контента сайта (мастеров шаблонов и т. Д.) В другую. Моя причина в том, что отправка запросов в разные базы данных облегчит их загрузку, поскольку одна база данных = 3 источника загрузки. Кроме того, будет ли это все еще эффективно, если они все были на одном сервере?

Кэширование

У меня есть система шаблонов, которая используется для создания страниц и замены переменных. Основные шаблоны хранятся в базе данных, и при каждом вызове шаблона вызывается его кэшированная копия (HTML-документ). На данный момент у меня есть два типа переменных в этих шаблонах - статическая переменная и динамическая переменная. Статические переменные - это, как правило, названия страниц, названия сайтов, которые меняются не часто; динамические переменные - это то, что меняется при каждой загрузке страницы.

Мой вопрос по этому вопросу:

Скажем, у меня есть комментарии к различным статьям. Что является лучшим решением: сохраняйте простой шаблон комментариев и визуализируйте комментарии (из вызова БД) при каждой загрузке страницы или сохраняйте кэшированную копию страницы комментариев в виде html-страницы - каждый раз, когда комментарий добавляется / редактируется / удаляется страница перечитана.

в заключение

У кого-нибудь есть какие-либо советы / указатели для запуска сайта с высокой нагрузкой на PHP. Я почти уверен, что это работоспособный язык - Facebook и Yahoo! дать ему большой приоритет - но есть ли опыт, который я должен остерегаться?


9
Спустя 3,5 года, и я даже не могу вспомнить, над чем я работал, я хотел бы знать, что я думал, что это было так здорово :)
Росс

8
Пусть это будет вам уроком о преждевременной оптимизации :)
Rimu Atkinson

Ответы:


89

Нет двух одинаковых сайтов. Вам действительно нужно получить такой инструмент, как jmeter и benchmark, чтобы увидеть, где будут ваши проблемные точки. Вы можете тратить много времени на догадки и улучшения, но вы не увидите реальных результатов, пока не измерите и не сравните свои изменения.

Например, в течение многих лет кеш запросов MySQL был решением всех наших проблем с производительностью. Если ваш сайт работал медленно, эксперты MySQL предложили включить кеш запросов. Оказывается, если у вас высокая нагрузка на запись, кеш на самом деле наносит вред. Если вы включите его без тестирования, вы никогда не узнаете.

И не забывайте, что вы никогда не закончили масштабирование. Сайт, который обрабатывает 10req / s, потребует изменений для поддержки 1000req / s. И если вам хватит удачи, чтобы поддерживать 10 000 req / s, ваша архитектура, вероятно, также будет выглядеть совершенно иначе.

Базы данных

  • Не используйте MySQLi - PDO - это «современный» уровень доступа к базе данных OO. Самая важная функция - заполнители в ваших запросах. Он достаточно умен, чтобы использовать подготовку на стороне сервера и другие оптимизации для вас.
  • Вы, вероятно, не хотите разбивать вашу базу данных на этом этапе. Если вы обнаружите, что одна база данных не обрезается, есть несколько способов масштабирования, в зависимости от вашего приложения. Репликация на дополнительные серверы обычно работает хорошо, если у вас больше операций чтения, чем записи. Sharding - это метод разделения ваших данных на множество машин.

Кэширование

  • Вы, вероятно, не хотите кэшировать в своей базе данных. База данных, как правило, является вашим узким местом, поэтому добавление к ней большего количества операций ввода-вывода, как правило, плохо. Существует несколько кешей PHP, которые выполняют похожие функции, такие как APC и Zend.
  • Измерьте свою систему с включенным и выключенным кэшированием. Бьюсь об заклад, ваш кеш тяжелее, чем обслуживать страницы прямо.
  • Если сборка ваших комментариев и данных статьи из базы данных занимает много времени, интегрируйте memcache в вашу систему. Вы можете кэшировать результаты запроса и сохранять их в экземпляре memcached. Важно помнить, что получение данных из memcache должно быть быстрее, чем сборка из базы данных, чтобы увидеть какую-либо выгоду.
  • Если ваши статьи не являются динамическими, или у вас есть простые динамические изменения после того, как они сгенерированы, рассмотрите возможность записи html или php на диск. У вас может быть страница index.php, которая ищет на диске статью, если она там, она передает ее клиенту. Если это не так, он генерирует статью, записывает ее на диск и отправляет клиенту. Удаление файлов с диска приведет к перезаписи страниц. Если к статье добавлен комментарий, удалите кэшированную копию - она ​​будет восстановлена.

10
@ запись на диск. Вы можете даже отказаться от index.php и позволить Apache выполнить всю работу за вас, так что index.php вызывается только в том случае, если путь не существует. Вы бы использовали mode_rewrite для этого.
troelskn

5
-1, PDO значительно медленнее, чем MySQLi или даже расширение MySQL.
Аликс Аксель

4
PDO был намного медленнее, чем mysqli, и не работал правильно для вложенных запросов для меня. Mysqli также поддерживает подготовку на стороне сервера и связанные параметры, как PDO.
Дарен Швенке

5
Я не могу поверить, что это было принято как ответ. Это не очень хорошо.
Symcbean

1
about: caching - images, css, htm и js помогут, отключите куки на изображениях тоже!
Талви Вати

61

Я ведущий разработчик сайта с более чем 15 миллионами пользователей. У нас было очень мало проблем с масштабированием, потому что мы планировали это РАНЬШЕ и масштабировали вдумчиво. Вот некоторые из стратегий, которые я могу предложить из своего опыта.

СХЕМА Во-первых, денормализуйте свои схемы. Это означает, что вместо того, чтобы иметь несколько реляционных таблиц, вы должны вместо этого выбрать одну большую таблицу. В общем, объединения - это пустая трата ценных ресурсов БД, потому что многократная подготовка и сопоставление записывают дисковые операции ввода-вывода. Избегайте их, когда можете.

Компромисс здесь заключается в том, что вы будете хранить / извлекать избыточные данные, но это приемлемо, потому что пропускная способность данных и внутриклеточная область очень дешевы (большие диски), тогда как множественная подготовка ввода-вывода на несколько порядков дороже (больше серверов) ,

УКАЗАНИЕ Убедитесь, что в ваших запросах используется хотя бы один индекс. Однако будьте осторожны, эти индексы будут стоить вам, если вы будете часто писать или обновлять. Есть несколько экспериментальных приемов, чтобы избежать этого.

Вы можете попробовать добавить дополнительные столбцы, которые не индексируются, которые идут параллельно индексированным столбцам. Затем вы можете иметь автономный процесс, который записывает неиндексированные столбцы по индексированным столбцам в пакетном режиме. Таким образом, вы можете лучше контролировать, когда mySQL потребуется пересчитать индекс.

Избегайте вычисляемых запросов, как чума. Если вам нужно вычислить запрос, попробуйте сделать это один раз во время записи.

КЕШИНГ Я очень рекомендую Memcached. Это было доказано крупнейшими игроками в стеке PHP (Facebook) и является очень гибким. Для этого есть два метода: один - кэширование на уровне вашей БД, другой - кэширование на уровне вашей бизнес-логики.

Параметр уровня БД потребует кэширования результатов запросов, извлеченных из БД. Вы можете хешировать ваш SQL-запрос с помощью md5 () и использовать его в качестве ключа поиска перед переходом в базу данных. Плюс в том, что это довольно легко реализовать. Недостатком (в зависимости от реализации) является то, что вы теряете гибкость, потому что вы относитесь ко всему кэшированию одинаково в отношении срока действия кэша.

В магазине, в котором я работаю, мы используем кэширование на бизнес-уровне, что означает, что каждый конкретный класс в нашей системе контролирует свою собственную схему кэширования и время ожидания кэширования. Это хорошо сработало для нас, но учтите, что элементы, извлекаемые из БД, могут не совпадать с элементами из кеша, поэтому вам придется обновлять кеш и БД вместе.

ОХРАНА ДАННЫХ Репликация только уводит вас. Рано, чем вы ожидаете, ваши записи станут узким местом. Чтобы компенсировать это, убедитесь, что поддерживаете передачу данных как можно раньше. Вы, вероятно, захотите застрелиться позже, если вы этого не сделаете.

Это довольно просто реализовать. По сути, вы хотите отделить ключевой орган от хранилища данных. Используйте глобальную БД для хранения сопоставления между первичными ключами и идентификаторами кластера. Вы запрашиваете это отображение, чтобы получить кластер, а затем запрашиваете кластер, чтобы получить данные. Вы можете чертовски кэшировать эту операцию поиска, что сделает ее незначительной операцией.

Недостатком этого является то, что может быть трудно собрать воедино данные из нескольких сегментов. Но вы также можете обойти это.

ОФФЛАЙН-ОБРАБОТКА Не заставляйте пользователя ждать вашего бэкэнда, если ему это не нужно. Создайте очередь заданий и переместите любую обработку, которую вы можете в автономном режиме, делая это отдельно от запроса пользователя.


9
+1 Руки вниз, это должен быть принятый ответ. Интересно, что все, что я когда-либо читал о построении баз данных, всегда говорит «нормализуйте все данные в максимально возможной степени», не упоминая прирост производительности при выполнении соединений. Я всегда интуитивно чувствовал, что объединения (особенно множественные) добавляли много накладных расходов, но до сих пор не слышал, чтобы кто-то прямо говорил об этом. Хотелось бы, чтобы я лучше понял, о чем вы говорите, когда MySQL вычисляет индексы, это звучит как очень интересный хак.
Эван Плейс,

Разделение данных важно для баз данных, которые становятся слишком большими. Google (компания, а не поисковая система) может рассказать много интересного о реализации схем шардинга. Автономная обработка также огромна, когда дело доходит до ограничения количества записей в базу данных (и ограничения количества пересчетов индексов таблиц). Я видел много блогов (и я думаю, что даже переполнение стека) использует эту технику для своих пользовательских комментариев / систем обратной связи.
Эван Плейс,

1
Спасибо за комментарии. Удивительно, что некоторые приводят доводы в пользу профилирования кода среднего уровня, когда время выполнения VAST тратится либо на ввод-вывод данных, либо на ввод-вывод клиент-сервер. Сложная оптимизация, экономящая 20% времени выполнения PHP-процесса, который занимает 40 мс, бессмысленна по сравнению с простой 5% -ной экономией от запроса к базе данных 1 с.
thesmart

42

Я работал над несколькими сайтами, которые получают миллионы обращений в месяц с помощью PHP и MySQL. Вот некоторые основы:

  1. Кеш, кеш, кеш. Кэширование - это один из самых простых и эффективных способов снизить нагрузку на ваш веб-сервер и базу данных. Кэшируйте содержимое страницы, запросы, дорогостоящие вычисления, все, что связано с вводом / выводом. Memcache очень прост и эффективен.
  2. Используйте несколько серверов, когда вы исчерпаны. Вы можете иметь несколько веб-серверов и несколько серверов баз данных (с репликацией).
  3. Сократите общее количество запросов к вашим веб-серверам. Это влечет за собой кэширование JS, CSS и изображений с использованием заголовков expires. Вы также можете переместить статический контент в CDN, что ускорит работу вашего пользователя.
  4. Измерение и тест. Запустите Nagios на своих производственных машинах и загрузите тест на своем сервере dev / qa. Вы должны знать, когда ваш сервер загорится, чтобы вы могли предотвратить это.

Я бы порекомендовал прочитать « Создание масштабируемых сайтов» , он был написан одним из инженеров Flickr и является отличным справочником.

Посмотрите мой пост в блоге о масштабируемости, там много ссылок на презентации о масштабировании с использованием нескольких языков и платформ: http://www.ryandoherty.net/2008/07/13/unicorns-and-scalability/


1
+1 Здесь много хорошей информации. В последнее время я больше изучаю эту тему, и ваш ответ соответствует всем, что я прочитал. Memcache, кеширование, CDN для статического контента, сокращение запросов; все хорошие вещи. Я также добавил бы, генерировать хэши на стороне файлов статического контента (если у вас за CDN / кеш), чтобы у обновленных файлов была уникальная подпись в кеше. Кроме того, объединяйте статические исходные файлы (css, javascript) на лету (и кэшируйте их с помощью хэшей имени файла), чтобы сократить количество запросов. Кроме того, генерируйте большие пальцы динамически (и сохраняйте их в кеше)
Evan Plaice

Google создал модуль apache с именем mod_pagespeed, который может обрабатывать все конкатенации файлов, минимизацию, переименование файлов, включая хэш и т. Д. Для всего статического содержимого. Первоначально это должно добавить лишь небольшие накладные расходы на обработку серверов, пока кеши (и CDN) не будут заполнены большей частью контента. Кроме того, для безопасности, как правило, плохая идея помещать таблицы, которые являются общедоступными (пользователи), в одну базу данных с таблицами, а не обрабатывать внутреннюю часть (если по какой-либо причине одна из таблиц должна была быть взломана).
Эван Плейс,

39

Re: PDO / MySQLi / MySQLND

@ Гэри

Вы не можете просто сказать «не используйте MySQLi», поскольку у них разные цели. PDO почти как уровень абстракции (хотя на самом деле это не так) и предназначен для упрощения использования нескольких продуктов баз данных, тогда как MySQLi специфичен для соединений MySQL. Нельзя сказать, что PDO - это современный уровень доступа в контексте его сравнения с MySQLi, потому что ваше утверждение подразумевает, что прогрессия была mysql -> mysqli -> PDO, а это не так.

Выбор между MySQLi и PDO прост - если вам нужно поддерживать несколько продуктов баз данных, вы используете PDO. Если вы просто используете MySQL, вы можете выбрать между PDO и MySQLi.

Так почему же вы выбрали MySQLi вместо PDO? Увидеть ниже...

@ross

Вы правы в отношении MySQLnd, который является новейшей библиотекой уровня ядра языка MySQL, однако он не заменяет MySQLi. MySQLi (как и в PDO) остается тем же способом, которым вы будете взаимодействовать с MySQL через ваш PHP-код. Оба они используют libmysql в качестве клиента C за кодом PHP. Проблема в том, что libmysql находится за пределами основного движка PHP, и именно в этом и заключается mysqlnd, то есть это Native Driver, который использует внутренние ядра PHP для максимизации эффективности, особенно в том, что касается использования памяти.

MySQLnd разрабатывается самими MySQL и недавно попал в ветку PHP 5.3, которая находится на тестировании RC и готова к выпуску в конце этого года. После этого вы сможете использовать MySQL и MySQLi ... но не PDO. Это даст MySQLi повышение производительности во многих областях (не во всех) и сделает его лучшим выбором для взаимодействия с MySQL, если вам не нужны такие абстракции, как возможности PDO.

Тем не менее, MySQLnd теперь доступен в PHP 5.3 для PDO, и поэтому вы можете получить преимущества от повышения производительности от ND до PDO, однако PDO по-прежнему является базовым уровнем базы данных и поэтому вряд ли сможет извлечь из этого столько же пользы. улучшения в ND, как MySQLi может .

Некоторые полезные тесты можно найти здесь, хотя они сделаны с 2006 года. Вам также нужно знать о таких вещах, как этот параметр .

При выборе между MySQLi и PDO необходимо учитывать множество факторов. В действительности это не будет иметь значения, пока вы не доберетесь до чрезмерно высоких номеров запросов, и в этом случае имеет больше смысла использовать расширение, специально разработанное для MySQL, а не расширение, которое абстрагирует вещи и обеспечивает драйвер MySQL. ,

Это не простой вопрос, который лучше, потому что каждый имеет свои преимущества и недостатки. Вам нужно прочитать ссылки, которые я предоставил, и придумать свое собственное решение, затем проверить его и выяснить. Я использовал PDO в прошлых проектах, и это хорошее расширение, но я выбрал бы чистую производительность MySQLi с скомпилированной новой опцией MySQLND (когда выйдет PHP 5.3).


6
Я переключился с PDO на mysqli, и обычные запросы начали выполняться ровно в 2 раза быстрее.
serg

5
@serg: хотите опубликовать несколько тестов, чтобы подтвердить это? Потому что я серьезно сомневаюсь, что простой переход с PDO на mysqli даст вам такой прирост скорости.
Станн

23

Общее

  • Не пытайтесь оптимизировать, прежде чем вы начнете видеть реальную нагрузку. Вы можете догадаться, но если вы этого не сделаете, вы потратили впустую свое время.
  • Использование JMeter , Xdebug или другой инструмент для сравнения сайта.
  • Если загрузка начинает вызывать проблемы, вероятно, будет задействовано кэширование объекта или данных, поэтому обычно читайте о параметрах кэширования (memcached, MySQL, параметры кэширования)

Код

  • Профилируйте свой код, чтобы вы знали, где находится узкое место, и находится ли он в коде или базе данных

Базы данных

  • Используйте MYSQLi, если переносимость на другие базы данных не важна, иначе PDO
  • Если тесты показывают, что проблема в базе данных, проверьте запросы, прежде чем начать кэширование. Используйте EXPLAIN, чтобы увидеть, где ваши запросы замедляются.
  • После оптимизации запросов и некоторого кэширования базы данных вы можете использовать несколько баз данных. Либо репликация на несколько серверов, либо разделение (разделение данных на несколько баз данных / серверов) могут быть подходящими, в зависимости от данных, запросов и типа поведения чтения / записи.

Кэширование

  • Много написано о кешировании кода, объектов и данных. Посмотрите статьи по APC , Zend Optimizer , memcached , QuickCache , JPCache . Сделайте это до того, как вам действительно понадобится, и вы будете меньше беспокоиться о том, чтобы начать неоптимизированный.
  • APC и Zend Optimizer являются кэшами кода операции, они ускоряют код PHP, избегая повторного анализа и повторной компиляции кода. Как правило, прост в установке, стоит сделать рано.
  • Memcached - это общий кеш, который вы можете использовать для кеширования запросов, функций или объектов PHP или целых страниц. Код должен быть специально написан для его использования, что может быть сложным процессом, если нет центральных точек для обработки создания, обновления и удаления кэшированных объектов.
  • QuickCache и JPCache являются файловыми кешами, в остальном похожи на Memcached. Основная концепция проста, но также требует кода и легче с центральными точками создания, обновления и удаления.

Разное

  • Рассмотрим альтернативные веб-серверы для высокой нагрузки. Серверы, такие как lighthttp и nginx, могут обрабатывать большие объемы трафика в гораздо меньшем объеме памяти, чем Apache , если вы можете пожертвовать мощью и гибкостью Apache (или если вам просто не нужны те вещи, которые часто вам не нужны).
  • Помните, что в наши дни аппаратное обеспечение на удивление дешевое, поэтому обязательно потратьте усилия на оптимизацию большого блока кода по сравнению с «давайте купим сервер-монстр».
  • Попробуйте добавить в этот вопрос теги «MySQL» и «Масштабирование».

9

APC - абсолютная необходимость. Мало того, что это делает большую систему кэширования, но выгода от автоматически кэшированных PHP-файлов - это находка. Что касается идеи с несколькими базами данных, я не думаю, что вы бы много выиграли от наличия разных баз данных на одном сервере. Это может дать вам некоторое увеличение скорости во время запроса, но я сомневаюсь, что усилия, которые потребуются для развертывания и поддержки кода для всех трех, при условии, что они синхронизированы, стоили бы того.

Я также настоятельно рекомендую запустить Xdebug, чтобы найти узкие места в вашей программе. Это сделало оптимизацию бризом для меня.


9

Во-первых, как я думаю, Кнут сказал: «Преждевременная оптимизация - корень всего зла». Если вам не нужно решать эти проблемы прямо сейчас, тогда не сосредотачивайтесь на том, чтобы вначале работать правильно. При этом, если оптимизация не может ждать.

Попробуйте профилировать запросы к базе данных, выяснить, что медленно и что происходит, и придумать стратегию оптимизации из этого.

Я бы исследовал Memcached, так как это то, что многие сайты с высокой нагрузкой используют для эффективного кэширования контента всех типов, и интерфейс объекта PHP к нему довольно приятен.

Разделение баз данных между серверами и использование некоторой техники балансировки нагрузки (например, генерация случайного числа между 1 и # избыточными базами данных с необходимыми данными - и использование этого числа для определения, к какому серверу баз данных подключаться) также может быть отличным способом увеличения эффективность.

Все это довольно хорошо сработало в прошлом для некоторых сайтов с высокой нагрузкой. Надеюсь, это поможет вам начать :-)


1
RequiredFullQuote: «Мы должны забыть о малой эффективности, скажем, в 97% случаев: преждевременная оптимизация - корень всего зла»
Алистер Булман,

RequiredReallyFullQuote: «Программисты тратят огромное количество времени на размышления или беспокойство по поводу скорости некритических частей своих программ, и эти попытки повышения эффективности на самом деле оказывают сильное негативное влияние при рассмотрении вопросов отладки и обслуживания. Мы должны забыть о небольшой эффективности, скажем, в 97% случаев: преждевременная оптимизация - корень зла. Однако мы не должны упускать наши возможности в эти критические 3% ».
Чао

6

Профилирование вашего приложения с помощью чего-то вроде Xdebug (например, рекомендованного tj9991) определенно будет обязательным. Не имеет большого смысла просто вслепую оптимизировать вещи. Xdebug поможет вам найти реальные узкие места в вашем коде, чтобы вы могли разумно потратить время на оптимизацию и исправить куски кода, которые на самом деле вызывают замедления.

Если вы используете Apache, другая утилита, которая может помочь в тестировании, это Siege . Это поможет вам предвидеть, как ваш сервер и приложение отреагируют на высокие нагрузки, по-настоящему справившись с этой задачей.

Любой вид кэш-кода для PHP (например, APC или один из многих других) также очень поможет.


6

Я запускаю веб-сайт с 7-8 миллионами просмотров страниц в месяц. Не очень много, но достаточно, чтобы наш сервер чувствовал нагрузку. Решение, которое мы выбрали, было простым: Memcache на уровне базы данных. Это решение хорошо работает, если загрузка базы данных является вашей основной проблемой.

Мы начали использовать Memcache для кэширования целых объектов и результатов базы данных, которые наиболее часто использовались. Это сработало, но оно также привело к ошибкам (мы могли бы избежать некоторых из них, если бы мы были более осторожны).

Таким образом, мы изменили наш подход. Мы создали оболочку базы данных (с теми же методами, что и в нашей старой базе данных, поэтому ее было легко переключать), а затем мы создали ее подклассы, чтобы обеспечить доступ к базе данных memcached.

Теперь все, что вам нужно сделать, это решить, может ли запрос использовать кэшированные (и, возможно, устаревшие) результаты или нет. Большинство запросов, выполняемых пользователями, теперь выбираются непосредственно из Memcache. Исключением являются обновления и вставки, которые для основного сайта происходят только из-за регистрации. Эта довольно простая мера снизила нагрузку на наш сервер примерно на 80%.


6

Что бы это ни стоило, кэширование в PHP - DIRT SIMPLE, даже без пакета расширения / помощника, такого как memcached.

Все, что вам нужно сделать, это создать выходной буфер, используя ob_start().

Создать глобальную функцию кеша. Вызов ob_start, передать функцию в качестве обратного вызова. В функции найдите кешированную версию страницы. Если существует, подайте его и закончите.

Если он не существует, скрипт продолжит обработку. Когда он достигает соответствующего ob_end (), он вызовет указанную вами функцию. В это время вы просто получаете содержимое буфера вывода, помещаете его в файл, сохраняете файл и завершаете работу.

Добавьте в некоторые истечение / сборка мусора.

И многие люди не понимают, что вы можете вкладывать ob_start()/ ob_end()звонить. Так что, если вы уже используете выходной буфер, скажем, для разбора рекламных объявлений или подсветки синтаксиса или чего-то еще, вы можете просто вложить другой ob_start/ob_endвызов.


+1, потому что это выглядит как интересная идея. Я не знаю, насколько хорошо это работает с точки зрения производительности
Сильвердраг

+1 потому что это интересная идея. Эти обратные вызовы могут вызвать мой класс кеширования!
Xeoncross

5

Спасибо за совет по расширению кэширования PHP - не могли бы вы объяснить причины использования одного над другим? Я слышал замечательные вещи о memcached через IRC, но никогда не слышал о APC - что вы думаете о них? Я предполагаю, что использование нескольких систем кэширования довольно неэффективно.

На самом деле, многие используют APC и memcached вместе ...


4

Похоже, я был не прав . MySQLi все еще разрабатывается. Но, согласно статье, команда MySQL в настоящее время предоставляет PDO_MySQL. Из статьи:

Улучшенное расширение MySQL - mysqli - является флагманом. Он поддерживает все функции сервера MySQL, включая наборы символов, подготовленные операторы и хранимые процедуры. Драйвер предлагает гибридный API: вы можете использовать процедурный или объектно-ориентированный стиль программирования на основе ваших предпочтений. mysqli поставляется с PHP 5 и выше. Обратите внимание, что Конец жизни для PHP 4 - 2008-08-08.

Объекты данных PHP (PDO) - это уровень абстракции доступа к базе данных. PDO позволяет использовать одни и те же вызовы API для различных баз данных. PDO не предлагает какой-либо степени абстракции SQL. PDO_MYSQL - это драйвер MySQL для PDO. PDO_MYSQL поставляется с PHP 5. Начиная с PHP 5.3, разработчики MySQL активно участвуют в этом. Преимущество унифицированного API для PDO заключается в том, что конкретные функции MySQL, например, несколько операторов, не полностью поддерживаются через унифицированный API.

Пожалуйста, прекратите использовать первый в истории драйвер MySQL для PHP: ext / mysql. С момента появления MySQL Improved Extension - mysqli - в 2004 году с PHP 5, нет никаких оснований для того, чтобы использовать самый старый драйвер. ext / mysql не поддерживает кодировки, подготовленные операторы и хранимые процедуры. Он ограничен набором функций MySQL 4.0. Обратите внимание, что расширенная поддержка MySQL 4.0 заканчивается в 2008-12-31. Не ограничивайте себя набором функций такого старого программного обеспечения! Обновление до mysqli, см. Также Converting_to_MySQLi. MySQL находится в режиме обслуживания только с нашей точки зрения.

Мне кажется, что статья смещена в сторону MySQLi. Я полагаю, что я склонен к PDO. Мне действительно нравится PDO поверх MySQLi. Это прямо для меня. API намного ближе к другим языкам, на которых я программировал. Интерфейсы OO Database, кажется, работают лучше.

Я не сталкивался с какими-либо конкретными функциями MySQL, которые не были бы доступны через PDO. Я был бы удивлен, если бы я когда-либо сделал.


3

PDO также очень медленный, а его API довольно сложный. Никто в здравом уме не должен использовать его, если переносимость не является проблемой. И давайте посмотрим правде в глаза, в 99% всех веб-приложений это не так. Вы просто придерживаетесь MySQL или PostrgreSQL, или чего бы вы ни работали.

Что касается вопроса PHP и что принимать во внимание. Я думаю, что преждевременная оптимизация - корень всего зла. ;) Сначала сделайте свое приложение, постарайтесь сохранить его в чистоте, когда дело доходит до программирования, сделайте небольшую документацию и напишите модульные тесты. Со всем вышеперечисленным у вас не будет проблем с рефакторингом кода, когда придет время. Но сначала вы хотите закончить и вытолкнуть это, чтобы увидеть, как люди реагируют на это.


2

Конечно PDO это хорошо, но там уже был какой - то спор о том, что это производительности по сравнению с MySQL и MySQLi, хотя это , кажется , теперь исправлена.

Вы должны использовать pdo, если планируете переносимость, но если нет, то mysqli должен быть подходящим. Он имеет интерфейс OO, подготовленные операторы и большую часть того, что предлагает pdo (за исключением переносимости).

Кроме того, если производительность действительно необходима, подготовьтесь к (родному mysql) драйверу MysqLnd в PHP 5.3, который будет гораздо более тесно интегрирован с php, с лучшей производительностью и улучшенным использованием памяти (и статистикой для настройки производительности).

Memcache хорош, если у вас есть кластерные серверы (и загрузка, похожая на YouTube), но я бы тоже сначала попробовал APC .


2

Уже было дано много хороших ответов, но я хотел бы указать вам на альтернативный кэш кода операции под названием XCache . Это создано легким вкладчиком.

Кроме того, если в будущем вам может потребоваться балансировка нагрузки сервера базы данных, MySQL Proxy вполне может помочь вам в этом.

Оба эти инструмента должны легко подключаться к существующему приложению, поэтому эту оптимизацию можно выполнить, когда вам это нужно, без особых хлопот.


2

Первый вопрос: насколько вы действительно этого хотите? И сколько вы планируете инвестировать в свою инфраструктуру. Поскольку вы чувствуете необходимость задать вопрос здесь, я предполагаю, что вы ожидаете начать с малого при ограниченном бюджете.

Производительность не имеет значения, если сайт недоступен. А для доступности вам нужно горизонтальное масштабирование. Минимум, с которым вы можете разумно обходиться, это 2 сервера, на которых работают apache, php и mysql. Настройте одну СУБД в качестве ведомой по отношению к другой. Выполните все операции записи на главном устройстве и все операции чтения в локальной базе данных (что бы это ни было) - если только по какой-то причине вам не нужно считывать только что прочитанные данные (используйте мастер). Убедитесь, что у вас есть оборудование для автоматического продвижения раба и ограждения хозяина. Используйте циклический DNS для адресов веб-сервера, чтобы придать большее значение подчиненному узлу.

Распределение ваших данных по разным узлам базы данных на этом этапе - очень плохая идея, однако вы можете рассмотреть возможность их разделения по разным базам данных на одном сервере (что облегчит разделение между узлами, когда вы обгоните Facebook).

Убедитесь, что у вас есть инструменты мониторинга и анализа данных для измерения производительности ваших сайтов и выявления узких мест. Большинство проблем с производительностью можно исправить, написав лучший SQL / исправляя схему базы данных.

Хранить кэш шаблонов в базе данных - глупая идея - база данных должна быть центральным общим хранилищем для структурированных данных. Храните кэш шаблонов в локальной файловой системе вашего веб-сервера - он будет доступен быстрее и не замедлит доступ к вашей базе данных.

Используйте кэш оп-кода.

Потратьте много времени на изучение вашего сайта и его журналов, чтобы понять, почему он работает так медленно.

Поместите как можно больше кэширования на клиента.

Используйте mod_gzip, чтобы сжать все, что вы можете.

C.


2

Мой первый совет - подумать об этой проблеме и помнить об этом при разработке сайта, но не переусердствуйте . Зачастую сложно предсказать успех нового сайта, и я лучше потрачу ваше время на то, чтобы закончить рано и оптимизировать его позже.

В общем, Simple это быстро . Шаблоны замедляют вас. Базы данных замедляют вас. Сложные библиотеки замедляют вас. Слои шаблонов друг над другом, извлекая их из баз данных и анализируя их в сложной библиотеке -> время задержки умножаются друг на друга.

После того, как вы запустите основной сайт, проведите тесты, чтобы показать вам, на что вы можете потратить свои усилия. Трудно понять, на что нацеливаться. Часто, чтобы ускорить процесс, вам придется распутывать сложность кода, это делает его больше и сложнее в обслуживании, поэтому вы хотите делать это только при необходимости.

По моему опыту, установление соединения с базой данных было относительно дорогим. Если вы можете избежать неприятностей, не подключайтесь к базе данных для обычных посетителей на страницах с наибольшим объемом трафика, таких как главная страница сайта. Создание нескольких соединений с базой данных - это безумие с очень небольшой выгодой.


1

@ Гэри

Не используйте MySQLi - PDO - это «современный» уровень доступа к базе данных OO. Самая важная функция - заполнители в ваших запросах. Он достаточно умен, чтобы использовать подготовку на стороне сервера и другие оптимизации для вас.

Сейчас я зациклен на PDO, и похоже, что вы правы - однако я знаю, что MySQL разрабатывает расширение MySQLd для PHP - я думаю, чтобы преуспеть либо в MySQL, либо в MySQLi - что вы об этом думаете?


@ Райан , Эрик , tj9991

Спасибо за совет по расширению кэширования PHP - не могли бы вы объяснить причины использования одного над другим? Я слышал замечательные вещи о memcached через IRC, но никогда не слышал о APC - что вы думаете о них? Я предполагаю, что использование нескольких систем кэширования довольно неэффективно.

Я определенно буду разбираться с некоторыми профилирующими тестерами - большое спасибо за ваши рекомендации по ним.


1

В ближайшее время я не вижу, как я переключаюсь с MySQL - так что, мне кажется, мне не нужны возможности абстракции PDO. Спасибо за эти статьи DavidM, они мне очень помогли.


1

Посмотрите на mod_cache , кэш вывода для веб-сервера Apache, аналогичный кешированию вывода в ASP.NET.

Да, я вижу, что это все еще экспериментально, но когда-нибудь оно станет окончательным.


1

Я не могу поверить, что никто не упоминал об этом: модульность и абстракция. Если вы думаете, что ваш сайт должен будет вырасти до большого количества машин, вы должны разработать его так, чтобы он мог! Это означает, что такие глупые вещи, как не предполагать, что база данных находится на локальном хосте. Это также означает, что поначалу это будет беспокоить, например, написание уровня абстракции базы данных (например, PDO, но намного легче, потому что он делает только то, что вам нужно).

А это означает такие вещи, как работа с фреймворком. Вам понадобятся слои для вашего кода, чтобы впоследствии вы могли повысить производительность путем рефакторинга уровня абстракции данных, например, обучив его тому, что некоторые объекты находятся в другой базе данных - и код не должен знать или заботиться .

Наконец, будьте осторожны с интенсивными операциями с памятью, например, с ненужным копированием строк. Если вы можете уменьшить использование памяти PHP, то вы получите больше производительности от своего веб-сервера, и это будет масштабироваться, когда вы переходите к решению с балансировкой нагрузки.


1

Если вы работаете с большими объемами данных, и кеширование их не сокращает, загляните в Sphinx. Мы получили отличные результаты, используя SphinxSearch не только для лучшего поиска текста, но и в качестве замены поиска данных для MySQL при работе с большими таблицами. Если вы используете SphinxSE (плагин MySQL), он превзошел наш прирост производительности, который мы получили от кеширования в несколько раз, и реализация приложения - это просто.


1

Пункты, сделанные о кеше, точны; это наименее сложная и самая важная часть построения эффективного приложения. Я хотел бы добавить, что, хотя memcached - это здорово, APC работает примерно в пять раз быстрее, если ваше приложение работает на одном сервере.

В публикации «Сравнение производительности кэша» в блоге производительности MySQL есть несколько интересных тестов по этому вопросу - http://www.mysqlperformanceblog.com/2006/08/09/cache-performance-comparison/ .

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.