Ответы:
Я за 15 лет работы в этой отрасли начал новую консалтинговую должность в компании, чтобы выяснить, что у них «хорошая» инфраструктура. Обычно это причина, по которой меня вызывают, чтобы исправить их.
Обычная причина этого беспорядка - нетехнические лица, принимающие решения, принимающие технические решения.
Несколько лет назад я выполнил работу по «оценке» сетевой инфраструктуры небольшой производственной компании. Во время этой работы я обнаружил, что их ERP-система никогда не резервировалась. Без ведома их бывший ИТ-подрядчик настраивал Backup Exec для ежедневных полных резервных копий, но никогда не создавал сценарии «дампа» или остановки / запуска сервера базы данных, используемого их системой ERP, поэтому файлы базы данных всегда использовались и пропускались резервный. Таким образом, в течение более 3 лет они ежедневно делали резервные копии на лентах, на которых не было данных их ERP-системы. Они покорно сменили ленту, как сказал им подрядчик, но, очевидно, никто (включая подрядчика) никогда не удосужился проверить, что на самом деле было на лентах.
Однажды в давние времена один из наших старших администраторов покинул нашу организацию и передал мне ответственность за «систему визуализации документов». Я был слабым человеком в команде, неопытным и готовым прыгнуть во что угодно.
Это было похоже на старый рекламный ролик Coke с Mean Joe Green ... Я был полностью доволен тем, что стал главным (единственным) администратором в производственной системе, ориентированной на клиента, и по дороге к нему он сказал: «Эй, парень, лови «Ожидайте, что он бросил мне пачку смятых бумаг с несколькими логинами и телефонный номер для поддержки вместо потного полотенца.
Эйфория быстро исчезла ... система состояла из 2 серверов, на которых работала база данных, общий ресурс, около 6 рабочих станций со сканерами и приложениями для обработки, а также веб-сервера и пользователей приложений, вошедших в систему для ссылок на документы. Это была безобразная путаница из apache и java и по крайней мере двух типов сценариев, работающих на Windows SQL Server. О, да. Мы также заплатили за серию «кастомизаций», которые часто ломались и о которых их поддерживающие люди всегда были в блаженном неведении.
Краткий список хороших времен:
Мало что было документировано, и я обнаружил каждую морщинку, когда что-то сломалось. Как скажем ... отчеты были неверными или не распечатаны. Или Desktop выдвинул новую версию JVM, и никто не мог сканировать. Или кто-то сбросил ключ с рабочей станции сканирования, и приложение упало. Или файловая система журнала заполнена. Или данные из извлечения OCR привели к сбою приложения из-за неправильного захвата чего-либо и представления его как чего-то незаконного. Или узнать, что было открыто около 3 дюжин билетов при поддержке различных отделов, и многие из них были открыты в течение нескольких месяцев. И т. Д. И т. Д. Я обнаружил новые важные вещи со скоростью 4-5 в неделю и начал очень быстро изучать все тонкости этого приложения и его потребности, а также достаточное количество SQL Server, чтобы поддерживать базу данных умеренно здоровой.
Самое приятное было, когда меня пригласили на внутреннее собрание группы пользователей, чтобы «приветствовать» меня на моей новой должности. Я не шучу. 30 злых пользователей по кругу и мне надо посидеть посередине.
Это было грубо, но я научился довольно быстро. Помимо всей боли, это была отличная возможность. Часть меня хотела бы, чтобы это не было таким испытанием, но, возможно, я бы не научился так быстро.
Извините, что так долго ... но ааа ... это как терапия;)
около 12 лет назад я начал работать системным администратором в интернет-провайдере среднего размера, где работало около 30 человек. до этого у них никогда не было настоящего системного администратора, просто некоторые люди думали, что они знают, что делают (иногда они были правы, чаще всего они не были. В целом, системы просто поражают).
Но главное, что почти все в этом месте имели пароли root для серверов. Я не знаю о портье, но, конечно, все менеджеры, сотрудники службы поддержки, веб-разработчики и все, кто взаимодействовал с системой, имели права - как нынешние, так и бывшие сотрудники, поскольку они никогда не меняли ее. и они ВСЕ использовали бы это. по прихоти например, если клиент позвонил в службу поддержки с жалобой, он войдет в систему как root и будет связываться с системой до тех пор, пока проблема конкретного клиента не будет решена или каким-то волшебным образом не прекратится (что они считают «решенным»). конечно, это вызовет множество других проблем .... с которыми другие люди из справочной службы будут иметь дело в то же время, используя тот же метод «вход в систему, что и root, и разделка системы».
Естественно, изменение пароля root и запуск управления изменениями и других процессов для контроля того, что изменилось, когда, как и кем и кем был одним из первых, что я сделал. о да ... и резервное копирование и контроль версий для файлов конфигурации тоже.
(самое первое, что я сделал, это закрыл их почтовый сервер с открытой ретрансляцией и внедрил некоторую антиспам-фильтрацию. На самом деле, я уверен, что я получил работу, потому что я упомянул в интервью, что я сделал немало - работа со спамом. Мне неизвестно, у них была серьезная проблема со спамом / открытой ретрансляцией, которая продолжалась месяцами, и они понятия не имели, как ее исправить, поэтому они постоянно попали в черный список. Вскоре после этого я обнаружил ужасные новости. что примерно у каждого на месте был root-доступ)
Отвлечение root-прав от них поначалу вызывало много гнева, но, к счастью, мой начальник поддержал меня и то, чего я пытался достичь, и они быстро поняли, что серверы гораздо надежнее, чем когда-либо (не трудно достичь, учитывая, что было сделано с бедными вещами)
Маленькая сеть, которая была полностью стандартизирована: Windows 95 и NT Server .
Это было пару недель назад. ; - /
Легко, первая работа IS Manager, вошел и нашел пользовательское приложение Order Entry, которое было написано мужем клерка AP, в dBase, вы могли посмотреть на экраны и сказать, в каком порядке они были закодированы, потому что он узнал, как он ходил, некоторые экраны были монохромными, другие были похожи на дождевик на них. Многие части могли бы блокировать конкретный файл, поэтому только один представитель отдела обслуживания клиентов мог редактировать основную запись клиента за раз.
Добавьте к этому тонкий коаксиальный кабель в удаленном офисе с дешевыми поворотными разъемами (без обжима). Устранение неполадок телефонных звонков начнется с того, что они скажут, что сеть не работает, а затем я спросил, не переместил ли кто-нибудь мебель, компьютеры, не убирала ли где-нибудь пылесос. сломайте кольцо токенов, но недостаточно, чтобы вы могли видеть, что они были ослаблены.
Затем владелец возвращался из командировки с копией USNews, указывал на компьютерную рекламу и говорил: «Почему бы нам не использовать эти серверы?» Некоторое время я думал, что живу в мультфильме Дилберта. Я просто знаю, что Скотт Адамс преследует меня, делает записи ...
Ой. Вот так я и начал эту работу.
Это было в 2000 году у маленького провайдера. Большинство серверов представляли собой «серверное» оборудование класса Pentium 1 в корпусах вышек. Для аутентификации DNS и RADIUS это не было проблемой, и они фактически продолжали служить в течение многих лет, но реальным камнем преткновения было то, что все было BSD / OS 4.2. Хотя я был хорошо знаком с ним и с FreeBSD (я фактически использовал эту версию BSD на моей первой работе), сказать, что к тому времени она была довольно архаичной, является преуменьшением. Что былопроблема была в почтовом сервере и веб-сервере. Они были немного быстрее машин, но ужасно перегружены. Я не думаю, что оборудование было столь же надежным, хотя. Больше похоже на настольные машины, которым повезло (?) Достаточно, чтобы не умереть. Ничто не было улучшено с момента основания компании в 1994 году. Все это было втиснуто в один уголок офиса, который по совпадению не имел достаточного кондиционирования воздуха. И когда я говорю «офис», я имею в виду одну комнату для всех. В прошлом было несколько случаев отказа сервера из-за перегрева.
Хорошо, архаичная архитектура: проверьте.
Предыдущий системный администратор: крайне некомпетентен, продержался всего несколько месяцев, я думаю, он только начал запускать новую базу данных биллинга (и преобразовывать из своей старой биллинговой системы: бумаги), прежде чем исчезнуть в воздухе. До этого: это был владелец компании, который знал достаточно для создания учетных записей, веб-сайтов Apache и запуска остановленных серверов. Может быть, немного больше, чем это. Изредка ему помогал друг. Кто на самом деле работал риэлтором. Отношение Босса к системным администраторам: «кому они нужны? Вы платите кому-то 40 тысяч долларов за то, чтобы сидеть и пить кофе, читая журналы. Мне нужны представители техподдержки».
Безопасность: нет. Нет, правда . T1 предоставил серверам подключение к интернету. И офис. Исправлены публичные IP-адреса на все. Босс сказал: «О, мы в безопасности. Мы работаем с BSD / OS 4.2! Никогда не было взлома!» По крайней мере, пароли не были полностью задержаны, но каждый сервер по умолчанию работал на каждой машине. Без исправлений, конечно. Древние версии каждого серверного демона тоже.
Огни: везде! Все! На!! Пожар!!! То, что я сделал сначала, в течение недели после приема на работу (я мог бы добавить, в качестве технической поддержки. Хотите тоже заниматься системным администрированием? Делайте это, когда вы не заняты - я был достаточно молод и достаточно беден, чтобы мне было все равно) собрал воедино сценарий оболочки, который контролировал бы, сколько раз клиент мог войти в пул удаленного доступа одновременно. Это излечило наиболее насущную проблему, связанную с тем, что пул коммутируемых каналов все время был занят - из-за того, что спаммеры использовали его как способ агрегирования пропускной способности. Я упоминал, что сервер AAA RADIUS не имел этой функциональности в этой версии? И что новый сервер AAA RADIUS может компилироваться на этой платформе? Не мог FreeRADIUS? Смотрите раздел 1, Архаическое оборудование. Позже я даже сделал то же самое, чтобы реализовать ах, бухгалтерский учетна dialup, так что люди, которые подписались на 30 часов в месяц, не использовали 300 часов в месяц. Кажется, я вспоминаю, что почтовый сервер не был открытым ретранслятором, но, возможно, это было так. Он был с другой стороны, ужасно перегружена из - за того , что Sendmail, в какой бы архаичной версии оно используется, до сих пор используется MBox формат, необходимый разбор каждого сообщения из плоского файла , а почтовые ящики Maildir-формата с одним сообщением на файл , Так что, если кто-то с большим почтовым ящиком когда-либо проверял свою почту, сервер остановился для всех., И, конечно, исходящие SMTP и POP были на одной машине. Конечно, фильтрации спама не было. На входящую или исходящую почту. Я не могу вспомнить, что было не так с веб-сервером, кроме того, что каждый новый сайт был добавлен вручную. Это достаточно плохо, как есть.
Резервные копии: Резервные копии? Ахахахаха! Aaaaaah!
Однако самым удивительным в этом месте было то, что не было сервера печати . Хотите напечатать файл? Встаньте со своего стола, поверните ручку переключателя на компьютер, вернитесь назад, распечатайте файл. Я помню, что это было незадолго до того, как я это исправил.
Моя текущая среда Domino должна быть единственной. Один из предыдущих долгосрочных сотрудников был исключительно заинтересован в выполнении быстрой и грязной работы по развитию, поэтому в течение 10 лет не было абсолютно никакой основной работы по ведению домашнего хозяйства. Двое, последовавшие за ним, но предшествовавшие мне, - вполне понятно, - взглянули на него и решили просто опустить голову. Так что сейчас у меня полный беспорядок, связанный со стандартными именами, учетными записями пользователей по всем спискам ACL, старыми администраторами и разработчиками, которые уже давно перешли с учетными записями (и все еще в чувствительных группах), половина пользователей имеют один и тот же пароль другая половина паролей записана в электронной таблице, есть красивое критическое приложение для бизнеса с двумя собственными внутренними базами данных безопасностив дополнение к стандартному списку ACL, более 1000 баз данных (включая материал «Копия копии копии»), которые прошли 4 или 5 быстрых и грязных обновлений, прежде чем были заморожены на уровне версии 6, и которые почти ежедневно выходят из строя , Он также был параноиком по поводу масштабируемости Windows, поэтому, кстати, у меня есть 8-процессорные процессоры.
Выносить его на улицу и стрелять в него было бы пощадно
Когда я начал свою нынешнюю работу, я унаследовал эту должность от парня, уволенного за грубую некомпетентность через несколько недель. Ему не удалось сделать много, работая здесь, за исключением уничтожения каждой части документации, которую он получил от своего предшественника, изменения всех паролей администратора на случайные, даже не известные ему, и установки некоторых «скрытых» учетных записей на машинах для последующего входа в систему. ,
Пароли и бэкдоры не были реальной проблемой, но идти вперед, не зная, что делает, что и как, было довольно интересно. Тем не менее, ни один пользователь никогда не страдал от этого, но мне повезло, что этот парень был слишком глуп, чтобы нанести реальный ущерб.
этот вопрос заставляет мою голову болеть. Я работаю на государственное управление ... выигрывает самая низкая ставка!
Когда я занял свою нынешнюю должность, я потратил 2 недели, работая с парнем, убегающим, работая в основном над написанием веб-приложений, которые он потратил 6 месяцев на сборку с подрядчиком, поэтому у меня было хорошее представление о том, что происходит, когда приложение было запущен в производство Месяц спустя приложение было очищено, и они бросили деньги подрядчику, чтобы просто уйти. Я все еще имею дело с приложениями vb6 без документации, которая иногда вызывает другие приложения, для которых у меня даже нет кода!
Я даже не собираюсь вдаваться во все странные конфигурации серверов, резервное копирование за пределами площадки, которое находится через чертову улицу, или то, что целый другой отдел «обрабатывает» наши маршрутизаторы и коммутаторы (о, они получили это, заявив, что перепрограммируют Строительство стоит БЕЗ СТОИМОСТИ! Конечно, нет, теперь они просто взимают плату за порт и блокируют двойные MAC-адреса! Ради бога мы используем SIP-телефоны! И мы должны обосновать стоимость установки тестового компьютера. Aaarrrrgggghhh!)
Я должен остановиться, это заставит меня плакать. Я ежедневно поражаюсь, что все, что угодно, делается в правительстве.
Файловый сервер, обслуживающий 250 ГБ файлов примерно для 30 клиентов (сочетание ноутбуков и настольных компьютеров), каждый из которых имеет свои папки, сопоставленные с сетевыми ресурсами. Плохо то, что он работал под управлением Windows XP с максимальным пределом 10 клиентских подключений. Первым делом я отформатировал / установил Server 2003.
На следующий день мои коллеги были чрезвычайно счастливы, так как все они могли работать одновременно.
Когда я начал работать в моей нынешней компании, они использовали Small Business Server 2003, в итоге мы достигли уровня, когда нам пришлось перейти с SBS2003 на реальную «реальную» серверную среду. К сожалению, пакет перехода у нас не сработал, и MS благодаря недавно приобретенному корпоративному лицензированию помогла мне все перевести. Помогая, я имею в виду предоставление мне списка вещей, которые нужно переместить и изменить, но не совсем так.
Теперь я довольно опытный в недрах Active Directory, но одна из вещей, которые они мне не сказали, это то, что SBS НЕ нравится, когда убирают одну из ролей FSMO, через 8 или 12 часов она перезагружается, чтобы показать, как раздражен прочь это.
Это был кошмар, чтобы отказаться от SBS2003, и иногда я вижу ссылки на SBS в AD или ссылку на старый SBS-сервер тут и там, и вот уже около 2 лет.
О, кстати, я ненавижу SBS! :)
Сервер Windows 2003, который также является DC и работает под управлением Exchange 2003. Пока что достаточно плохо, но подождите, есть еще кое-что ... Это был также сервер терминалов, сервер SQL, веб-сервер и сервер FTP, сервер WSUS, обновления антивируса и сервер центральной конфигурации. и он размещал перемещаемые профили пользователей. Это был также центральный сервер резервного копирования, использующий ленты DAT.
Еще не достаточно плохо? Машина имела один ЦП, 2 ГБ ОЗУ и пару дисков SATA емкостью 7200 об / мин, настроенных как RAID 1. Массив был разделен на 2 логических диска, причем системный диск занимал 16 ГБ, из которых менее 2 ГБ было свободно. Машина была собрана из бывших в употреблении деталей подрядчиком, который рекомендовал спецификации, без сомнения, основываясь на том, какие запчасти он имел в наличии, и зарядил почти столько же, сколько стоил бы приличный новый сервер. Он также отвечал за настройку и ввод в эксплуатацию машины. Его совет был принят, потому что он имел дело с клиентом в течение почти десятилетия. Я убедился, что он больше не имеет с ними дело.
Я провел сетевой аудит европейских операций ОЧЕНЬ крупного производителя компьютеров ( Ирландия ). Это заняло несколько недель, но мы обнаружили, что каждый отдельный бит данных, распределяемый по каждому жесткому диску каждого ПК / сервера, который они создавали, перемещался по тем же 4 нитям провода - у них был один порт 1 Гбит / с, выполняющий ВСЕ их строит. Когда мы сказали им, что они набирают RAN, чтобы получить больше кабелей / SFP, и они были многопоточными в течение 30 минут, но это было шоком.
Моя первая работа была связана с планированием перехода с 18-летнего миникомпьютера "Point 4". Они хотели модернизировать свое оборудование «потому что владелец чувствовал, что существующее оборудование стареет». Этот старый мини-компьютер с разделением времени использовал переоборудованный терминал Televideo 955 с пользовательским ПЗУ, и на рынке было представлено всего 1 программа эмуляции терминала, которая позволила бы вам подключить к нему компьютер, чтобы он функционировал как тупой терминал. Конечно, эта программа работала только на System 7.
Продавец давно обанкротился. Детали были предоставлены поставщиком технической поддержки с годовым контрактом, и они собирались посещать его раз в несколько месяцев, так как что-то еще сломалось и его необходимо было заменить.
Самая большая проблема, с которой я столкнулся, была физическая, а не программная. Серверный шкаф также оказался электрическим и телефонным шкафом. Итак, с климат-контролем все в порядке, в виде гигантского трансформатора, обогревающего комнату. Шкаф был также вне комнаты, которая использовалась бы для небольших встреч. Мне пришлось вывесить таблички с указанием людям не закрывать двери в шкаф, даже если было шумно. К счастью, главного здания AC было достаточно, и временная ошибка не возникла. Работа по монтажу тоже была немного беспорядочной. В основном ваши стандартные крысы идут от коммутаторов к серверам. Самое приятное, что одна из стоек была отделена от другой пары стоек, поэтому между стеллажами был небольшой проход. У него был только один сервер, и силовые кабели для него просто проходили по полу без защитника и тоже не лежали плоско. Это позволило легко зацепить их ногой. После того, как вы падали вперед и приближались к растению, ленточный кабель с высокой шейкой, который был лениво натянут, перехватил бы вас и попытался сломать шею.
У меня не было возможности запустить этот патч до потолка, пока мы не переехали в офис (в серверную комнату с РЕАЛЬНЫМ АС!), Но я сошел с ума с липучками по всему этому шкафу. Вы могли бы действительно пройти, не убивая себя после этого!
У одной компании, в которой я работал, когда я только приехал, был офисный сервер (два жестких диска, один даже не смонтирован, и даже гораздо меньше зеркалированных) и арендованный сервер с общим расположением, всего один жесткий диск. Нет резервных копий на месте на всех.
У остальной части ЛВС были свои проблемы, но сама по себе удача в этом месте в течение 3 с лишним лет удивительна. Нет зеркалирования, нет избыточности, нет лент.
IIS 4 (или 3? Не помню) в NT 4, на котором работала корпоративная интрасеть на настольном компьютере без какой-либо избыточности или резервного копирования в течение примерно 12 лет, была (я забрал его в прошлом месяце) худшим, что я видел, я думаю , Ничего необычного, но все же.
База данных Informix, у которой самая загруженная и наиболее важная таблица имела экстенты 16 тыс., Имела до 38 000 экстентов в табличном пространстве (например, фрагментированный диск) и была в два раза выше поддерживаемого уровня. (Поставщик фактически написал бумажное письмо, в котором говорилось что-то вроде: «Ваша база данных в любой момент рухнет»)
Предыдущий администратор базы данных, SA и сетевой человек ушел, и я был около 6 недель вне школы. Я провел много исследований и выяснил, как решить эту проблему, что потребовало бы 6 часов простоя. Босс отказался планировать отключение.
Таким образом, в один из самых загруженных дней года система зависает. 500 операторов колл-центра и коммерческий веб-сайт не работают. Исправить это после сбоя было сложно, потому что поставщик никогда не делал этого раньше для таблицы такого размера и с чем-то похожим на «интересную» схему базы данных, которую мы использовали. Таким образом, мы сделали именно то, что я планировал сделать изначально, за исключением того, что проверка целостности базы данных заняла дополнительные 5 часов.
Конечно, это было еще в конце 90-х, но здесь я работал. У нас было наше серверное программное обеспечение, запущенное в отладчике, который был рабочим компьютером моего босса, поскольку он выполнял большую часть своей работы дома на другом компьютере, но все же, кто запускает их рабочий код в отладчике?
Сервер с двумя жесткими дисками, работающими на аппаратном шасси - однажды один диск умер и зазвучал сигнал тревоги, парни в офисе решили отключить сигнализацию, через три месяца второй диск умер, и они позвонили - не может получить доступ к своему серверу
На одной из работ один из предыдущих администраторов подумал, что было бы неплохо настроить почти все серверы Sun на отсутствие автоматической загрузки. Он также не стал бы помещать сценарии инициализации в соответствующие каталоги уровня запуска, потому что «я хочу знать, не сломался ли этот компьютер», я все еще не могу понять его аргументацию. Конечно, другой администратор был немного более склонен к таким вещам, которые в основном приводили к тому, что весь магазин был непоследовательным и действительно делал вещи интересными во время первых запланированных и незапланированных отключений.
Я держал окно Windows NT4 под управлением Citrix живым .. Первоначально он был настроен с программным рейдом ... Это верно ... Программный рейд, Windows NT4 .. Последний сбой повредил оба диска, и мне потребовалось ~ 8 часов, чтобы восстановить его ..
Для тех, кому интересно, Windows NT4 не любит работать в качестве компьютера Virt на хосте Linux :-D
У клиента было 5 сотрудников. Их старый ИТ-специалист изготовлен по индивидуальному заказу, с использованием бюджетного игрового оборудования, 2 сервера. 1 был контроллером домена, на котором также выполнялся обмен. другой был терминальным сервером. Каждый сотрудник использовал тонкий клиент для подключения и работы с сервером. Оба работали под управлением Windows 2000 и были построены 5 лет назад. Само собой разумеется, что, когда на обоих серверах в течение пары дней друг от друга умерли недорогие рейд-карты, я заменил серверы стандартным hp-сервером и получил их, используя обычные minitowers. Я также установил серверы на свои собственные ИБП, вместо того, чтобы они оба работали на одном и том же, не имея WAP и монитора резервного копирования.
Вдобавок к этому у них было 6 сетевых принтеров в офисе, и 2 использовали DHCP. Остальным 4 назначены IP-адреса, но они были разбросаны по всему диапазону делегированных IP-адресов без документации.
Это было грустно, но после месяца адаптации (старые приколы не слишком хорошо воспринимали изменения в том, как они работали), они звонят очень редко.
Меня вызвали, чтобы исправить плохо работающую систему MySQL, только для обнаружения неверного элемента заголовка, в /etc/my.cnf
котором все приятные параметры настройки, которые они пытались использовать, были проигнорированы в пользу значений по умолчанию ...
Итак, у нас была система с 7 ГБ на сервере с 16 ГБ ОЗУ, использующая ядро базы данных InnoDB ...
Неправильная конфигурация была установлена на 12 ГБ ОЗУ для InnoDB ...
Система использовала только 128 МБ ОЗУ для InnoBD ... так что / много / дисковой активности для каждого запроса и обновления!
Быстрое исправление заголовка, перезапуск службы MySQL и все, что угодно, все было кэшировано и выполнено превосходно :)
Странно, что никто не рассматривал возможность проверки того, что применяемые ими параметры настройки действительно используются !! : - /