niedziela, 18 września 2011

Dokonywanie Self Healing Facebook

Ciekawe wiadomości w url:http://rss.slashdot.org/~r/Slashdot/slashdot/~3/9shqwZZ2ypM/Making-Facebook-Self-Healing:
Nowe djeps wnioskodawca pisze "Kiedyś, aby osiągnąć pewien stopień automatycznego rozwiązywania problemów ze skryptami Nagios Event Handler i RabbitMQ, ale Facebook zrobił to na znacznie większą skalę niż mój stary dni sysadmin Cytując:". Gdy infrastruktura jest wielkość Facebook, zawsze są łamane serwerów i części oprogramowania, które spadły lub ogólnie złe zachowanie. W większości przypadków, nasze systemy są zaprojektowane tak, że te problemy powodują niewielki lub żaden wpływ na osoby korzystające z serwisu. Ale czasem małe przerwy mogą stać się większe awarii, błędów, które powoduje lub słabe wyniki na stronie. Jeśli kawałek złamanego oprogramowania lub sprzętu ma wpływu na miejscu, to ważne jest, aby to naprawić lub wymienić jak najszybciej. ... Musieliśmy znaleźć sposób automatyczny do obsługi tego rodzaju kwestii, tak, że człowiek inżynierowie mogli skoncentrować się na rozwiązywaniu i zapobieganiu większych, bardziej skomplikowanych awarii. Zacząłem więc pisać skrypty, kiedy miałem czas, aby zautomatyzować poprawek dla różnych typów złamań serwerów i elementy oprogramowania. "

Czytaj więcej o tej historii w Slashdot.


Brak komentarzy:

Prześlij komentarz