Инженеры Skype установили точную причину сбоя сервиса
Сбой, который на сутки вывел сервис Skype из строя, произошел из-за ошибки в одной из версий клиента для ОС Windows. Компания Skype установила причины, которые привели к сбою в работе сервиса 22 декабря. Об этом директор Skype по информационным технологиям Ларс Раббе (Lars Rabbe) рассказал в блоге компании.
Сбой произошел из-за ошибки в версии Skype 5.0.0.152 для Windows. Эта версия была установлена у половины всех пользователей сервиса.
22 декабря оказались перегружены сервера, отвечающие за передачу сообщений пользователям в оффлайне. Из-за этого сервера отвечали на запросы клиентов с задержкой. Клиенты версии 5.0.0.152 из-за ошибки не смогли правильно обработать поступавшие с задержкой ответы сервера, что привело к отказам.
Skype представляет собой пиринговую сеть, то есть сеть, состоящую из равноправных узлов. На долю отказавших клиентов приходилось 25-30% коммутируемых узлов (supernodes), которые тоже вышли из строя. В результате резко (до 100 раз) возросла нагрузка на оставшиеся узлы.
На оставшихся узлах действовала система защиты от перегрузок. Когда нагрузка на них достигала определенного значения, узел отключался.
В общей сложности сбой продолжался около суток — с 19 часов по московскому времени 22 декабря до 19 часов 23 декабря.
Раббе рассказал, что Skype извлек уроки из происшедшего. В частности, он пообещал выпустить обновление, которое исправило бы ошибку в версии 5.0.0.152. 24 декабря администрация сервиса предложила своим платным пользователям компенсацию за простой в виде купонов на бесплатные звонки.
29.12.10 20:02,
*