回路ブレーカの故障は、Salesforceのサービス停止の初期の原因でした

Salesforceは、先週米国でサービスを中断したデータベース障害の原因を追跡したとしている。その初期の原因は、同社のワシントンD.C.データセンターでの回路遮断器の故障であり、これがファームウェアのバグと組み合わされている。

この停止は先週発生し、Salesforceの一部の米国のクライアントは1日以上サービスにアクセスできない状態になりました。この事件はCEOのMarc Benioff氏がTwitterを介して不満を抱いた顧客に謝罪し、個人的に謝罪するよう促した。

しかし、Salesforceはヘルプページで中断の謝罪を行い、今後も同様のイベントが発生すると、中断はずっと迅速に解決されると顧客に安心感を与えています。

この問題の根本原因は、5月9日にワシントンのデータセンターへの電力供給を制御する回路遮断器が故障したことでした。

セールスフォースの製品戦略の日2016年:重要な発表、セールスフォースはフィールドクラウド向けの新製品でサービスクラウドを、マイナーCIOはクラウドコンピューティングのSalesforce

「このブレーカは、データセンターのユニバーサル電源リングから電力を分割し、異なる部屋に電力を誘導するために使用されます。このボードでは、配電システムの一部が障害状態になりました。電子回路ブレーカが問題ボードの状態を確認できなかったため、冗長ブレーカがバックアップフィードをアクティブにすることができなくなった」と同社は述べた。

これは開始に過ぎず、できるだけ早くNA14インスタンスへのサービスを復元するために、チームはプライマリデータセンター(ワシントン)からシカゴのセカンダリデータセンターに移動しました。しかしこれが終わってから、技術チームはNA14インスタンスのパフォーマンスの低下を観測しました。つまり、NA14の顧客はSalesforceサービスにアクセスできませんでした。同社によれば、この2番目の問題はストレージアレイ上のファームウェアバグが原因で、データベースがアレイに書き込むまでの時間が大幅に増えたという。

ストレージアレイに書き込む時間が増加したため、ストレージ階層に書き込むときにデータベースがタイムアウト状態になり始めました。これらのタイムアウト条件が開始されると、1つのデータベース書き込みが正常に完了せず、ファイルの不一致状態がデータベースに存在するようになりました。この不一致が発生すると、データベースクラスタに障害が発生し、再起動できませんでした。

すべての機能は、5月15日にサンドボックスコピーと毎週のエクスポート機能を含むNA14インスタンスに復元されました。

現在進行中の調査にもかかわらず、破損したサーキットブレーカの起源が何であったかはまだ分かりません。また、Salesforceでは、問題のある部分が2016年3月に負荷テストに合格したことを指摘しています。Salesforceは、ブレーカの故障。

失敗の余波の後、Salesforceはワシントンのデータセンターで障害のあるコンポーネントを交換し、電源障害のシステムの完全な監査を実行して、電源障害フェールオーバーが同様の障害が発生した場合でも正しく応答するようにしています。未来。

データセンター:IBMは新しいLinux、Power8、OpenPowerシステム、Cloud、マイケル・デル、EMCの契約を締結した:「何十年にもわたって考えることができる、データセンター、Dellテクノロジーズ・リフトオフ:Dell、EMC、人工知能; Nvidiaは非営利研究のAIスーパーコンピュータを提供

「ストレージ・レイヤーへのタイムアウト条件書込みが発生したときに、データベースのファイルの不一致の根本的な原因を特定するために、データベースベンダーとともに調査が続けられています。その調査から、是正措置が決定され、実施されます。

「この事件があなたとあなたの組織にもたらした影響について心からお詫び申し上げます」同社は付け加えた。

雇用者

IBM、新しいLinux、Power8、OpenPowerシステムを発表

マイケル・デルがEMCとの契約を締結した。「数十年後には、

Dell Technologiesがリフトオフする:ここでは、Dell、EMC、エンタープライズビジネスの群れが結合

Nvidiaは非営利の研究のためにAIスーパーコンピュータを提供