অ্যামাজন বিভ্রাট: সংযুক্ত আরব আমিরাতের অ্যামাজনের ডেটাসেন্টারে আগুনের খবর; কোম্পানি বলছে: PST প্রায় 4:30 AM, আমাদের প্রাপ্যতা অঞ্চলগুলির মধ্যে একটি দ্বারা প্রভাবিত হয়েছিল … |
‘অবজেক্টস হিট’ UAE ডেটা সেন্টার সুবিধার পরে Amazon-এর ক্লাউড ইউনিট সাময়িকভাবে বন্ধ হয়ে গেছে। Amazon Web Service (AWS) নিশ্চিত করেছে যে 1 মার্চ আনুমানিক 4:30 AM PST-এ, উপলব্ধতা জোন mec1-az2-এর সুবিধা “বস্তু আঘাত” করে, স্পার্ক তৈরি করে এবং আগুন জ্বালায়৷ সংযুক্ত আরব আমিরাতের দমকল বিভাগ ভবনটির বিদ্যুৎ বিচ্ছিন্ন করেছে। এলাকা অন্ধকার হয়ে গেল। তার বিবৃতিতে AWS যোগ করেছে যে অন্যান্য অঞ্চলগুলি চালু রয়েছে এবং পুনরুদ্ধারে কয়েক ঘন্টা সময় লাগবে। AWS হেলথ ড্যাশবোর্ড বর্তমানে ডেটাসেন্টার ‘ব্যহত’-এ পরিষেবাগুলি দেখায়৷ এটি বলে যে নিম্নলিখিত AWS পরিষেবাগুলি এই সমস্যা দ্বারা প্রভাবিত হয়েছে: অ্যামাজন ইলাস্টিক কম্পিউট ক্লাউড এবং অ্যামাজন রিলেশনাল ডেটাবেস পরিষেবা৷ ইরানের ওপর মার্কিন ও ইসরায়েলের হামলার পর ইরানের ক্ষেপণাস্ত্র ও ড্রোন হামলার কারণে সংযুক্ত আরব আমিরাত কাটিয়ে উঠছে। ইরানি হামলা সারা দেশ এবং বিস্তীর্ণ উপসাগরের বিমানবন্দর, বন্দর এবং আবাসিক এলাকায় আঘাত করেছে বলে জানা গেছে। বার্তা সংস্থা রয়টার্স যখন এডব্লিউএসকে জিজ্ঞাসা করেছিল যে ডেটা সেন্টারের ঘটনাটি স্ট্রাইকের সাথে যুক্ত কিনা, কোম্পানিটি নিশ্চিত বা অস্বীকার করেনি। সংস্থাটি তার বিবৃতিতে বলেছে যে প্রভাবিত অঞ্চলে সংযোগ পুনরুদ্ধার করতে কয়েক ঘন্টা সময় লাগবে, ডেটা সেন্টার অপারেটর বলেছে, সংযুক্ত আরব আমিরাতের অন্যান্য অঞ্চলগুলি স্বাভাবিকভাবে কাজ করছে।
AWS স্বাস্থ্য ড্যাশবোর্ড স্ট্যাটাস আপডেট
UAE-এর জন্য AWS Health ড্যাশবোর্ড ‘বর্ধিত ত্রুটির হার’ দেখায়। এটি একাধিক পরিষেবা প্রভাবিতও দেখায়৷ এখানে ড্যাশবোর্ডে আপডেট আছে:মার্চ 01 6:01 PM PST: আমরা AssociateAddress API অনুরোধের পুনরুদ্ধার নিশ্চিত করি। আমরা এমন একটি পরিবর্তনও প্রয়োগ করেছি যা গ্রাহকদের ইলাস্টিক আইপি ঠিকানাগুলিকে রিসোর্স থেকে আলাদা করতে সক্ষম করে যা অন্তর্নিহিত পাওয়ার সমস্যা দ্বারা প্রভাবিত হয়। এই প্রশমনের মাধ্যমে, গ্রাহকরা এখন সফলভাবে অপ্রভাবিত AZs-এ নতুন নেটওয়ার্ক ঠিকানা তৈরি এবং সংযুক্ত করতে পারে সেইসাথে প্রভাবিত অঞ্চলের সংস্থান থেকে অপ্রভাবিত অঞ্চলের সংস্থানগুলিতে ইলাস্টিক আইপিগুলিকে পুনরায় সংযুক্ত করতে পারে৷ এই সময়ে বিদ্যুৎ পুনরুদ্ধারের জন্য আমাদের কাছে এখনও একটি ETA নেই। যে গ্রাহকরা পারেন তাদের জন্য, আমরা বিকল্প প্রাপ্যতা অঞ্চল বা অন্যান্য AWS অঞ্চল যেখানে প্রযোজ্য সেখানে ব্যবহার করার পরামর্শ দিই। আমরা 10:00 PM এর মধ্যে অন্য আপডেট প্রদান করব, অথবা যদি আমাদের কাছে শেয়ার করার জন্য অতিরিক্ত তথ্য থাকে।মার্চ 01 4:26 PM PST: আমরা AssociateAddress অনুরোধের জন্য পুনরুদ্ধারের উল্লেখযোগ্য লক্ষণ দেখতে পাচ্ছি এবং এই সমস্যাটি সম্পূর্ণভাবে প্রশমিত করার জন্য কাজ চালিয়ে যাচ্ছি। এটি AllocateAddress API এর আগের পুনরুদ্ধারের সাথে মিলিত হওয়ার অর্থ হল গ্রাহকরা এখন সফলভাবে অপ্রভাবিত AZs-এ নতুন নেটওয়ার্ক ঠিকানা তৈরি এবং সংযুক্ত করতে পারবেন। অন্যান্য AWS পরিষেবাগুলিও এখন EC2 নেটওয়ার্কিং API পুনরুদ্ধারের ফলে স্থায়ী উন্নতি লক্ষ্য করছে৷ আমরা এখন এমন একটি পরিবর্তন বাস্তবায়নের উপর ফোকাস করছি যা গ্রাহকদের অন্তর্নিহিত পাওয়ার সমস্যা দ্বারা প্রভাবিত সংস্থানগুলি থেকে ইলাস্টিক আইপি ঠিকানাগুলিকে বিচ্ছিন্ন করার অনুমতি দেবে। আমরা আশা করি এই নির্দিষ্ট প্রশমন সম্পূর্ণ হতে আরও এক ঘন্টা সময় লাগবে। এই সময়ে বিদ্যুৎ পুনরুদ্ধারের জন্য আমাদের কাছে কোনো ETA নেই। যে গ্রাহকরা পারেন তাদের জন্য, আমরা বিকল্প প্রাপ্যতা অঞ্চল বা অন্যান্য AWS অঞ্চল যেখানে প্রযোজ্য সেখানে ব্যবহার করার পরামর্শ দিই। আমরা 6:30 PM এর মধ্যে অন্য আপডেট প্রদান করব, অথবা আমাদের কাছে শেয়ার করার জন্য অতিরিক্ত তথ্য থাকলে শীঘ্রই।মার্চ 01 2:28 PM PST: আমরা অনেক EC2 API-এর জন্য পুনরুদ্ধারের ইতিবাচক লক্ষণ দেখছি, যেমন বর্ণনা এবং বরাদ্দ ঠিকানা। আমরা স্বীকার করি যে গ্রাহকরা এখনও AssociateAddress API কল করার চেষ্টা করার সময় ত্রুটির সম্মুখীন হচ্ছেন এবং অন্তর্নিহিত পাওয়ার সমস্যা দ্বারা প্রভাবিত সংস্থানগুলি থেকে ঠিকানাগুলিকে বিচ্ছিন্ন করতে অক্ষম৷ আমরা এই উভয় সমস্যা প্রশমিত করার জন্য একাধিক সমান্তরাল পথে কাজ চালিয়ে যাচ্ছি। আমরা যেখানেই সম্ভব অনুরোধগুলি পুনরায় চেষ্টা চালিয়ে যাওয়ার পরামর্শ দিই৷ আমরা আশা করি এই নির্দিষ্ট সমস্যাগুলির জন্য আমাদের বর্তমান প্রশমন প্রচেষ্টা দুই থেকে তিন ঘন্টার মধ্যে সম্পূর্ণ হবে। আমরা এই প্রশমন প্রচেষ্টার সাথে অগ্রগতির সাথে সাথে গ্রাহকরা এই অপারেশনগুলির জন্য উচ্চতর সাফল্যের হার পর্যবেক্ষণ করবেন। উপরন্তু, আমরা এই নির্দিষ্ট প্রশমন প্রচেষ্টার গতি বাড়ানোর উপায়গুলি তদন্ত করছি, কিন্তু নিশ্চিত করছি যে আমরা তা নিরাপদে করছি। এই সময়ের হিসাবে, বিদ্যুৎ পুনরুদ্ধার এখনও কয়েক ঘন্টা বাকি। আমরা 5:30 PST PST নাগাদ অন্য আপডেট প্রদান করব, অথবা যদি আমাদের কাছে শেয়ার করার জন্য অতিরিক্ত তথ্য থাকে তাহলে শীঘ্রই।মার্চ 01 12:14 PM PST: আমরা সচেতন যে কিছু গ্রাহক EC2 API কল করার সময় ত্রুটির সম্মুখীন হচ্ছেন, বিশেষত নেটওয়ার্কিং সম্পর্কিত APIs (AlocateAddress, AssociateAddress, DescribeRouteTable, DescribeNetworkInterfaces)। আমরা সক্রিয়ভাবে এই সমস্যাগুলি প্রশমিত করার জন্য একাধিক পথে কাজ করছি৷ AllocateAddress API-এ থ্রোটলিং ত্রুটির সম্মুখীন গ্রাহকদের জন্য, আমরা কোনো ব্যর্থ API অনুরোধ পুনরায় চেষ্টা করার পরামর্শ দিই। AssociateAddress API ত্রুটিগুলি প্রশমিত করতে আমরা একটি কনফিগারেশন পরিবর্তন স্থাপন করছি এবং পরবর্তী কয়েক ঘন্টার মধ্যে পুনরুদ্ধারের আশা করছি৷ DescribeRouteTable এবং DescribeNetworkInterfaces API কলগুলি জোন, ইন্টারফেস বা ইনস্ট্যান্স আইডিগুলি নির্দিষ্ট না করেই ব্যর্থ হবে বলে আশা করা হচ্ছে যতক্ষণ না আমরা প্রভাবিত অঞ্চলটি পুনরুদ্ধার করি। আমরা গ্রাহকদের এই API অনুরোধগুলিতে স্পষ্টভাবে এই আইডিগুলি পাস করার পরামর্শ দিই৷ যে গ্রাহকরা পারেন তাদের জন্য, আমরা বিকল্প AWS অঞ্চলগুলি ব্যবহার করার কথা বিবেচনা করার পরামর্শ দিই৷ আমরা 3:30 PST PST এর মধ্যে অন্য আপডেট প্রদান করব, অথবা যদি আমাদের কাছে আরও কিছু শেয়ার করার থাকে।মার্চ 01 9:41 AM PST: আমরা ME-CENTRAL-1 অঞ্চলের একটি একক প্রাপ্যতা অঞ্চলে বিদ্যুতের সমস্যা সম্পর্কে কিছু অতিরিক্ত তথ্য প্রদান করতে চাই। PST 4:30 AM PST-এ, আমাদের প্রাপ্যতা অঞ্চলগুলির মধ্যে একটি (mec1-az2) এমন বস্তু দ্বারা প্রভাবিত হয়েছিল যা ডেটা সেন্টারে আঘাত করেছিল, স্পার্ক এবং আগুন তৈরি করেছিল। ফায়ার ডিপার্টমেন্ট সুবিধা এবং জেনারেটরের বিদ্যুৎ বন্ধ করে দেয় যখন তারা আগুন নেভাতে কাজ করে। আমরা এখনও পাওয়ারটি আবার চালু করার অনুমতির অপেক্ষায় আছি, এবং একবার আমরা পাওয়ার পরে, আমরা নিশ্চিত করব যে আমরা নিরাপদে বিদ্যুৎ এবং সংযোগ পুনরুদ্ধার করব। প্রভাবিত AZ এর সাথে সংযোগ পুনরুদ্ধার করতে কয়েক ঘন্টা সময় লাগবে। এই অঞ্চলের অন্যান্য AZ গুলি স্বাভাবিকভাবে কাজ করছে৷ গ্রাহকরা যারা AZs জুড়ে অপ্রয়োজনীয়ভাবে তাদের অ্যাপ্লিকেশন চালাচ্ছেন তারা এই ইভেন্ট দ্বারা প্রভাবিত হবে না। EC2 ইনস্ট্যান্স লঞ্চগুলি প্রভাবিত AZ-এ প্রতিবন্ধী হতে থাকবে। আমরা সুপারিশ করি যে গ্রাহকরা যেকোনও ব্যর্থ API অনুরোধের পুনরায় চেষ্টা চালিয়ে যান। যদি একটি প্রভাবিত সংস্থান (EC2 ইন্সট্যান্স, EBS ভলিউম, RDS DB ইন্সট্যান্স, ইত্যাদি) অবিলম্বে পুনরুদ্ধারের প্রয়োজন হয়, তাহলে আমরা আপনার সাম্প্রতিক ব্যাকআপ থেকে পুনরুদ্ধার করার সুপারিশ করি, একটি অপ্রভাবিত অঞ্চলে বা বিকল্প AWS অঞ্চলে প্রতিস্থাপন সংস্থান চালু করে৷ আমরা 12:30 PST PST এর মধ্যে একটি আপডেট প্রদান করব, অথবা যদি আমাদের কাছে শেয়ার করার জন্য অতিরিক্ত তথ্য থাকে তাহলে শীঘ্রই।মার্চ 01 8:59 AM PST: আমরা ME-CENTRAL-1 অঞ্চলে (mec1-az2) প্রভাবিত প্রাপ্যতা অঞ্চলে বিদ্যুৎ পুনরুদ্ধারের দিকে কাজ চালিয়ে যাচ্ছি। সমান্তরালভাবে, আমরা সক্রিয়ভাবে ত্রুটির হার এবং বিলম্বের উন্নতির জন্য কাজ করছি যা কিছু গ্রাহক EC2 নেটওয়ার্কিং এবং EC2 বর্ণনা API-এর জন্য পর্যবেক্ষণ করছেন। অপ্রভাবিত প্রাপ্যতা অঞ্চলে বর্ধিত চাহিদার কারণে, গ্রাহকরা স্বাভাবিক প্রভিশনিং সময়ের চেয়ে বেশি সময় অনুভব করতে পারে বা নির্দিষ্ট উদাহরণের প্রকারের জন্য অনুরোধগুলি পুনরায় চেষ্টা করতে হতে পারে বা একটি বিকল্প উদাহরণের ধরন বেছে নিতে হতে পারে। আমরা 10:30 AM PST এর মধ্যে একটি আপডেট প্রদান করব, অথবা যদি আমাদের কাছে শেয়ার করার জন্য অতিরিক্ত তথ্য থাকে তাহলে শীঘ্রই।মার্চ 01 7:09 AM PST: আমরা বিচ্ছিন্ন বিদ্যুৎ সমস্যা সম্পর্কে কিছু অতিরিক্ত তথ্য প্রদান করতে চেয়েছিলাম। এই সময়ে, বেশিরভাগ AWS পরিষেবাগুলি প্রভাবিত প্রাপ্যতা অঞ্চল (mec1-az2) থেকে দূরে রয়েছে এবং তাদের প্রভাবিত ক্রিয়াকলাপ এবং কর্মপ্রবাহের জন্য পুনরুদ্ধার দেখছে। EC2 দৃষ্টান্ত, EBS ভলিউম, এবং অন্যান্য সংস্থান যা প্রভাবিত অঞ্চলে প্রভাবিত হয়, আমাদের পুনরুদ্ধারের দীর্ঘ লেজ থাকবে। এই সময়ে, ক্ষতিগ্রস্থ এজেডের বিদ্যুৎ এখনও পুনরুদ্ধার করা হয়নি। আপাতত, আমরা যেকোনো ব্যর্থ API অনুরোধের পুনরায় চেষ্টা চালিয়ে যাওয়ার পরামর্শ দিই। অবিলম্বে পুনরুদ্ধারের প্রয়োজন হলে, আমরা গ্রাহকদের EBS স্ন্যাপশটগুলি থেকে পুনরুদ্ধার করার এবং/অথবা প্রভাবিত সংস্থানগুলিকে প্রতিস্থাপনের রিসোর্সগুলি অপ্রভাবিত অঞ্চলগুলির একটিতে বা বিকল্প অঞ্চলে চালু করার পরামর্শ দিই৷ এই সময়ের হিসাবে, পুনরুদ্ধারের এখনও কয়েক ঘন্টা বাকি। আমরা 8:30 AM PST এর মধ্যে একটি আপডেট প্রদান করব, অথবা যদি আমাদের কাছে শেয়ার করার জন্য অতিরিক্ত তথ্য থাকে তাহলে শীঘ্রই।মার্চ 01 6:09 AM PST: আমরা নিশ্চিত করতে পারি যে একটি স্থানীয় বিদ্যুতের সমস্যা ME-CENTRAL-1 অঞ্চলে (mec1-az2) একটি একক প্রাপ্যতা অঞ্চলকে প্রভাবিত করেছে৷ EC2 ইনস্ট্যান্স, ডিবি ইনস্ট্যান্স, ইবিএস ভলিউম এবং অন্যান্য রিসোর্স বর্তমানে অনুপলব্ধ এবং এই সময়ে সংযোগ সমস্যা অনুভব করবে। অন্যান্য AWS পরিষেবাগুলিও কিছু কর্মপ্রবাহের জন্য ত্রুটির হার এবং বিলম্বের সম্মুখীন হচ্ছে৷ আমরা এই সময়ে বেশিরভাগ পরিষেবার জন্য ট্রাফিক দূর করেছি। আমরা গ্রাহকদের এই সময়ে ME-CENTRAL-1 অঞ্চলের অন্যান্য উপলব্ধতা অঞ্চলগুলির একটি ব্যবহার করার পরামর্শ দিই, কারণ অন্যান্য AZ-এর বিদ্যমান দৃষ্টান্তগুলি এই সমস্যা দ্বারা প্রভাবিত হয় না৷ আমরা সক্রিয়ভাবে শক্তি এবং সংযোগ পুনরুদ্ধার করার জন্য কাজ করছি, সেই সময়ে আমরা ক্ষতিগ্রস্ত সম্পদ পুনরুদ্ধারের জন্য কাজ শুরু করব। এই সময়ের হিসাবে, আমরা আশা করি পুনরুদ্ধারের একাধিক ঘন্টা দূরে। আমরা 7:15 AM PST এর মধ্যে একটি আপডেট প্রদান করব, অথবা যদি আমাদের কাছে শেয়ার করার জন্য অতিরিক্ত তথ্য থাকে।মার্চ 01 5:19 AM PST: স্থানীয়ভাবে বিদ্যুতের সমস্যার কারণে ME-CENTRAL-1 অঞ্চলের একটি একক উপলব্ধতা অঞ্চলে (mec1-az2) API এবং দৃষ্টান্তগুলিকে প্রভাবিত করে এমন সংযোগ এবং পাওয়ার সমস্যাগুলি আমরা তদন্ত করছি৷ এই অঞ্চলে বিদ্যমান দৃষ্টান্তগুলিও প্রভাবিত হবে। অন্যান্য AWS পরিষেবাগুলিও তাদের কর্মপ্রবাহের জন্য বর্ধিত ত্রুটি এবং বিলম্বের সম্মুখীন হতে পারে, এবং আমরা এই প্রভাবিত প্রাপ্যতা অঞ্চল থেকে দূরে থাকা অনুরোধগুলিকে রুট করার জন্য কাজ করছি৷ আমরা এই সময়ে গ্রাহকদের অন্যান্য প্রাপ্যতা অঞ্চল ব্যবহার করার পরামর্শ দিই। অবশিষ্ট AZs-এ RunInstances ব্যবহার করে নতুন লঞ্চকে লক্ষ্য করা সফল হওয়া উচিত। অন্যান্য AZ-এ বিদ্যমান দৃষ্টান্তগুলি প্রভাবিত হয় না।