クラウドの障害診断の自動化に関する論文が国際ジャーナル「IEEE Access」に採録
さくらインターネット研究所の坪内(@yuuk1t)です。
2024年3月に、さくらインターネット研究所から投稿した学術論文が、アメリカ合衆国に本部を置く電気・情報工学分野の学術研究団体(学会)、技術標準化機関であるIEEEの、査読付き国際オープンアクセスジャーナル「IEEE Access」に採録・掲載されました。掲載された論文の情報は次の通りです。
- 書誌情報:Yuuki Tsubouchi, Hirofumi Tsuruta, MetricSifter: Feature Reduction of Multivariate Time Series Data for Efficient Fault Localization in Cloud Applications, IEEE Access (ACCESS) , Vol. 12, pp. 37398-37417, March 2024.
- 論文のファイル: https://ieeexplore.ieee.org/ielx7/6287639/6514899/10462133.pdf
- ソースコードとデータセットのリポジトリ: https://github.com/ai4sre/metricsifter
さくらインターネット研究所では、以前より、機械学習や統計解析技術を用いて、クラウドのシステム障害管理(インシデント管理とも呼ばれる)を自動化する研究を行ってきました。障害管理は、主にクラウドを用いたオンラインサービスの信頼性に着目するソフトウェア工学分野「SRE(Site Reliability Engineering)」が取り扱う重要課題です。
障害管理の自動化に関する我々の研究活動の中で、国際的な学術機関の媒体に掲載された論文は、本論文が初となります。以降では、本論文の概要を紹介します。
[続きを読む]