SRE NEXT 2024での講演「工学としてのSRE再訪」がベストスピーカー賞を受賞
さくらインターネット研究所の坪内(@yuuk1t)です。
2024年8月に東京で開催されたSRE NEXT 2024 IN TOKYOにて、私の講演「工学としてのSRE再訪」がベストスピーカー賞を受賞しました。投票してくださった皆さま、そして講演をお聴きいただいた皆さまに、この場を借りて感謝します。受賞のお知らせをいただいてから幾分の時間が経ってしまいましたが、その間に講演動画も公開されましたので、本研究所ブログでも紹介します。
[続きを読む]さくらインターネット研究所 研究開発グループの取り組み紹介(24年4月)
こんにちは、さくらインターネット研究所 研究開発グループのグループリーダー菊地です。研究所ブログ記事としてはかなり久しぶりになってしまいましたが、研究所(研究開発グループ)の取り組み内容(研究テーマ)をご紹介したいと思います。
さくらインターネット研究所は現在、研究開発グループとプロダクト開発グループの2グループ体制となっておりまして、研究開発グループは、従来から引き続き、各研究員がそれぞれテーマを持って研究を推進するスタイルとなっています。研究テーマは時期で一律に区切るものではない(研究員がそれぞれ自分の考えるスパンで取り組む)のですが、年度の区切りでまとめるようにはしていて、2024年4月時点での各研究員の研究テーマは以下のようになっています。
[続きを読む]クラウドの障害診断の自動化に関する論文が国際ジャーナル「IEEE Access」に採録
さくらインターネット研究所の坪内(@yuuk1t)です。
2024年3月に、さくらインターネット研究所から投稿した学術論文が、アメリカ合衆国に本部を置く電気・情報工学分野の学術研究団体(学会)、技術標準化機関であるIEEEの、査読付き国際オープンアクセスジャーナル「IEEE Access」に採録・掲載されました。掲載された論文の情報は次の通りです。
- 書誌情報:Yuuki Tsubouchi, Hirofumi Tsuruta, MetricSifter: Feature Reduction of Multivariate Time Series Data for Efficient Fault Localization in Cloud Applications, IEEE Access (ACCESS) , Vol. 12, pp. 37398-37417, March 2024.
- 論文のファイル: https://ieeexplore.ieee.org/ielx7/6287639/6514899/10462133.pdf
- ソースコードとデータセットのリポジトリ: https://github.com/ai4sre/metricsifter
さくらインターネット研究所では、以前より、機械学習や統計解析技術を用いて、クラウドのシステム障害管理(インシデント管理とも呼ばれる)を自動化する研究を行ってきました。障害管理は、主にクラウドを用いたオンラインサービスの信頼性に着目するソフトウェア工学分野「SRE(Site Reliability Engineering)」が取り扱う重要課題です。
障害管理の自動化に関する我々の研究活動の中で、国際的な学術機関の媒体に掲載された論文は、本論文が初となります。以降では、本論文の概要を紹介します。
[続きを読む]