言語モデルを用いたAI創薬:NeurIPS 2024採択論文の解説
さくらインターネット研究所の鶴田(@tsurubee3)です。先日、『さくらインターネットとCOGNANOのAI創薬に関する共同研究論文が、世界最高峰のAI国際会議「NeurIPS 2024」に採択』というニュースリリースを公開しました。このNeurIPS 2024に採択された論文(以下、「本論文」)は、ここ数年で急速に発展している言語モデルを創薬分野、特にタンパク質のアミノ酸配列に応用する研究です。このような研究は、Metaのようなビッグテックも活発に取り組んでおり、自然言語処理の分野で培われた技術が、自然言語の枠を超えて新薬候補の探索や設計に利用されつつあります。本記事では、本論文を中心に、言語モデルを活用した創薬の研究についてご紹介します。
[続きを読む]博物館用RAG(Retrieval-Augmented Generation)を作ってみました
皆さんこんにちは、さくらインターネット研究所の菊地です。
研究所ではAI・LLM(大規模言語モデル)技術に関して、技術そのものの発展のための本質的な研究からLLMを応用的に利用する研究まで、幅広く様々な領域での調査・検討を実施しています。今回はLLMを実際的に使う際にLLMに固有知識(ドメイン知識)を活用させるための手法として、汎用性があり使い勝手が良く近年注目されているRAG(Retrieval-Augmented Generation)を実際に試してみましたので、そのノウハウなどを簡単にご紹介したいと思います。
[続きを読む]大規模言語モデルの研究動向の調査:時系列データ分析とData-centric AIの視点から
さくらインターネット研究所の鶴田(@tsurubee3)です。先日、研究活動の一環として、時系列データ分析とData-centric AIの二つの視点から、大規模言語モデル(以下、LLM)の最新の研究動向について調査し、私の個人ブログに以下の二つの記事を書きました。本記事では、調査の動機とそれぞれの研究動向の概要について紹介します。
[続きを読む]さくらインターネット研究所 研究開発グループの取り組み紹介(24年4月)
こんにちは、さくらインターネット研究所 研究開発グループのグループリーダー菊地です。研究所ブログ記事としてはかなり久しぶりになってしまいましたが、研究所(研究開発グループ)の取り組み内容(研究テーマ)をご紹介したいと思います。
さくらインターネット研究所は現在、研究開発グループとプロダクト開発グループの2グループ体制となっておりまして、研究開発グループは、従来から引き続き、各研究員がそれぞれテーマを持って研究を推進するスタイルとなっています。研究テーマは時期で一律に区切るものではない(研究員がそれぞれ自分の考えるスパンで取り組む)のですが、年度の区切りでまとめるようにはしていて、2024年4月時点での各研究員の研究テーマは以下のようになっています。
[続きを読む]クラウドの障害診断の自動化に関する論文が国際ジャーナル「IEEE Access」に採録
さくらインターネット研究所の坪内(@yuuk1t)です。
2024年3月に、さくらインターネット研究所から投稿した学術論文が、アメリカ合衆国に本部を置く電気・情報工学分野の学術研究団体(学会)、技術標準化機関であるIEEEの、査読付き国際オープンアクセスジャーナル「IEEE Access」に採録・掲載されました。掲載された論文の情報は次の通りです。
- 書誌情報:Yuuki Tsubouchi, Hirofumi Tsuruta, MetricSifter: Feature Reduction of Multivariate Time Series Data for Efficient Fault Localization in Cloud Applications, IEEE Access (ACCESS) , Vol. 12, pp. 37398-37417, March 2024.
- 論文のファイル: https://ieeexplore.ieee.org/ielx7/6287639/6514899/10462133.pdf
- ソースコードとデータセットのリポジトリ: https://github.com/ai4sre/metricsifter
さくらインターネット研究所では、以前より、機械学習や統計解析技術を用いて、クラウドのシステム障害管理(インシデント管理とも呼ばれる)を自動化する研究を行ってきました。障害管理は、主にクラウドを用いたオンラインサービスの信頼性に着目するソフトウェア工学分野「SRE(Site Reliability Engineering)」が取り扱う重要課題です。
障害管理の自動化に関する我々の研究活動の中で、国際的な学術機関の媒体に掲載された論文は、本論文が初となります。以降では、本論文の概要を紹介します。
[続きを読む]3次元結晶構造に基づく材料の物性予測についてICMLA2023で発表しました
さくらインターネット研究所の鶴田(@tsurubee3)です。2023年12月15〜17日にアメリカ合衆国フロリダ州ジャクソンビルで開催された22nd International Conference on Machine Learning and Applications (ICMLA 2023)にて、「DeepCrysTet: A Deep Learning Approach Using Tetrahedral Mesh for Predicting Properties of Crystalline Materials」と題した研究について発表しました。
この研究は、マテリアルズ・インフォマティクスと呼ばれる材料科学と情報科学の融合分野における研究です。これまでさくらインターネット研究所では、ITインフラが主な研究開発の対象分野でしたが、最近では、大学や企業と連携しながら材料科学や創薬などの自然科学分野の研究開発にも積極的に取り組んでいます。今回の研究発表は、以前のプレスリリースでもご紹介した京都大学複合原子力科学研究所と共同で取り組んだ成果です。