Ragate、生成AIの実行コストを最適化する「AIモデル賢い使い分け支援」を提供開始

企業の生成AI導入・活用が進む現在、多くの企業が「AI実行コストの急増」という新たな課題に直面している。

全ての業務に高性能かつ高額なAIモデルを一律で適用してしまうと、従量課金が積み上がり、費用対効果(ROI)の説明が困難になるケースが発生しているためだ。

こうした中、Ragate株式会社は、新サービス「AIモデル賢い使い分け支援」の提供を2025年12月24日より開始した。

同サービスは、Claude、GPT、Geminiといった主要ベンダーのモデル特性を熟知した専門チームが、企業の業務内容に応じて最適なモデルを選定・設計するものだ。

「マルチベンダー対応のモデル設計」「独自学習データによるカスタムLLM構築」「AIワークフローの最適化」という3つのアプローチで、中長期的な運用コストの大幅な削減を実現する。

具体的には、高精度が求められる業務には高性能モデルを、定型的な処理には「Amazon Nova」や「Titan」といった安価なモデルを配置するなど、適材適所の使い分けを行う。

また、HuggingFace上のオープンモデルなどを企業の独自データでファインチューニングし、AWS SageMaker上でセキュアにホスティングすることで、従量課金型から予測可能な固定費型への移行も可能にする。

さらに、オープンソースのLLMアプリ開発プラットフォーム「Dify」を活用してワークフローを最適化する点も特徴だ。

最適化されたワークフローの中で、RAGにおける情報取得の効率化や、画像認識などの特定タスクを「Amazon Rekognition」のような専用AIに任せることで、高価なLLMの呼び出し回数自体を削減し、処理コストを圧縮する。

導入プロセスは、現状のAI利用状況の可視化とROI試算を行う「Assessment」、モデルの選定と構築を行う「Optimization」、ワークフローを実装する「Workflow」の3フェーズで構成されており、コスト削減効果を明確にしながら段階的に進めることができるとのことだ。

無料メルマガ会員に登録しませんか?

膨大な記事を効率よくチェック!

IoTNEWSは、毎日新着ニュースを公開しております。

週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。

  • AIに関する最新ニュース
  • 実践を重要視する方に聞く、インタビュー記事
  • 業務改革に必要なAI活用方などのノウハウ

など、多岐にわたるテーマが配信されております。

また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。

無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。 ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。

無料メルマガ会員登録