企業の生成AI導入・活用が進む現在、多くの企業が「AI実行コストの急増」という新たな課題に直面している。
全ての業務に高性能かつ高額なAIモデルを一律で適用してしまうと、従量課金が積み上がり、費用対効果(ROI)の説明が困難になるケースが発生しているためだ。
こうした中、Ragate株式会社は、新サービス「AIモデル賢い使い分け支援」の提供を2025年12月24日より開始した。
同サービスは、Claude、GPT、Geminiといった主要ベンダーのモデル特性を熟知した専門チームが、企業の業務内容に応じて最適なモデルを選定・設計するものだ。
「マルチベンダー対応のモデル設計」「独自学習データによるカスタムLLM構築」「AIワークフローの最適化」という3つのアプローチで、中長期的な運用コストの大幅な削減を実現する。
具体的には、高精度が求められる業務には高性能モデルを、定型的な処理には「Amazon Nova」や「Titan」といった安価なモデルを配置するなど、適材適所の使い分けを行う。
また、HuggingFace上のオープンモデルなどを企業の独自データでファインチューニングし、AWS SageMaker上でセキュアにホスティングすることで、従量課金型から予測可能な固定費型への移行も可能にする。
さらに、オープンソースのLLMアプリ開発プラットフォーム「Dify」を活用してワークフローを最適化する点も特徴だ。
最適化されたワークフローの中で、RAGにおける情報取得の効率化や、画像認識などの特定タスクを「Amazon Rekognition」のような専用AIに任せることで、高価なLLMの呼び出し回数自体を削減し、処理コストを圧縮する。
導入プロセスは、現状のAI利用状況の可視化とROI試算を行う「Assessment」、モデルの選定と構築を行う「Optimization」、ワークフローを実装する「Workflow」の3フェーズで構成されており、コスト削減効果を明確にしながら段階的に進めることができるとのことだ。
無料メルマガ会員に登録しませんか?

IoTに関する様々な情報を取材し、皆様にお届けいたします。
