ClineでClaude Sonnet 5を使う:設定・思考制御・Fable 5との比較(2026年版)
Sonnet 5をClineに5分で導入。正しいプロバイダー選び、コストを左右するreasoning effort、そしてSonnet 5($2/$10)がFable 5($10/$50)に勝つ場面を解説。
Clineは大量のトークンを消費します。毎ターン、ファイルツリー、開いているバッファ、進行中のタスクコンテキストを再送するため、選んだモデルがすぐに請求額に反映されます。Claude Sonnet 5は、弱いモデルに落とすことなくそのループを手頃にするモデルであり、このガイドでは約5分でセットアップします。
つまずくポイントは2つ:どのプロバイダー枠を使うか、そしてreasoning予算が品質とコストの両方を静かに左右する仕組みです。どちらも以下で扱い、あわせて本当に重要な唯一の判断——Fable 5に5倍を払うのはいつか——も解説します。
このセットアップ後にできること(とできないこと)
これが終われば、Sonnet 5がClineをフルエージェントとして駆動します:ファイルを読み、コードを書き、コマンドを実行し、プロンプトキャッシュと拡張思考も利用可能です。ここに正直なスコープを示します。
| 質問 | 回答 |
|---|---|
| Sonnet 5はフルのClineエージェントとして動作しますか? | はい、Anthropicプロバイダーならネイティブなツール利用が使えます。 |
| reasoningの深さを制御できますか? | はい、トークン予算ではなくeffortレベル(low/medium/high)で制御します。 |
| 後でFable 5やOpusに切り替えられますか? | はい、Model IDフィールド1つだけで、他の変更は不要です。 |
| プロンプトキャッシュは効きますか? | Anthropic経路なら効き、再送コンテキストのコストを10分の1に削減します。 |
| これでレート制限は全部なくなりますか? | いいえ。ゲートウェイはプロバイダーの制限を平準化しますが、消し去るわけではありません。 |
| OpenAI Compatibleでも同じ機能が使えますか? | 完全には使えません。キャッシュ制御やネイティブ思考が失われることがあります。 |
判断の枠組み:ClineでSonnet 5を使うべきとき(と使うべきでないとき)
Sonnet 5はClineのデフォルトドライバーであり、妥協ではありません。ただし唯一の選択肢でもなく、選択を誤ると両方向にお金を無駄にします。
Sonnet 5を使うべきとき
- Clineのセッションが長くファイル中心で、請求額を決めるのがピーク時の推論力ではなくトークン量である場合。
- 毎ターンのリポジトリコンテキスト再送コストを、キャッシュで和らげたい場合。
- 日常的な編集、リファクタリング、定型コードに使える有能なエージェントが必要な場合。これが作業の大半です。
使うべきでないとき
- タスクが確実にSonnet 5を打ち負かす場合:深いマルチファイルのリファクタリング、厄介な並行性のバグ、あるいは1つの誤判断が高コストになるアーキテクチャの決定。ここはFable 5やOpus 4.8の領域です。
- 大量の些末なファイル操作や単純な編集を行う場合。ここではさらに安いモデルでも同じ結果を出せます。
やめ時のルール
もし目的が単にClineをより安いClaudeエンドポイントに向けることだけなら、Anthropicプロバイダー、Base URL、Model IDを設定したらそこで終わりです。reasoningと比較のセクションは、コストと品質を調整したい人向けであり、基本的な接続だけを求める人向けではありません。
システム要件
- Cline拡張機能を入れたVS Code。マーケットプレイスからインストールし、最新リリースに更新してください。
- モデルを提供するバックエンド用のAPIキー。このガイドではAnthropic互換ゲートウェイであるofoxを使うので、1つのキーでSonnet 5、Fable 5、Opus 4.8に届きます。
- エンドポイントへのネットワーク到達性。企業のTLSプロキシの背後にいる場合は、まず証明書を整えてください。私たちのClaude Code SSL証明書エラーガイドと同じルールが、あらゆるNodeベースのツールに当てはまります。
ステップ・バイ・ステップ:ClineでSonnet 5
セットアップ全体は4つのフィールドとテストメッセージ1通です。本当の判断はステップ1だけです。
ステップ1:プロバイダー枠を選ぶ
Clineには2つの入口があります。Claudeには、Anthropicプロバイダーが正しいデフォルトです。
| プロバイダー枠 | Base URL | 最適な用途 |
|---|---|---|
| Anthropic | https://api.ofox.ai/anthropic | Claudeモデル、フルのネイティブツール利用、キャッシュ、思考 |
| OpenAI Compatible | https://api.ofox.ai/v1 | 1つの枠でClaudeと非Claudeのモデルをまとめて提供 |
AnthropicプロバイダーはClaudeのネイティブプロトコルを話すため、Clineのエージェント機能が変換レイヤーなしで動きます。OpenAI Compatibleを選ぶのは、混在モデルに1つのエンドポイントを意図的に使いたく、キャッシュ制御やネイティブ思考が通らない可能性を受け入れる場合だけです。
ステップ2:Cline設定を開いてプロバイダーを選択する
VS CodeのアクティビティバーでClineアイコンをクリックし、パネル上部の歯車アイコンを押します。API ProviderでAnthropicを選択します(ステップ1で選んだのがそちらならOpenAI Compatible)。
ステップ3:Base URLとキーを設定する
表のBase URLをBase URLフィールドに、APIキーをAPI Keyフィールドに貼り付けます。
Base URL: https://api.ofox.ai/anthropic
API Key: sk-ofox-...
期待される結果:フィールドが保存され、Clineがキー未設定の警告を出さなくなります。
ステップ4:Model IDを設定する
Model IDを、接頭辞を含む名前空間付きのidにします:
anthropic/claude-sonnet-5
裸のclaude-sonnet-5はゲートウェイでは失敗します。モデルカタログがプロバイダーごとに名前空間で区切られているためです。後でモデルを切り替えるには、このフィールドだけを変えます。Base URLとキーはそのままです。anthropic/claude-fable-5とanthropic/claude-opus-4.8が、最もよく使う2つになるでしょう。
ステップ5:接続をテストする
Clineのチャットで「このプロジェクトのファイルを一覧して」のような短いメッセージを送ります。Clineがツリーを読んで返信すれば、ツール利用が機能しており、基本セットアップは完了です。
最初の本番タスク
テストメッセージは配線がつながったことを証明します。本番タスクはエージェントループが動くことを証明します。Clineに小さく自己完結したものを向けましょう。たとえば「parseConfig関数に入力バリデーションを追加し、そのテストも書いて」など。実行中は3つを観察します。関連ファイルを自分で読むはずで、書き込む前に承認できるdiffを提案するはずで、終わったらテストコマンドを実行するはずです。読み書きはするのにコマンドを一度も実行しない場合は、モデルではなくターミナル連携がオフになっています。Clineのコマンド承認を有効にして再試行してください。この最初の一巡は、デフォルトのreasoning予算が適切かどうかも教えてくれます。それは次のセクションで扱います。
Reasoning:コストを左右するeffort設定
Sonnet 5は答える前に別パスで問題を推論し、そのパスはデフォルトでオンです(適応的思考)。あなたが制御するのはトークン数ではなく深さの設定、すなわちAnthropicのeffortパラメータで、low、medium、highを取ります。旧来のbudget_tokensつまみはSonnet 5ではなくなり、送ると400を返します。Clineではモデル設定でreasoningをオンにします。もしお使いのClineビルドがまだ従来のbudget_tokens値を渡すなら、Clineを更新するかeffort制御に切り替えてください。さもないとSonnet 5がその呼び出しを拒否します。
effortはコストのダイヤルであって、無料のアップグレードではありません。reasoningトークンは出力として課金され、Sonnet 5の出力は$10/Mなので、些末なターンすべてでhigh effortを使うのはお金を燃やしているのと同じです。設定はタスクに合わせましょう。
| タスクの種類 | 推奨effort | 理由 |
|---|---|---|
| 編集、定型コード、ファイル操作 | オフまたはlow | 計画がほとんど不要。ターンを安く保つ |
| 標準的な機能開発 | medium | コスト暴走なしに十分な計画 |
| 難しいリファクタリング、厄介なバグ | high | 誤判断が高コストなとき、深さが元を取る |
実践的なパターンは、デフォルトでeffortをlowに保ち、それを必要とするターンだけ上げることです。Clineはセッションごとに変更できるので、プロジェクト全体で1つの設定に縛られることはありません。
具体例:日常的な「この変数をファイル全体でリネームして」というターンでは、high effortはSonnet 5に誰も読まないreasoningの段落を書かせ、それに対して出力レートを払うことになります。「このasyncハンドラーがなぜデッドロックするのか突き止めて」というターンでは、同じhigh effortが、推測ではなくコールグラフをたどらせてくれます。同じモデル、トークンあたり同じ価格でも、タスクにその思考が必要だったかどうかで価値は大きく異なります。Clineがターンごとに表示するトークンカウンターを1日眺めれば、どんな経験則よりも早くダイヤルを調整できます。
逆方向の品質の罠もあります。本当に難しいタスクで思考を完全にオフにしてもお金は節約できず、ただSonnet 5に速く間違った答えを出させ、その後の修正に3ターン費やすだけです。安いが間違いは、省いたeffortよりも高くつきます。
Sonnet 5がFable 5に勝つとき(と勝たないとき)
これがあなたの請求額を動かす判断です。ofoxでは、2つのモデルの価格はこうなっています:
| モデル | 入力 | 出力 | キャッシュ読み取り | Model ID |
|---|---|---|---|---|
| Claude Sonnet 5 | $2/M | $10/M | $0.20/M | anthropic/claude-sonnet-5 |
| Claude Fable 5 | $10/M | $50/M | $1/M | anthropic/claude-fable-5 |
これらのSonnet 5レートは導入価格で、2026年8月31日まで有効です。その後の標準レートは入力$3/M・出力$15/Mで、差は約3.3倍に縮まります。現在のトークンあたり価格はofoxのモデルページと一致します。導入価格と標準価格の区分、および8月31日という締切はAnthropicの価格ドキュメントに基づきます。
導入期間中、Fable 5は入力・出力ともにSonnet 5の5倍のコストです。Clineのワークロード——毎ターンのコンテキスト再送とdiff生成——は、まさにそのレート差が月額合計を決める高トークンパターンです。
現実的なセッションで計算してみましょう。作業セッションが多数のターンにわたっておおよそ入力2M・出力200kトークンを動かすとします。Sonnet 5では入力約$4に出力約$2で$6前後、さらにキャッシュが入力側を押し下げます。Fable 5では同じセッションが入力約$20に出力約$10でキャッシュ前で$30前後です。これを毎日回せば、開発者1人なら誤差の範囲、チームなら実際の費目になります。開発者5人、月20営業日にスケールすると、デフォルトモデルの選択だけで月額請求はSonnet 5のおよそ$600からFable 5のおよそ$3,000へと振れます(Sonnet 5の数字はキャッシュでさらに下がる前の値)。これこそ、どんな気の利いた単一のプロンプトよりデフォルトが重要である理由のすべてです。
だからルールはシンプルです。デフォルトはSonnet 5。Fable 5へのエスカレーションは、Sonnet 5が実際にタスクに失敗したときだけ:頭の中に収まらない大規模なファイル横断リファクタリング、繰り返し読み違える並行性や型のバグ、あるいは誤判断がトークンの割増を上回るコストになるアーキテクチャの決定。日常的なCline作業の80%では、Sonnet 5が5分の1の価格で同等の結果を出します。より詳しい一騎打ちはClaude Fable 5 vs Sonnet 5比較を、Sonnet 5が旧フラッグシップに対してどう位置づくかはSonnet 5 vs Opus 4.8の解説をご覧ください。
Anthropic vs OpenAI互換:完全な違い
ステップ1では、ClaudeにはAnthropicプロバイダーを選べと述べました。ここでその理由を詳しく説明します。枠を間違えると、お金を払った機能が静かに落ちるからです。
| 機能 | Anthropicプロバイダー | OpenAI Compatible |
|---|---|---|
| ネイティブなツール利用(ファイル、ターミナル、編集) | フル | 動くが、変換レイヤー経由 |
| プロンプトキャッシュ制御 | 露出する | 表に出ないことが多い |
| 拡張思考 / effort | ネイティブ | 平坦化または無視される場合あり |
| Model IDの形式 | anthropic/claude-sonnet-5 | anthropic/claude-sonnet-5 |
| Base URLのパス | /anthropic | /v1 |
| 最適な用途 | Claude専用ワークフロー | 1つの枠でClaudeと非Claudeを混在 |
変換レイヤーが核心です。OpenAI Compatible枠はClaudeのプロトコルをOpenAIの形にマッピングし、きれいな対応物がないもの——特にキャッシュのブレークポイントとeffort/reasoning制御——はマッピングで失われることがあります。Claude専用のCline設定では、それがあなたの請求額と難タスクの品質に最も影響する2つの機能を奪います。そのトレードを受け入れる唯一の理由は、再設定なしに1つの同一の枠でClaudeと非Claudeモデルを回す本当の必要性です。それがあなたでないなら、ネイティブ経路を取りましょう。どの機能がマッピングを生き延びるかはClineのバージョンにも依存するので、上記の2つの損失は固定された保証ではなく起こりうるケースとして扱ってください。キャッシュとreasoningが重要なら、Anthropicプロバイダーがこの問いを取り除きます。
知っておく価値のある一点:Model IDは両方の枠で同じ文字列anthropic/claude-sonnet-5です。ゲートウェイがプロトコルに関係なく同じ方法でカタログに名前空間を付けているためです。変わるのはBase URLのパスと、どの機能が生き延びるかだけです。
支出を見張る:キャッシュとトークンの計算
Clineのコストは、実のところモデルの表向きのレートではありません。毎ターンいくつのトークンを再送するか、そしてそれらがキャッシュされているかどうかが問題です。Clineは毎ターンコンテキストを再構築します:システムプロンプト、カスタム指示、ファイルツリー、開いているファイル。長いセッションでは、その同じブロックが何十回も送出されます。
プロンプトキャッシュはこのためにあります。ネイティブなAnthropic経路では、Sonnet 5のキャッシュ読み取りは新規入力の$2/Mに対して$0.20/Mで課金され、ターンごとに変わらない部分のコンテキストで10倍の削減になります。安定したシステムプロンプトと固定されたリポジトリファイルのセットは、セッション中に40回再送されても、キャッシュに当たれば10分の1のコストで済みます。
1日の作業におおよその数字を当ててみましょう:
| シナリオ | モデル | 推定セッションコスト | 備考 |
|---|---|---|---|
| 機能開発、キャッシュあり | Sonnet 5 | 約$4-6 | キャッシュが再送コンテキストの大半を吸収 |
| 同じ作業、キャッシュなし | Sonnet 5 | 約$8-10 | 毎ターンフル入力レート |
| 同じ作業 | Fable 5 | 約$25-30 | 5倍のレートが合計を支配 |
| 難タスク、high effort | Sonnet 5 | +$2-4 | reasoningトークンは出力として課金 |
要点は順序です。まずキャッシュがオンであることを確認する——これはAnthropicプロバイダーを意味します。次にSonnet 5をデフォルトに保つ。それができて初めて、本当に難しいターンのために思考に支払うか、Fable 5に上げる。その順序を間違え、キャッシュをオフにしてFable 5をデフォルトで回すと、Sonnet 5が同じようにこなせた作業に、およそ5〜8倍を払うことになります。
キャッシュが実際に機能しているか確認するには、Clineのターンごとのトークン表示を見てください:セッションの最初のターンの後、キャッシュ入力のカウントが増える一方で新規入力は小さいままのはずです。もし毎ターンがフルの新規入力とゼロキャッシュを示すなら、キャッシュを落とした枠か経路にいます。上のプロバイダー選択に戻りましょう。
セットアップ中のよくあるエラー(と修正)
| 症状 | 原因 | 修正 |
|---|---|---|
model not found | Model IDにanthropic/接頭辞がない | anthropic/claude-sonnet-5を使う |
401 Unauthorized | キーが別ゲートウェイ用、または空欄 | 設定したBase URL用のキーを貼る |
| ツール利用が静かに何もしない | OpenAI互換枠がネイティブツールを落とした | Anthropicプロバイダーに切り替える |
| キャッシュが一度も当たらない | 経路が誤り、またはその枠でキャッシュ非対応 | /anthropicのBase URLとAnthropicプロバイダーを使う |
| SSL / 自己署名証明書エラー | 企業のTLSプロキシがトラフィックを再署名 | 上記リンクのSSLガイドに従いCAを追加 |
| reasoningが効かない | reasoningが無効、またはeffortが低すぎる | reasoningを有効にしeffortレベルを上げる |
Model IDは解決するのに応答が途中で切れているように感じるなら、Clineのmax-tokens設定が、reasoningパスと答えの両方が収まる前に出力を切り詰めていないか確認してください。
Sonnet 5、Fable 5、Opusの切り替え
エスカレーションの判断は、切り替えが安いときにだけ元が取れます。そしてClineでは安いのです。3つのモデルすべてが同じゲートウェイと同じキーの背後にあるので、Sonnet 5からFable 5やOpus 4.8への移動はフィールド1つ:プロバイダー設定でModel IDを変えて作業を続けるだけです。
anthropic/claude-sonnet-5 # デフォルトドライバー
anthropic/claude-fable-5 # 難しいターンにエスカレーション
anthropic/claude-opus-4.8 # 旧フラッグシップ、必要なら
これを安く保つワークフローは、プロジェクトではなくタスクをエスカレーションすることです。Sonnet 5が特定の問題で行き詰まったら、その区間だけFable 5に切り替え、それを解決させ、また戻す。Clineは切り替えをまたいで会話とファイルコンテキストを保つので、Fable 5はリポジトリ全体を読み直さずにSonnet 5が止まったところから引き継ぎます。難しい部分が終わった後もデフォルトをFable 5のままにしておくと、$6のセッションが静かに$30になります。
切り替えをまたいだキャッシュに関する注意:キャッシュはモデルごとなので、切り替え後の最初のターンはFable 5のキャッシュを温めるためにフル入力レートを払い、その後また安くなります。その1回のウォームアップターンは、Sonnet 5が解けなかったバグを解くことに比べれば些細ですが、不安から2ターンおきにモデルを切り替えない理由にはなります。決めて、エスカレーションして、終わらせて、戻る。
もし絶えずエスカレーションしている自分に気づいたら、それはノイズではなくシグナルです。Sonnet 5のデフォルトreasoning予算が低すぎて、もっと思考すればこなせるタスクに失敗しているか、あるいは作業が本当に難しく偏っていてそのプロジェクトではFable 5をデフォルトにすべきかのどちらかです。どちらも、Clineのターンごとの表示でパターンに気づけば直せます。
チーム / 複数開発者の構成
チームにとっての勝ち筋は、全員が自前のキーを配線する代わりに、1つのエンドポイントと1つのモデルポリシーを持つことです。単一のゲートウェイを登録し、シークレットマネージャー経由で各開発者にキーを渡し、Clineのプロバイダー設定を標準化して、全員が同じBase URLでSonnet 5をルーティングするようにします。請求はSonnet 5、Fable 5、Opus 4.8にまたがって1か所に集まり、チーム全体のデフォルトモデルを切り替えるのは、個別再設定の艦隊ではなく共有Model IDへの1行の変更で済みます。
これと組み合わさるコスト管理の習慣が、モデルの階層化です:ターンの大半は安いデフォルトを回し、難しいものだけエスカレーションする。私たちのClaude Codeハイブリッドルーティングパターンの背後にある同じ論理がClineにも当てはまり、エンドポイント切り替えの仕組みはCline API設定ガイドと、より広いCursor・Claude Code・Cline向けカスタムAPIセットアップにあります。
FAQ
ClineにClaude Sonnet 5を追加するには? Cline設定(歯車アイコン)を開き、Anthropicプロバイダーを選び、Base URLをhttps://api.ofox.ai/anthropicにし、キーを貼り付け、Model IDをanthropic/claude-sonnet-5にします。テストメッセージを送ります。
ゲートウェイ経由でSonnet 5を使うとき、ClineのModel IDは何になりますか? 接頭辞を付けたanthropic/claude-sonnet-5です。裸の名前はゲートウェイでは失敗します。それを受け付けるのはAnthropicのダイレクトAPIだけです。
AnthropicプロバイダーとOpenAI Compatibleのどちらを使うべきですか? Claudeモデルには Anthropicで、ネイティブなツール利用、キャッシュ、思考を保てます。OpenAI Compatibleは、1つの枠で混在モデルを提供しなければならない場合だけです。
Sonnet 5の拡張思考をオンにするには? Clineでreasoningを有効化します。深さはトークン予算ではなくAnthropicのeffortパラメータ(low/medium/high)で設定されます。適応的思考はデフォルトでオンで、旧来のbudget_tokens値は400を返します。コーディング時はeffortをlowに保ちましょう。reasoningトークンは出力として課金されます。
Sonnet 5はFable 5より安いですか? はい、入力・出力ともに5倍です(ofoxで$2/$10 対 $10/$50)。Clineの高トークンループでは、その差が請求額を決めます。
Fable 5が5倍に見合うのはいつですか? Sonnet 5がタスクに完全に失敗したとき:大規模リファクタリング、微妙なバグ、重大なアーキテクチャ。日常作業なら、Sonnet 5が5分の1のコストで同等です。
401やmodel-not-foundが出るのはなぜですか? anthropic/接頭辞の欠落、プロバイダーに対して誤ったBase URLパス、または別ゲートウェイ用のキー、のいずれかです。接頭辞を修正し、Base URLをプロバイダーに合わせてください。
ClineでSonnet 5のプロンプトキャッシュは機能しますか? Anthropic経路なら機能し、キャッシュ読み取りは入力$2/Mに対して$0.20/Mです。OpenAI互換経路ではキャッシュ制御が表に出ない場合があります。
この更新のために確認した情報源
- Cline VS Code API設定ガイド、2026-07-03確認。Anthropic vs OpenAI互換のプロバイダー枠と設定フローの情報源。
- Anthropic拡張思考ドキュメント、2026-07-03確認。適応的思考と
effortパラメータ、およびSonnet 5で手動budget_tokensが400を返すことの情報源。 - ofoxモデルカタログのスナップショット、2026-07-03確認。
anthropic/claude-sonnet-5とanthropic/claude-fable-5のModel ID、および現在の$2/$10 対 $10/$50のトークンあたり価格($0.20/M 対 $1/Mのキャッシュ読み取りレートを含む)の情報源。 - Anthropic価格ドキュメント、2026-07-03確認。Sonnet 5の導入価格と標準価格の階層——2026年8月31日まで$2/$10、その後$3/$15——の情報源。


