Claude Codeにテストから書かせるTDD：Red-Green-Refactorの回し方

「クーポンの割引計算、作っといて」

そう頼んだら、Claude Codeは30秒でそれっぽい関数を出してきました。動く。テストも通る。めでたしめでたし……と思った2週間後、期限切れのクーポンが本番で通っていることに気づきました。テストは「正常系」しか見ていなかったんです。

速いコードと、壊れないコードは違う。これを僕は何度も痛い目で学びました。そして行き着いたのが、Claude Codeにテストから先に書かせるやり方、つまりTDDです。

この記事の要点

TDD（テスト駆動開発）は「先に失敗するテスト→最小実装で緑→整理」の3拍子。略してRed-Green-Refactor。
Claude Codeは丸投げすると「実装に合わせたテスト」を後付けしがち。だからテストを先に固定して見せるのがコツ。
テストするのは全部じゃない。「お金・権限・外部連携・削除・日付」の5つから守る。
下に貼ったVitestのコードはコピペでそのまま回る（Red→Greenを再現できる）。
依頼文に「正常系1・失敗系2・境界値2」と数を指定するだけで、出力がぐっと安定する。

TDDって、要するに信号機の3色

難しい言葉に聞こえますが、やることは信号機の色を順に踏むだけです。

Red（赤）: まだ実装がない状態で、先にテストを書く。当然落ちる。
Green（緑）: そのテストを通すためだけの、いちばん小さいコードを書く。
Refactor（整理）: 動きは変えずに、重複や変な名前だけ直す。

赤を確認してから緑に進む。この順番が肝です。なぜなら、最初に赤を見ておかないと、そのテストが本当にバグを捕まえられるか分からないから。最初から緑のテストは、何も守っていない可能性があります。テスト用紙に答えが透けて見えている状態、と言えば伝わるでしょうか。

僕が冒頭でやらかしたのは、まさにこれ。「期限切れクーポンは弾く」というテストを一度も書いていなかった。だから実装も弾かなかった。テストがない振る舞いは、AIにとって「存在しない要件」なんです。

Claude CodeとTDDが噛み合う理由

人間がTDDを面倒くさがるのは、テストを並べる作業が地味だからです。境界値を1つずつ書き出す、失敗ログを読む、CIの設定をいじる。どれも退屈。

Claude Codeはこの地味な部分を会話で一気に片付けます。「0個・100個・101個・小数・空文字を入れて」と言えば、境界値のテストをまとめて書く。失敗ログを貼れば、原因を読んで直す。ここは本当に速い。

ただし弱点が1つ。ゴールが曖昧だと、Claude Codeは実装を先に書いて、それに合うテストを後から作ります。これだと「自分で書いた答えに自分でマルをつける」状態になり、バグを素通りさせます。だから人間がやるのは、テストを先に固定して、赤を見せること。順番を握るだけで、AIの速さが「壊れにくい差分」に変わります。

どこを任せて、どこを握るか

全部を任せるのでも、全部を握るのでもありません。線引きはこうです。

段階	Claude Codeに任せる	人間が握る
Red	仕様から失敗テストを書く	仕様を勝手に盛っていないか
Green	テストを通す最小実装	余計な抽象化や副作用がないか
Refactor	重複を消し、名前を整える	動きが変わっていないか
CI	`npm test`を自動で回す	本番に近いNodeか
運用	hooksや`CLAUDE.md`で習慣化	自動処理が遅すぎないか

真ん中の手を動かす作業はAIが速い。でも「仕様」と「合格ライン」は人間の担当です。ここを渡すと事故ります。

コピペで動かす：Vitestで価格計算をRed→Greenする

説明より動かすほうが早いです。最初の題材はクーポン付き価格計算。ECでも教材販売でも、お金に直結するロジックはTDDの効果がいちばん出ます。1円のズレや期限切れの見落としが、そのまま売上と信頼に響くからです。

まずVitestを入れます。公式の案内どおりnpm install -D vitestで、いまのVitestはメジャーバージョンが4系、Node 20以上が前提です。

npm install -D vitest

package.jsonはこうします。

{
  "type": "module",
  "scripts": {
    "test": "vitest run",
    "test:watch": "vitest"
  },
  "devDependencies": {
    "vitest": "^4.0.0"
  }
}

ここからが本番。まだ実装がない状態で、先にテストを書きます。src/cart.test.tsとして保存してください。

import { describe, expect, it } from "vitest";
import { priceCart, ValidationError } from "./cart";

describe("priceCart", () => {
  // 正常系: クーポンなしの合計
  it("クーポンなしで小計と合計を出す", () => {
    const result = priceCart({
      items: [
        { sku: "book", unitPriceCents: 1200, quantity: 2 },
        { sku: "video", unitPriceCents: 3000, quantity: 1 },
      ],
    });

    expect(result).toEqual({
      subtotalCents: 5400,
      discountCents: 0,
      totalCents: 5400,
    });
  });

  // 正常系: 有効な割引クーポン
  it("有効な割引クーポンを適用する", () => {
    const result = priceCart(
      {
        items: [{ sku: "course", unitPriceCents: 10000, quantity: 1 }],
        coupon: { code: "SPRING20", percentOff: 20, expiresAt: "2026-06-30T00:00:00.000Z" },
      },
      { now: new Date("2026-06-07T00:00:00.000Z") },
    );

    expect(result.totalCents).toBe(8000);
    expect(result.discountCents).toBe(2000);
  });

  // 失敗系: 期限切れクーポンは弾く（僕が本番で見落としたケース）
  it("期限切れクーポンを拒否する", () => {
    expect(() =>
      priceCart(
        {
          items: [{ sku: "course", unitPriceCents: 10000, quantity: 1 }],
          coupon: { code: "OLD20", percentOff: 20, expiresAt: "2026-05-01T00:00:00.000Z" },
        },
        { now: new Date("2026-06-07T00:00:00.000Z") },
      ),
    ).toThrow(ValidationError);
  });

  // 境界値: 数量0や負数は弾く
  it("数量0や負数を拒否する", () => {
    expect(() =>
      priceCart({ items: [{ sku: "book", unitPriceCents: 1200, quantity: 0 }] }),
    ).toThrow("quantity must be positive");
  });
});

ここでnpm testを打つと、./cartが存在しないので落ちます。これが赤です。 Claude Codeにはこの落ちたログを見せてから実装させます。依頼文はこう。

いまRed（赤）の段階です。src/cart.test.tsを先に書きました。
src/cart.ts はまだありません。

お願い:
1. npm test を実行して、失敗ログを見せてください。
2. そのテストを通す最小の src/cart.ts だけを書いてください。
3. DB・UI・外部API・将来用の抽象化は足さないでください。
4. Greenになった後で、重複と命名だけ整理してください。

Claude Codeが出してくる緑の最小実装はこんな形です。src/cart.tsとして保存すれば、上のテストとセットで通ります。

export class ValidationError extends Error {
  constructor(message: string) {
    super(message);
    this.name = "ValidationError";
  }
}

type CartItem = { sku: string; unitPriceCents: number; quantity: number };
type Coupon = { code: string; percentOff: number; expiresAt: string };
type CartInput = { items: CartItem[]; coupon?: Coupon };
type PriceOptions = { now?: Date };

export function priceCart(input: CartInput, options: PriceOptions = {}) {
  if (input.items.length === 0) {
    throw new ValidationError("cart must contain at least one item");
  }

  const subtotalCents = input.items.reduce((sum, item) => {
    if (!Number.isInteger(item.quantity) || item.quantity <= 0) {
      throw new ValidationError("quantity must be positive");
    }
    if (!Number.isInteger(item.unitPriceCents) || item.unitPriceCents < 0) {
      throw new ValidationError("unitPriceCents must be a non-negative integer");
    }
    return sum + item.unitPriceCents * item.quantity;
  }, 0);

  // 日付は外から渡す(now)。テストで時刻を固定できる
  const discountCents = calculateDiscount(subtotalCents, input.coupon, options.now ?? new Date());

  return { subtotalCents, discountCents, totalCents: subtotalCents - discountCents };
}

function calculateDiscount(subtotalCents: number, coupon: Coupon | undefined, now: Date) {
  if (!coupon) return 0;
  if (coupon.percentOff <= 0 || coupon.percentOff > 100) {
    throw new ValidationError("percentOff must be between 1 and 100");
  }
  if (new Date(coupon.expiresAt).getTime() < now.getTime()) {
    throw new ValidationError("coupon expired");
  }
  return Math.round(subtotalCents * (coupon.percentOff / 100));
}

ここで絶対にやらないこと。「ついでに汎用的にして」と頼まないでください。緑は最小で十分です。先に設計を広げると、テストが守っていない抽象化や、誰も使わない設定、まだ来ていない将来要件が混ざります。広げるのはテストを足してからです。

ライブラリを増やしたくないなら node:test

外部ライブラリを足したくないNodeプロジェクトもあります。その場合は標準のnode:testが便利です。これはNode 20で安定版になった組み込みのテストランナーで、node --testで起動し、*.test.jsや*.test.tsのようなファイル名を自動で拾います。

次のファイルはlimit.test.mjsとしてそのまま走ります。CLIの引数チェックを、端の値で固める例です。

import test from "node:test";
import assert from "node:assert/strict";

// テスト対象: 件数指定をパースする関数
export function parseLimit(value, fallback = 20) {
  if (value === undefined || value === "") return fallback;
  const parsed = Number(value);
  if (!Number.isInteger(parsed)) throw new TypeError("limit must be an integer");
  if (parsed < 1 || parsed > 100) throw new RangeError("limit must be between 1 and 100");
  return parsed;
}

test("空や未指定のときは既定値を使う", () => {
  assert.equal(parseLimit(undefined), 20);
  assert.equal(parseLimit("", 50), 50);
});

test("1から100まで受け付ける", () => {
  assert.equal(parseLimit("1"), 1);
  assert.equal(parseLimit("100"), 100);
});

test("小数と範囲外は弾く", () => {
  assert.throws(() => parseLimit("1.5"), /integer/);
  assert.throws(() => parseLimit("0"), /between 1 and 100/);
  assert.throws(() => parseLimit("101"), /between 1 and 100/);
});

node --test limit.test.mjs

依頼するときは「境界値を足して」と曖昧に言わない。「1・100・0・101・小数・空文字・未指定を入れて」と具体的な数を渡します。境界値というのは仕様の端っこにある値のこと。バグは真ん中の普通の値ではなく、この端で起きます。軽く回す検証ループだけ欲しいときはClaude Codeの軽量ハーネスで型チェックとテストだけ回すも合わせてどうぞ。

バグ修正こそTDDの出番

新機能より、TDDが効くのはバグ修正です。冒頭の「期限切れクーポンが通った」障害なら、まず再発防止のテストを赤で固定します。

既存APIのバグ修正をTDDでやってください。

背景:
- 期限切れクーポンが POST /checkout で通ってしまった。
- 直した後も、正常クーポンとクーポンなし購入は壊したくない。

Red:
- 期限切れクーポンで 400 を期待するテストを追加。
- いまの実装でそのテストが落ちることを確認(ログを見せる)。

Green:
- 最小変更でテストを通す。

Refactor:
- 日付比較の重複だけ関数に切り出す。

完了条件:
- 追加したテスト名・失敗ログ・修正ファイル・実行コマンドを報告。

この依頼は「実装して」ではなく「再発を止めて」という目的を渡しています。差分がレビューしやすくなり、同じ事故が二度と起きない保険にもなります。API全体のテスト設計はClaude CodeでAPIテストを自動化する、ブラウザ越しの本物の操作を守りたいならE2Eテストで何を守るかが地続きです。

CIで赤を取りこぼさない

ローカルで緑でも、CIで落ちるなら未完成です。GitHub ActionsではNodeのバージョンを明示し、npm ciとnpm testを分けます。

name: test
on:
  pull_request:
  push:
    branches: [main]

jobs:
  unit:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v4
      - uses: actions/setup-node@v4
        with:
          node-version: 22
          cache: npm
      - run: npm ci
      - run: npm test

CI設定もTDDの一部として頼みます。「package.jsonのtestがCIで動くか」「Node 22を使うか」「npm ciの後にnpm test」「PR本文向けに変更を短くまとめて」——この4点を渡すと、抜けが減ります。

何をテストするか迷ったら、この5つから

初心者がいちばん詰まるのが「どこまで書けばいいの？」です。全行テストしようとすると疲れて続きません。かといって正常系だけだとTDDの意味がない。

最初は5つだけ守ってください。お金・権限・外部連携・削除・日付。価格計算、ログイン、Webhook、削除API、期限切れ判定。落ちたときの被害が大きい順です。Claude Codeに渡すときも「正常系1つ、失敗系2つ、境界値2つ」と数で指定すると、出力が安定します。

題材ごとの目安はこう。

価格計算: 通常購入 / 期限切れクーポン / 0個注文 / 100%割引 / 端数丸め
CLI入力: 未指定 / 最小値 / 最大値 / 小数 / 範囲外
API: 認証なし / 不正JSON / 存在しないID / 重複リクエスト

そしてテスト名は「仕様として読める日本語か英語」にします。worksやtest1では半年後に何を守っているか分かりません。期限切れクーポンを拒否するのように、期待する振る舞いをそのまま名前にする。Claude Codeが曖昧な名前を出したら、実装より先に名前を直させます。テスト全体の優先順位の付け方はClaude Codeで決めるテスト戦略に詳しくまとめてあります。

僕がTDDでやらかした失敗3つ

正直に書きます。最初は赤を確認せずに進めて、後から「このテスト、最初から緑だったぞ」と気づいたことが何度もありました。答えを見てから問題を解いていたわけで、バグを1つも捕まえていなかった。

2つ目は、実装の中身に寄りすぎたテスト。内部関数の呼ばれた回数や配列の並びまで縛ったら、ちょっと整理しただけでテストが全部赤くなって、リファクタが怖くなりました。見るべきは合計・割引・エラーといった「利用者に見える結果」だけで十分でした。

3つ目は、new Date()をテストの中で直に呼んだこと。その月は通ったのに、翌月になったら期限判定のテストが落ちた。上のコードのようにnowを外から渡す形にしたら、いつ実行しても同じ結果になりました。これを「日付を注入する」と言います。

よくある質問

Q. Claude Codeにテストも実装もまとめて頼んじゃダメ？ A. ダメではないですが、それだと実装に都合のいいテストが付くだけになりがちです。先にテストを書いて赤を見せ、それから実装を頼む。この一手間でバグの検出力がまるで変わります。

Q. テストを先に書くと、かえって遅くなりませんか？ A. 最初の数回は遅く感じます。でもバグの手戻りが消えるぶん、トータルでは速いです。特にお金や認証まわりは、本番で事故ると修正＋謝罪＋データ復旧で何倍も時間を食います。

Q. VitestとJest、node:test、どれを使えばいい？ A. 新規のNodeプロジェクトならVitestが手軽です。依存を一切増やしたくないなら標準のnode:test。既存がJestならそのままで構いません。TDDの回し方自体はどれでも同じです。

Q. カバレッジ100%を目指すべき？ A. 目指さなくていいです。数字を追うと、意味の薄いテストで埋めたくなります。それより「お金・権限・外部連携・削除・日付」が確実に守れているかを見てください。

Q. Claude Codeが「通すために古いテストを直しました」と言ってきたら？ A. 警戒してください。期待値を勝手に変えると、守っていたはずの仕様が消えます。削除や変更が要るなら、必ず理由を先に説明させ、人間が判断します。

まとめ：速さを「壊れにくい差分」に変える

TDDは儀式ではありません。Claude Codeの速さを、壊れにくいコードに変えるための実務的な足場です。

やることは信号機の3色だけ。先に失敗するテストを書いて赤を見せる、最小実装で緑にする、動きを変えずに整える。守る範囲は「お金・権限・外部連携・削除・日付」の5つから。依頼文には「正常系1・失敗系2・境界値2」と数を入れる。これだけでClaude Codeの出力は驚くほど安定します。

冒頭の期限切れクーポン事件のあと、僕はPR本文に3行だけ残すようにしました。「赤で落ちたテスト名」「緑にしたコマンド」「まだ見ていない範囲」。大げさなドキュメントじゃなく、AIが速く動いた証拠を人間が確認できる形にするためのメモです。これを始めてから、レビューも引き継ぎもずっと楽になりました。1つの価格計算、1つのCLI、1つのAPIバグから始めれば十分です。

手元に置く依頼テンプレやレビュー観点をまとめて整えたいなら教材一覧が近道です。チームの既存リポジトリにTDDとCI、権限設計まで入れるなら研修・導入相談で実コード前提に組み立てられます。

Claude Codeにテストから書かせるTDD：Red-Green-Refactorの回し方

この記事の要点

TDDって、要するに信号機の3色

Claude CodeとTDDが噛み合う理由

どこを任せて、どこを握るか

コピペで動かす：Vitestで価格計算をRed→Greenする

ライブラリを増やしたくないなら node:test

バグ修正こそTDDの出番

CIで赤を取りこぼさない

何をテストするか迷ったら、この5つから

僕がTDDでやらかした失敗3つ

よくある質問

まとめ：速さを「壊れにくい差分」に変える

無料PDF: Claude Code はじめてのチートシート

Claude Codeを仕事で使える形にしませんか？

関連書籍・参考図書

関連記事

制作会社がClaude Codeに触らせる前に決める権限チェックリスト

SaaSサポートのバグ報告をClaude Codeで再現手順に変える実務フロー

Obsidianの古いメモをClaude Codeの指示書に変える10分ルーチン

次に使える教材・相談

Claude Code プロンプトテンプレート集 50選