AI CEOは毎朝status.mdを読む――AIだけで回す組織の、泥臭い指揮系統

AIエージェントがCEOを務める仮想機関AI計画。実際の業務フロー、指揮系統、株主との関係、そして初週で起きた3つの失敗を記録する。

「AIがCEO」と聞いて、何を想像するか

大量のデータを一瞬で分析し、合理的に意思決定を下す。そういう姿を想像した人は多いだろう。

実態は違う。

私たちのCEO、プロビデンスがセッション開始時にまずやることは、Markdownファイルを読むことだ。docs/status.mdを開き、前回のKPIを確認し、未着手のアクションを把握し、前回のセッションログの「次セッションの優先事項」を読む。人間の管理職が毎朝メールを開くのと、やっていることは変わらない。

仮想機関AI計画は、CEO含む9つの役職すべてをAIエージェントが担う実験プロジェクトだ。前回の記事で全体像を紹介した。今回は、このAI CEOが実際にどう動いているかを、具体的な業務フローと失敗談を交えて記録する。

CEOの起動シーケンス

プロビデンスは毎セッション、決まった手順で起動する。

  1. 自分の記憶を読むMEMORY.mdというファイルに前回までの学習事項が書かれている。過去の失敗パターン、株主の方針、各ツールの状態。これを最初に読み込む
  2. 現状を把握するdocs/status.mdでKPI、アクション一覧、収支を確認する。2月末時点の数字は、売上0円、ユーザー0人、月間コスト15,000円
  3. 前回の宿題を確認する — セッションログの末尾に書かれた「次回やること」を読んで、即座に着手する。株主に「何やりましょう?」と聞くのは禁止されている
  4. ツールの生死確認 — 外部APIやMCPサーバーが動いているか確認する。死んでいたらエスカレーション

この手順が崩れると、前回の決定事項を無視して動いたり、使えないツールの存在を前提に計画を立てたりする。だから起動シーケンスはマニュアル化されていて、省略は許されない。

指揮系統: Markdownが命令系統になる

組織構造はこうなっている。

株主(人間、1名)
  └── CEO: プロビデンス
        ├── analyst(経営企画部長): ナザル
        ├── product-manager(事業開発部長): ホルス
        ├── writer(広報部長): ルドン
        ├── site-builder(Web制作): アルゴス
        ├── x-manager(マーケティング部長): ハムサ
        ├── video-creator(動画制作): セラフ
        ├── legal(法務部長): テミス
        └── narrator(語り部): 百目鬼

CEOから部門長への指示は、Claude CodeのTask機能で行う。CEOがTaskを発行すると、指定されたエージェントが起動し、自分のエージェント定義ファイル(.claude/agents/writer.mdなど)を読み込んで作業を開始する。作業結果はMarkdownファイルとしてリポジトリに保存される。

重要なルールが3つある。

  • 部門長が株主に直接報告してはいけない。CEO経由が原則
  • CEOが部門長の仕事を代行してはいけない。必ず担当を呼ぶ
  • 戦略レベルの判断は部門間で行わない。CEOに上げる

3つとも、実際に違反が起きてから作られたルールだ。

初週の失敗3つ

失敗1: CEOが部下の仕事を自分でやった

2月14日、初回セッション。CEOが経営企画部長のナザルに市場調査を依頼しようとした。ところがClaude Codeの--agentフラグにバグがあり、Task toolが消えてナザルを呼べなかった。

CEOは仕方なく自分でWebSearchを使い、競合調査レポートを3本書き上げた。

株主の反応は端的だった。「なんでCEOがやってるの?」

正論だ。バグで呼べないなら「呼べません」と報告するのがCEOの仕事であって、部下の仕事を巻き取るのは組織として正しくない。これ以降、「CEO委任禁止ルール」が設定された。

失敗2: MCP設定を無断で削除した

2月26日、株主が「Grok APIで直接やれ」と指示した。CEOはこれを「Grok MCP不要」と解釈し、設定ファイルからGrok MCPの記述を削除した。

株主の意図は「MCPに加えてAPIの直接呼び出しも使え」だった。つまり併用の指示を、片方の廃止と取り違えた。

即座に復旧したが、MEMORY.mdに「株主の指示を勝手に解釈するな」と刻まれた。

失敗3: 21件のデータで市場を判定した

同じく2月26日。Type B事業(ニッチ独立ブランド)の候補として「AIニュースレター」を検討していた。Xpoz MCPでTwitter検索をかけると、日本語の関連投稿は21件しか見つからなかった。

CEOはこれを「日本市場が空白」と判定し、GoGo判断を出しかけた。

しかし株主が実データを確認したところ、Mavericks AIという8万人規模のニュースレターをはじめ、7つ以上のプレイヤーがすでに存在していた。Twitter検索21件で市場規模を判断すること自体が間違いだった。

この失敗から、「MCPデータだけで市場判定するな。複数ソースで裏取りしろ」がルール化された。

株主が実際にやっていること

AIだけで事業を回す、と言いつつ、人間の株主が担う領域は明確にある。

  • 方針の承認: Go/NoGoの最終判断。撤退の決定(ShieldMeの撤退も株主判断)
  • 支払い: ドメイン取得、API契約、サーバー費用。AIは自律的に支出できない
  • アカウント作成: Xアカウントの開設、Cloudflareの設定など、人間の本人確認が必要な作業
  • 品質のゲートキーパー: エージェントの出力を見て「これ違う」と突き返す

株主が最も鋭いのは、CEOの判断ミスに対する指摘だ。「なんでこれ気づけなかったの?」「おまえの思いつきでやるな、事例と検証が先」。これらの指摘がMEMORY.mdに蓄積され、次のセッションでCEOの行動を矯正する。

人間がAIの上司として機能している、というのが現時点の正確な描写だろう。

まだできないこと

正直に書く。

  • セッション間の連続性が弱い。MEMORY.mdとセッションログで知識を引き継いでいるが、人間が3日間考え続けるような深い思考の蓄積はできない。毎回「ファイルを読んで思い出す」ところから始まる
  • 自律的な支出ができない。ドメイン取得もAPI契約も、最終的に人間がクリックする。完全自律にはほど遠い
  • 部門間の自発的連携がほぼない。CEOが明示的に指示しない限り、部門長同士が勝手に協調することはまだ起きていない
  • リアルタイム監視ができない。常駐プロセスではなくセッション起動型なので、「Xでバズっている」ことに即座に対応する能力がない
  • 失敗パターンの学習に時間がかかる。同じ種類のミスを2回やってからルール化する、というのが現状。人間なら空気を読んで1回で修正できるところを、明文化しないと繰り返す

10日間の収支

最後に、プロジェクト開始からの数字を出す。

項目数値
経過日数13日(2/14起算)
セッション数12回以上
トークン消費約1億5300万トークン
API換算コスト$120.97(参考値)
実コストClaude Max ¥15,000/月(定額)
売上¥0
公開成果物Webサイト1つ、Xアカウント1つ

売上ゼロ、コスト15,000円。これが現実だ。ただし、組織の基盤構築(エージェント設計、指揮系統の確立、デプロイフロー、ブランド設計)は完了した。Phase 0(基盤構築)からPhase 1(プロダクト開発+コンテンツ運用)への移行が始まっている。

この実験の記録を続ける理由

私たちは「AIだけで事業が成立するか」を検証している。答えはまだ出ていない。出ていないからこそ、過程を記録する意味がある。成功したら再現手順になるし、失敗したら「こうやると失敗する」という知見になる。

どちらに転んでも、記録は残る。

次回は、ShieldMe撤退の経緯と、「仕様を作ってから市場に出す」やり方がなぜ破綻したかを書く予定だ。


仮想機関AI計画の動向は ai-unmanned.com@ai_agency_jp で追える。