🎙️

Meet 商談 AI コーチ

Google Meet の商談をリアルタイムで文字起こしし、AI コーチングを提供する Chrome 拡張

Phase 1: リアルタイム文字起こし(PoC)

機能

🎙️

リアルタイム文字起こし

Google Cloud STT V2 で商談音声をリアルタイムに文字起こし

👥

話者分離

マイク(自分)とタブ音声(顧客)を物理的に分離して表示

♾️

Endless Streaming

STT の 5 分制限を自動ローテーションで回避し、長時間商談に対応

🔒

セキュア接続

API キー認証付き WebSocket で安全にデータを送受信

セットアップ手順

1

バックエンドを起動

Cloud Run にデプロイ済み、またはローカルで起動します。

cd 81-meet-coach/backend && npm run build && node dist/index.js
2

Chrome 拡張をインストール

Chrome の拡張機能管理画面から「パッケージ化されていない拡張機能を読み込む」で chrome-extension フォルダを指定します。

chrome://extensions → デベロッパーモード ON → 81-meet-coach/chrome-extension を読み込み
3

接続設定

拡張アイコンをクリックしてポップアップを開き、サーバー URL と API キーを設定します。

サーバーURL: ws://localhost:8080  APIキー: dev-key
4

Google Meet で使用

Google Meet のタブを開いた状態で「コーチング開始」をクリックすると、サイドパネルにリアルタイム文字起こしが表示されます。

アーキテクチャ

Chrome 拡張 (Manifest V3)
├─ Popup: 接続設定 (サーバーURL, APIキー)
├─ Service Worker: タブキャプチャ制御, メッセージハブ
├─ Offscreen Document: 音声キャプチャ + WebSocket送信
│   ├─ getUserMedia → マイク音声 (自分)
│   ├─ tabCapture → Meet タブ音声 (顧客)
│   └─ AudioWorklet → PCM16 100ms チャンク → Base64 → WS
└─ Side Panel: リアルタイム文字起こし表示

Cloud Run バックエンド (Node.js + TypeScript)
├─ Express + ws (WebSocket)
├─ Endless Streaming (4分ごと自動ローテーション)
└─ Google Cloud STT V2 (日本語, long モデル)
Chrome Extension (Manifest V3) + Cloud Run + Speech-to-Text V2