🎙️
Meet 商談 AI コーチ
Google Meet の商談をリアルタイムで文字起こしし、AI コーチングを提供する Chrome 拡張
Phase 1: リアルタイム文字起こし(PoC)
機能
🎙️
リアルタイム文字起こし
Google Cloud STT V2 で商談音声をリアルタイムに文字起こし
👥
話者分離
マイク(自分)とタブ音声(顧客)を物理的に分離して表示
♾️
Endless Streaming
STT の 5 分制限を自動ローテーションで回避し、長時間商談に対応
🔒
セキュア接続
API キー認証付き WebSocket で安全にデータを送受信
セットアップ手順
1
バックエンドを起動
Cloud Run にデプロイ済み、またはローカルで起動します。
cd 81-meet-coach/backend && npm run build && node dist/index.js
2
Chrome 拡張をインストール
Chrome の拡張機能管理画面から「パッケージ化されていない拡張機能を読み込む」で chrome-extension フォルダを指定します。
chrome://extensions → デベロッパーモード ON → 81-meet-coach/chrome-extension を読み込み
3
接続設定
拡張アイコンをクリックしてポップアップを開き、サーバー URL と API キーを設定します。
サーバーURL: ws://localhost:8080 APIキー: dev-key
4
Google Meet で使用
Google Meet のタブを開いた状態で「コーチング開始」をクリックすると、サイドパネルにリアルタイム文字起こしが表示されます。
アーキテクチャ
Chrome 拡張 (Manifest V3) ├─ Popup: 接続設定 (サーバーURL, APIキー) ├─ Service Worker: タブキャプチャ制御, メッセージハブ ├─ Offscreen Document: 音声キャプチャ + WebSocket送信 │ ├─ getUserMedia → マイク音声 (自分) │ ├─ tabCapture → Meet タブ音声 (顧客) │ └─ AudioWorklet → PCM16 100ms チャンク → Base64 → WS └─ Side Panel: リアルタイム文字起こし表示 Cloud Run バックエンド (Node.js + TypeScript) ├─ Express + ws (WebSocket) ├─ Endless Streaming (4分ごと自動ローテーション) └─ Google Cloud STT V2 (日本語, long モデル)
Chrome Extension (Manifest V3) + Cloud Run + Speech-to-Text V2