🚀

H-Carrier × coneFFT Live audio  ー 公開ノート ー

に公開

H-Carrier × coneFFT Live audio — 技術ノート

バージョン: v0.4
日付: 2026-03-10
リポジトリ参照: morcb13-bit/Paper / coneFFT-Verification v0.2.1
引継書: v37(40³格子スキルミオン場数値観察セッション)


目次

  1. 概要と設計思想
  2. coneFFT とは何か
  3. 40×40×40 フィボナッチ空間の特徴
  4. 通常 FFT との相違点
  5. H-Carrier 仕様
  6. 統合アーキテクチャ
  7. 楽器分解アルゴリズム
  8. ツールの使い方
  9. 確定数値結果
  10. 既存ツールとの比較・位置づけ
  11. 応用例
  12. 誠実な限界と課題
  13. 次ステップロードマップ

1. 概要と設計思想

本ツールは、2つの独立した概念——H-Carrier(有用残差再注入メカニズム)と coneFFT(フィボナッチ残渣による位相的巻き付き検出)——を統合した、音声信号のキラル分波・楽器分解・可逆合成装置である。

核心命題

H-Carrier が「残差は構造情報のキャリアになり得る」と主張するとき、
coneFFT は「その残差の中にある位相的渦構造を識別する目」として機能する。

この統合により、従来のFFTが捨てていた残差の中のキラル成分(右巻き・左巻き)を識別・分離し、可逆的に再合成することが可能になる。


2. coneFFT とは何か

2.1 定義

coneFFT は、信号 x[i] に対して以下の不変量 \Phi_d を計算する:

\Phi_d = \frac{1}{N} \left| \sum_{i=0}^{N-\delta} x[i] \cdot x[i+\delta] \cdot e^{i\lambda_c \cdot (i/N)} \right|

ここで:

パラメータ 意味 典型値
\delta = \lfloor N \cdot R \rfloor 相関窓幅(半径) R = 0.35
\lambda_c コーン波長(位相角速度) 0.5\pi
N サンプル数 4096

2.2 キラル符号 Q

複素積分の虚部符号が巻き付き方向を示す:

Q = \mathrm{sign}\left(\mathrm{Im}\left[\sum x[i] \cdot x[i+\delta] \cdot e^{i\lambda_c (i/N)}\right]\right)
  • Q = +1:右巻き(Right-chiral)
  • Q = -1:左巻き(Left-chiral)
  • Q = 0:無構造(一様場・ノイズ)

2.3 R₆ 演算子

本来の coneFFT は3次元対角方向の6方向相関演算子 R_6 として定義される:

R_6(x)[p] = \sum_{k=1}^{6} x[p] \cdot x[p + \mathbf{e}_k \cdot \delta]

ここで \mathbf{e}_k はフィボナッチ格子上の6方向単位ベクトル。現プロトタイプは1Dライン相関で近似している。


3. 40×40×40 フィボナッチ空間の特徴

3.1 格子の構造

40^3 = 64{,}000 点のブロッホ型スキルミオン場を数値実装した際、格子の配置にフィボナッチ数列の非公約性を利用している。

フィボナッチ数列の非公約性とは:連続するフィボナッチ数 F_n, F_{n+1} は常に互いに素(\gcd(F_n, F_{n+1}) = 1)であるという性質。これにより:

  • 格子点が有理数格子と非共鳴な位置に配置される
  • 周期的なエイリアシングが構造的に回避される
  • 位相的巻き付き構造が格子アーティファクトに汚染されにくい

3.2 黄金比との関係

格子間隔は黄金比 \varphi = (1+\sqrt{5})/2 \approx 1.618 の逆数:

\phi^{-1} = \varphi^{-1} \approx 0.618

この値はH-Carrierの安定条件にも登場する:

|\alpha| \leq (1 - \phi^{-1}) \cdot \beta = 0.382 \cdot \beta

直観:黄金比分割は「最も無理数的」な分割であり、あらゆる周期構造から最も遠い。これがフィボナッチ格子の位相保存能力の根拠となる。

3.3 スキルミオン場での数値観察結果

40³格子上のBloch型スキルミオン場(R=0.35, \lambda=0.5\pi)で得られた確定値:

指標
\Phi_d(スキルミオン場・全層平均) 1.1308
\Phi_d(一様場) \approx 0\sim 10^{-12}
\Phi_d 比(SKY/UNI) \approx 10^9
Q(z) 平均/層 \approx -0.90
Q 合計(40層) \approx -36
FFT peak(k=1–5, sky) 4.562
iso_points(S_z \approx -0.5 1,120点

10^9 倍の意味:これは振幅差ではなく「ゼロ(対称性による消滅)↔ 非ゼロ(位相残存)」という構造的な差である。一様場では R_6 の対称性により \Phi_d が代数的にゼロになる。

3.4 拡張実験結果

条件 \Phi_d Q 平均/層 備考
R = 0.15 0.1062 -0.865 半径縮小
R = 0.25 0.1370 -0.881
R = 0.45 0.1616 -0.814 半径拡大
2-skyrmion 0.1447 -0.688 2個重ね合わせ
反skyrmion 0.1535 +0.855 \phi 反転・Q 符号反転確認

反skyrmion実験で Q の符号が反転したことは、coneFFT が巻き付き方向を正しく識別していることの直接的な証拠である。


4. 通常 FFT との相違点

4.1 根本的な差異

特性 通常 FFT coneFFT
解析対象 周波数成分(振幅・位相) 位相的巻き付き構造
基底関数 複素指数 e^{2\pi i k n/N} フィボナッチ非公約コーン
出力 スペクトル X[k] 不変量 \Phi_d、キラル符号 Q
一様場への応答 非ゼロ(DC成分を検出) ゼロ(対称性により消滅)
渦構造への応答 周波数として間接検出 直接検出(\Phi_d \gg 0
符号情報 位相角(連続値) Q = \pm 1(離散・トポロジカル)
格子依存性 周期境界に敏感 フィボナッチ非公約性で軽減

4.2 FFT が捨てるもの

標準的なFFT処理パイプラインでは:

信号 x(t)
  → STFT(窓関数付き短時間フーリエ変換)
    → 振幅スペクトル |X[k]|    ← 保存
    → 位相スペクトル ∠X[k]    ← しばしば捨てられる
    → 残差 / 位相的巻き付き    ← ほぼ常に捨てられる

coneFFT はこの「捨てられる残差」の中の位相的渦構造を回収する。

4.3 Spleeter との比較(スペクトログラム法)

Spleeterに代表されるスペクトログラムマスキング法は:

STFTでスペクトログラム化 → U-Netでマスク推定 → ISTFTで復元

この過程で位相情報が失われ、再合成時に「金属的なアーティファクト」が発生する。これはSTFTが大きさスペクトルのみを扱い、位相を原信号から借用するためである。

coneFFT は位相的構造を出発点とするため、原理的にこの問題を回避できる。


5. H-Carrier 仕様

5.1 残差の定義

H_s := \text{mean}(x - \hat{x}), \quad H_m := \text{rms}(|x - \hat{x}|)

5.2 閾値ゲート

g := \text{clip}\left(\frac{H_m - \tau}{\kappa}, 0, 1\right)
  • \tau:ノイズフロア閾値(量子化誤差相当)
  • \kappa \to 0:ハードゲート、\kappa > 0:ソフトゲート

5.3 リーク積分(ドリフト防止)

\hat{H}_s[t] := (1 - \lambda)\hat{H}_s[t-1] + \lambda H_s[t]

5.4 再注入バイアス

b[t] := \alpha \cdot g[t] \cdot \hat{H}_s[t]

5.5 安定条件(必須)

G_{\text{eff}} := |\alpha| \cdot g_{\max} \cdot C < 1

黄金比との関係(推奨):

|\alpha| \leq (1 - \phi^{-1}) \cdot \beta = 0.382\beta, \quad 0 < \beta < 1

5.6 パラメータ一覧

パラメータ 意味 推奨範囲
\tau ノイズフロア 0.010.1
\kappa ゲート幅 0.050.2
\alpha 再注入利得 00.382
\lambda リーク係数 0.10.5

6. 統合アーキテクチャ

6.1 信号フロー

STEREO INPUT  L(t), R(t)

  ├─ Mid  M = (L+R)/2
  └─ Side S = (L−R)/2


    ┌─────────────┐
    │  H-CARRIER  │  H_s, H_m 抽出 → τ gate → λ leak → b[t]
    └──────┬──────┘
           │ H_s, H_m

    ┌─────────────┐
    │   coneFFT   │  Φ_d, Q 計算(M, L, R それぞれ)
    └──────┬──────┘
           │ Φ_d, Q, ΔΦ(L−R)

    ┌─────────────┐
    │  CLASSIFIER │  HNR + SC + ZCR + flux + purity + ΔΦ
    └──────┬──────┘       → 5クラス softmax
           │ prob[cls]

    ┌─────────────┐
    │CHIRAL ROUTER│  Q>0 → x_R,  Q<0 → x_L
    └──────┬──────┘

     ┌─────┴──────┐
     │            │
   x_R(t)      x_L(t)
   [Piano]     [Flute]     各楽器ストリーム
   [Drum]      [Voice]     = M × prob[cls]
   [Generic]
     │            │
     └─────┬──────┘

    ┌─────────────┐
    │  SYNTHESIS  │  x̂ = Σ streams + b[t]
    └─────────────┘

    OUTPUT x̂_L, x̂_R

6.2 ステレオキラル差分

左右チャンネルそれぞれに \Phi_d を計算し、その差分を声・空間音響の識別特徴量とする:

\Delta\Phi = \Phi_d(L) - \Phi_d(R)

これは補聴器・空間音響処理での音源方向推定に応用できる。

6.3 フィードバックループ

H-Carrier の b[t] = α·g·Ĥ_s が Classifier にフィードバックされる:

  分類誤差 → H_s 増大 → g 増大 → b[t] 増大 → 次フレームで補正

これにより分類器が自己適応的に残差を減少させる動作をする(ただし G_{\text{eff}} < 1 の安定条件下でのみ)。


7. 楽器分解アルゴリズム

7.1 特徴量抽出

各フレームで以下を計算する:

特徴量 定義 主用途
HNR \sum x[i]x[i+T] / \sum x[i]^2 倍音比(ピアノ・弦)
SC \sum k|X_k| / \sum|X_k| スペクトル重心
ZCR \#\{\text{符号変化}\} / N ゼロ交差率(ドラム)
flux $\sqrt{\sum( X_k[t]
attack E_{0\text{-}5\%} / E_{5\text{-}100\%} アタック速度(打楽器)
purity \max|x[i]| / \text{mean}|x[i]| 純音度(フルート)
\Delta\Phi \Phi_d(L) - \Phi_d(R) 空間キラル差(声)

7.2 ヒューリスティック分類器

各クラスのスコアを線形結合で計算し、softmax で確率化:

piano_score  = 3·min(HNR/0.5, 1) + 2·SC + (1−flux)·2
flute_score  = 4·purity + 2·[Φ_d > 0.005] + (1−ZCR)·2
drum_score   = 5·[attack > 0.15] + 3·ZCR + 2·flux
voice_score  = 3·SC + 2·HNR + 1.5·[Q ≠ 0] + ΔΦ·3
generic_score = 1  (残差キャッチオール)

prob[cls] = softmax(score[cls])

7.3 ストリーム分離(ソフトマスク)

x_{\text{cls}}[i] = x[i] \cdot \text{prob}[\text{cls}]

7.4 再合成

\hat{x}[i] = \sum_{\text{cls}} x_{\text{cls}}[i] + \text{clip}(b[i], -b_{\max}, b_{\max})

8. ツールの使い方

8.1 ファイル一覧

ファイル 内容
hcarrier-conefft-v04.html メインツール(本技術ノートに対応)
hcarrier-conefft-v02.html 旧版ビジュアライザー
skyrmion-coneFFT.html 40³格子スキルミオン場ビジュアライザー
coneFFT-research-note.md スキルミオン数値観察研究ノート

8.2 基本操作

① ブラウザで hcarrier-conefft-v04.html を開く

② SOURCE ボタンで入力を選ぶ
   🎹 PIANO  — 倍音豊富な減衰音
   🪈 FLUTE  — ビブラート付き純音
   🥁 DRUM   — キック+スネアループ
   🎤 VOICE  — フォルマント合成(F1/F2/F3)
   🎼 MIX    — 3種混合(アンサンブル)
   🎙 MIC    — マイクリアルタイム入力

③ ▶ PLAY を押す → 音が鳴り始め、波形・スペクトル・分類が動く

④ Stream Playback パネルで各楽器ストリームをON/OFFして
   分解結果を耳で確認する

⑤ ⏸ PAUSE / ⏹ STOP で制御

8.3 マイク入力の注意

  • ブラウザのマイクアクセス許可が必要(初回のみ)
  • HTTPS または localhost 環境が必要(通常の claude.ai Artifact 内では動作する)
  • マイクはスピーカーに接続されない(ハウリング防止)
  • WMAファイルはブラウザ非対応のため、MP3/WAV/OGGに変換して使用

8.4 パラメータ調整ガイド

目的 操作
分類精度を上げたい HNR thresh を信号に合わせて調整
残差が大きい α を下げるか τ を上げる
ドリフトが発生 λ を小さくする(0.05–0.1)
不安定(発振) α を 0.3 以下に下げる(G_eff < 1 を確認)
キラル分離を強調 R(radius)を 0.25–0.45 で試す

9. 確定数値結果

v37引継書から継承された確定値。すべて40³格子・Bloch型スキルミオン場での実測値。

9.1 ベース実験(R=0.35, λ=0.5π)

\Phi_d^{\text{sky}} = 1.1308, \quad \Phi_d^{\text{uni}} \approx 10^{-12}
\Phi_d^{\text{sky}} / \Phi_d^{\text{uni}} \approx 10^9

この比は振幅差ではなく位相的ゼロ vs 非ゼロという構造的差異に由来する。

9.2 命題 A〜E(v36から継承)

これらの命題はすべてv37セッションと整合が確認されている。

命題A:一様場において R_6(x)[p] = 0 となる(対称性引数)
命題B:スキルミオン場において \Phi_d \gg 0(回転位相構造による非消滅)
命題CQ の符号は反skyrmionで反転する(実験的確認済み)
命題D\Phi_dR に対して単調ではない(R=0.45 で飽和傾向)
命題EG_{\text{eff}} < 1 の下でH-Carrierは収束する(INV_PHI拘束)


10. 既存ツールとの比較・位置づけ

10.1 音源分離ツールの比較

ツール 手法 強み 弱み
Spleeter (Deezer) スペクトログラムマスキング 高速・軽量 位相アーティファクト・2019年以降更新なし
Demucs v4 (Meta) ハイブリッドTransformer 高精度(SDR 9.2dB) 重い(8GB+ RAM)・ブラックボックス
H-Carrier × coneFFT 位相的巻き付き+残差再注入 位相保存・解釈可能・軽量 学習なし・精度は粗い

10.2 独自の価値

Demucsが「何を分離するか(ボーカル/ドラム/ベース)」に特化しているのに対し、本ツールは「どのような位相構造を持つか」という別の軸で信号を見る。

既存DLモデル:  統計パターン(データ駆動)
H-Carrier×coneFFT:位相的巻き付き構造(物理駆動)

両者は競合ではなく補完関係にある。理想的な統合:

音声ファイル
  → Demucs(楽器ストリーム高精度分離)
    → 各ストリームに H-Carrier × coneFFT 適用
      → キラル成分・位相構造の解析
      → 残差中の未捕捉成分の再注入

11. 応用例

11.1 補聴器・音声補正

H-Carrier の残差再注入ループに \Phi_d 識別を組み込むことで:

  • 同一周波数帯に混在する複数音源(声と環境音)の位相的分離
  • 右巻き・左巻きで音源方向を推定(\Delta\Phi = \Phi_d(L) - \Phi_d(R)
  • 残差キャリアによる低消費電力・低遅延実装(学習モデル不要)

11.2 自然音の分波

FFT が捨てる残差の中に位相的構造が残存することが確認されている:

  • 鳥の鳴き声:周波数変調のキラル時間構造
  • 水音・風音:渦構造(自然界の流体は必ずキラル成分を持つ)
  • 複数音源の共存帯域:同一周波数でも Q が異なれば分離可能

11.3 スキルミオン材料の非破壊検査

\Phi_d が材料の位相的秩序に対して 10^9 倍の感度差を示すことから:

  • LLG 方程式解への適用:実在材料モデルの渦検出
  • 実験データの前処理:ノイズ付加テストで SNR 特性を定量化
  • 相転移の検出:秩序相(\Phi_d \gg 0)↔ 無秩序相(\Phi_d \approx 0)の境界識別

11.4 信号処理一般

応用領域 coneFFT の役割 H-Carrier の役割
ASR(音声認識) 渦状音素構造の識別 残差の有用成分再利用
空間音響処理 L/R キラル差分による位置推定 安定な方向フィルタ
医療音響(心音・腸音) 渦流成分の抽出 低 SNR 環境での信号保持
地震波解析 P波・S波のキラル識別 長時間観測での残差累積制御

12. 誠実な限界と課題

12.1 現プロトタイプの限界

  1. Q \approx -36 は厳密整数ではない
    有限格子・離散微分の影響。連続極限での値は -40(全40層で各 -1)が理論予測。

  2. 解析解は人工モデル
    LLG(Landau-Lifshitz-Gilbert)方程式の解ではなく、手動構成のBloch型スキルミオン。実材料への直接適用には実験データが必要。

  3. \Phi_d は1D実装
    R_6 本体は3D対角方向演算子。現在は1Dライン相関で近似しており、3D対角方向相関への拡張が課題。

  4. 楽器分類はヒューリスティック
    学習なしのスコア関数。実音楽ファイルに対しては精度が粗い(特にアンサンブル混合)。

  5. \Phi_d の理論的正当化は未完
    なぜ一様場で代数的にゼロになるかの厳密な対称性証明が未完成(次セッション最優先課題)。

12.2 楽器分離の現実的精度

単音源(1楽器のみ):  ◎ かなり動く
2〜3楽器混合:        △ 粗い分離
フルアンサンブル:     × ほぼ機能しない

高精度の楽器分離には Demucs 等の学習済みモデルを推奨する。


13. 次ステップロードマップ

Phase 1(最優先):解析証明

目標:x[p] = c(定数)のとき R₆(x)[p] = 0 → Φ_d = 0 の厳密証明
手法:対称性引数による代数的消滅の明示化

Phase 2:3D Φ_d 実装

1D ラインサンプリング
  → 3D 対角方向相関(6方向 R₆ 演算子の完全実装)
  → Pythonプロトタイプ → HTMLビジュアライザーに反映

Phase 3:ノイズ付加テスト

ガウスノイズ付加実験
  → SNR vs Φ_d の特性曲線
  → 検出閾値の定量化
  → 補聴器応用での実用下限の推定

Phase 4:実在材料・実音源

音声側:MP3/WAVファイル読み込み(decodeAudioData API)
         + ヒルベルト変換ベース分波(可逆性改善)
材料側:LLG方程式解または実験データへの適用

Phase 5:Demucs統合

Demucs → 楽器ストリーム高精度分離
  → 各ストリームに Φ_d / H-Carrier 適用
  → キラル特徴量による音源追跡・方向推定

参考

  • 引継書 v37(2026-03-10): coneFFT Verification Instrument v0.2.1
  • H-Carrier仕様書: 有用残差再注入伝播と安定制御
  • Demucs v4: Hybrid Transformer Demucs (Meta AI, 2022)
  • Spleeter: Deezer Research (2019)
  • MUSDB HQ benchmark: SDR 9.20 dB (HTDemucs fine-tuned)

H-Carrier × coneFFT Technical Note — v0.4 / 2026-03-10
次バージョン予定: Phase 1 解析証明 + 3D Φ_d 実装

Discussion