GENIEE TechBlog
🎤

Whisper/pyannoteを用いたローカル環境での話者分離&文字起こし - NotebookLM 音声概要 吹き替え計画 その1

に公開

概要

  • この記事は、Google NotebookLMの音声概要機能を他の音声合成ソフトで再現するプロジェクトの第一弾です。
  • 音声ファイルの話者分離と文字起こしをローカル環境で実行するPythonプログラムを紹介します。
  • 話者分離には、Hugging Faceで公開されている pyannote/speaker-diarization-3.1モデルを利用します。

https://huggingface.co/pyannote/speaker-diarization-3.1

  • 文字起こしには、OpenAIの Whisperモデル(例: whisper-large-v3)を利用し、分離された各話者の発話をテキスト化します。

https://huggingface.co/openai/whisper-large-v3

  • 開発したプログラムはGitHubリポジトリで公開し、使い方や簡易版コードも提供しています。

https://github.com/hikaru-shiga-geniee/audio-diarization-transcript

  • 記事内では、複数のWhisperモデルを用いた際の性能(処理時間・精度)比較結果も示しています。

本記事を書くに至った経緯

最近、Google の NotebookLM に搭載された音声概要機能が日本語にも対応したというニュースを目にしました。

https://blog.google/intl/ja-jp/company-news/technology/notebooklm-50/

実際に試してみたところ、生成される音声が非常に流暢で、聞き取りやすいダンディな男性の声と爽やかな女性の声でした。

この機能を使っているうちに、「この生成された音声概要の内容を、ずんだもんのような他の合成音声ソフトで喋らせてみたら面白いのではないか?」というアイデアが浮かびました。

そこで、NotebookLMが生成する音声概要と同じテキストを、ローカル環境で準備した別の音声合成エンジンに読み上げさせることを最終目標としたシリーズ記事を執筆することにしました。

本記事はそのシリーズの第一弾として、まず音声ファイルから話者分離を行い、誰がどの部分を話したかを特定した上で文字起こしを行う方法を、手元のローカル環境で実現する手順について解説します。

今後のシリーズ記事の予定:

  1. 話者分離を含めた文字起こしをローカル環境で実行する方法 (本記事)

  2. 話者分離済みの文字起こしデータから音声合成を行う方法

  3. ローカルLLMを用いた文字起こし結果の修正と、音声合成に適したテキストへの加工 (今後・実装中)

作成したプログラム

本記事では、ローカル環境で話者分離と文字起こしを実行するPythonプログラムを作成しました。

リポジトリと使い方

プログラムのコードは以下のGitHubリポジトリで公開しています。詳細な環境構築手順やコマンドラインオプションについては、リポジトリ内のREADMEファイルをご確認ください。

https://github.com/hikaru-shiga-geniee/audio-diarization-transcript

プログラムの概要

このプログラムは、入力された音声ファイルに対して以下の処理を行い、話者ごとに区切られた文字起こし結果をCSVファイルとして出力します。

出力例 (一部抜粋):

"start","end","speaker","text"
"00:00:04","00:00:30","SPEAKER_01","こんにちは ... お願いします"
"00:00:31","00:00:48","SPEAKER_01","さて今回も ... 広いですよね"
"00:00:48","00:00:52","SPEAKER_00","そうですねそれぞれがつながってるんですよね"
"00:00:52","00:01:00","SPEAKER_01","です ... なと"
"00:01:00","00:01:05","SPEAKER_00","まさに、特にやっぱり避けられないのが、その労働力不足っていう大きな課題。"
"00:01:05","00:01:15","SPEAKER_00","これに対して企業がどうやって戦略的にリソースを配分してテクノロジーを使っ

処理の流れ:

  1. 話者分離: Hugging Face で公開されている pyannote/speaker-diarization-3.1 モデル (または指定された他のPyannoteモデル) を使用して、音声ファイルから話者が変わるタイミングや、各発話区間を特定します。
  2. 文字起こし: 話者分離によって特定された各発話セグメントに対して、OpenAIWhisper モデル (デフォルトは openai/whisper-large-v3、他のWhisperモデルも指定可能) を用いて文字起こしを行います。

簡易版コード (mini.py)

リポジトリには、主要な処理を手軽に試せる簡易版のスクリプト mini.py も含まれています。

実行方法:

  1. リポジトリのREADMEに従って、環境構築を完了させてください。(特にHugging Faceのトークン設定が必要です)

  2. mini.py 内の audio_file: Path = Path("./short.wav") の部分を、ご自身の音声ファイルパスに書き換えます。

  3. 以下のコマンドを実行します。

    uv run python ./mini.py
    

コード詳細:

mini.py のコード
mini.py
import torch
from torch import Tensor, device as TorchDevice, dtype as TorchDtype
from transformers import WhisperProcessor, WhisperForConditionalGeneration
from pyannote.audio import Pipeline, Audio
from pyannote.core import Annotation
from pathlib import Path


# 文字起こし対象の音声ファイル
audio_file: Path = Path("./short.wav" )
# 話者分離を行うモデル
pyannote_model: str = "pyannote/speaker-diarization-3.1"
# 文字起こしを行うモデル
transcription_model: str = "openai/whisper-large-v3"

# デバイス選択とデータ型設定 (CPUで実行)
# GPU を使用する場合は device = torch.device("cuda") などに変更
device: TorchDevice = torch.device("cpu")
dtype: TorchDtype = torch.float32 # CPUの場合はfloat32, GPU (CUDA) であれば float16 なども検討

# PyannoteパイプラインとWhisperモデル/プロセッサ、Audioハンドラをロード
# 初回実行時はモデルのダウンロードが行われます
pipeline: Pipeline = Pipeline.from_pretrained(pyannote_model).to(device)
processor: WhisperProcessor = WhisperProcessor.from_pretrained(transcription_model)
model: WhisperForConditionalGeneration = WhisperForConditionalGeneration.from_pretrained(transcription_model, torch_dtype=dtype).to(device).eval()
audio_handler: Audio = Audio(sample_rate=16000, mono=True) # Whisper用に16kHzモノラルに変換


# --- 1. 話者分離を実行 ---
# Hugging Face Hub のアクセストークンが必要です (README参照)
# pipeline() の引数で話者数を指定可能 (例: num_speakers=2)
# 指定しない場合はモデルが推定しますが、事前にわかっている場合は指定すると精度が向上することがあります
print("話者分離を実行中...")
diarization: Annotation = pipeline(str(audio_file)) # Pathオブジェクトを文字列に変換して渡す
print("話者分離完了.")

# --- 2. セグメントごとに文字起こし ---
print("文字起こしを実行中...")
# diarization.itertracks()で各発話区間(segment)と話者ラベル(speaker)を取得
for segment, _, speaker in diarization.itertracks(yield_label=True):
    start_sec = segment.start
    end_sec = segment.end
    print(f"[{start_sec:03.1f}s - {end_sec:03.1f}s] {speaker} の処理中...")

    # audio_handler.crop()で該当区間の音声波形を読み込み (16kHzモノラルに変換済)
    waveform, sample_rate = audio_handler.crop(audio_file, segment)

    # transformers版Whisperで文字起こしを実行
    # 1. 音声波形をWhisperモデルの入力形式 (Log-Mel Spectrogram) に変換
    input_features: Tensor = processor(
        waveform.squeeze().numpy().astype("float32"), # 波形をnumpy float32配列に
        sampling_rate=sample_rate,                 # サンプルレート指定 (16000)
        return_tensors="pt"                      # PyTorchテンソルで返す
    ).input_features.to(device, dtype=dtype)       # モデルと同じデバイス・データ型へ

    # 2. モデルでIDシーケンスを生成 (勾配計算なし)
    with torch.no_grad():
        # 日本語を指定して文字起こしタスクを実行
        predicted_ids: Tensor = model.generate(
            input_features,
            forced_decoder_ids=processor.get_decoder_prompt_ids(language="ja", task="transcribe")
        )

    # 3. IDシーケンスをテキストにデコード
    text: str = processor.batch_decode(predicted_ids, skip_special_tokens=True)[0].strip()
    print(f"[{start_sec:03.1f}s - {end_sec:03.1f}s] {speaker}: {text}")

print("文字起こし完了.")

より詳細な使い方や、GPUを使用するための設定、利用可能なコマンドラインオプション(出力ファイル名の指定、使用モデルの変更など)については、GitHubリポジトリのREADMEをご参照ください。

各モデルの性能評価

本記事で紹介したプログラムを用いて、いくつかのWhisperモデルの文字起こし性能(処理時間)を比較しました。

実験環境

https://www.youtube.com/watch?v=pbqqkebQUUw&ab_channel=GENIEEマーケティングクラウド

文字起こし時間の比較

以下の表は、話者分離 (pyannote/speaker-diarization-3.1を使用) と各Whisperモデルによる文字起こしを組み合わせた際の、文字起こし処理にかかった時間を示しています。時間は秒単位です。

実行コマンド:

uv run ./main.py ./audio.wav --num_speakers 2 --transcription_model_id "[各モデルのID]"

実行結果:

文字起こし時間の比較のグラフ

文字起こし時間の比較の詳細
各モデルの文字起こしの結果
whisper-large-v3.csv
"start","end","speaker","text"
"00:00:04","00:00:30","SPEAKER_01","こんにちはジェニービジネスサテライトラジオを聞いていただきありがとうございますこのチャンネルは最近のビジネス市場とAIやデジタルソリューションの活用マーケティングと経営のあり方について考えていくカジュアルトーク番組ですぜひコメント欄に番組の感想リスナーの皆さんが聞きたいテーマなどお気軽に書き込みいただけましたら嬉しいですまたチャンネル登録いいねもよろしくお願いします"
"00:00:31","00:00:48","SPEAKER_01","さて今回も様々な資料を読み込んできましたけど日本の労働市場の未来からB2B戦略のABMあとはセールステックの動向それから営業組織のパフォーマンス管理まで結構幅が広いですよね"
"00:00:48","00:00:52","SPEAKER_00","そうですねそれぞれがつながってるんですよね"
"00:00:52","00:01:00","SPEAKER_01","ですよねこれらをつなぎ合わせて今のビジネス環境で特に大事なポイントっていうのを今日は深振りしていきたいなと"
"00:01:00","00:01:05","SPEAKER_00","まさに、特にやっぱり避けられないのが、その労働力不足っていう大きな課題。"
"00:01:05","00:01:15","SPEAKER_00","これに対して企業がどうやって戦略的にリソースを配分してテクノロジーを使って成長していくかそのあたりのヒントを探っていきましょう"
"00:01:15","00:01:16","SPEAKER_01","はい。"
"00:01:16","00:01:20","SPEAKER_00","きっとあなたの日々の業務とか将来の計画に役立つ何か発見があると思いますよ"
"00:01:20","00:01:34","SPEAKER_01","マズラのパーソルさんの労働市場の未来推計2035これ結構インパクトありましたね2035年に労働時間が1日あたり1775万時間不足する"
"00:01:35","00:01:35","SPEAKER_00","へぇ"
"00:01:35","00:01:42","SPEAKER_01","これ2023年の1.85倍働き手で言うと384万人分"
"00:01:42","00:01:44","SPEAKER_01","深刻だなぁと"
"00:01:44","00:01:49","SPEAKER_00","そうなんですよねただちょっと面白いというかポイントなのが"
"00:01:50","00:01:56","SPEAKER_00","働き手の数自体は実は増える見込みなんですよ2035年に向けて400万人ぐらい"
"00:01:56","00:01:59","SPEAKER_01","あ、そうなんですか?数は増えるのに時間が足りなくなる?"
"00:01:59","00:02:04","SPEAKER_00","それはつまりシニアの方とか女性それから外国人の方々"
"00:02:04","00:02:09","SPEAKER_00","こういう就業者が増えることで、一人当たりの労働時間が短くなる傾向にあると。"
"00:02:09","00:02:10","SPEAKER_01","なるほど"
"00:02:10","00:02:13","SPEAKER_00","それに加えて働き方改革の影響もありますしね"
"00:02:13","00:02:14","SPEAKER_01","労働時間の短縮"
"00:02:14","00:02:21","SPEAKER_00","資料にもありましたけど2070年には外国人労働者が人口の1割を占めるかもしれないなんて話も"
"00:02:21","00:02:28","SPEAKER_01","へーじゃあ単純に人が足りないっていうのとはちょっと違うんですね働き方の中身が変わってくると"
"00:02:28","00:02:33","SPEAKER_00","そういうことです。だから、長時間労働で頑張るマラソン型じゃなくて、"
"00:02:33","00:02:34","SPEAKER_01","ふふ"
"00:02:34","00:02:40","SPEAKER_00","短い時間でみんなで効率よくつないでいくバケツリレー型みたいな働き方に変えていく必要があるんじゃないかと"
"00:02:40","00:02:42","SPEAKER_01","バケツリレー型わかりやすいですね"
"00:02:42","00:02:47","SPEAKER_01","これ日本だけの話じゃないっていうのも資料にありましたねオランダとかスペインとか"
"00:02:47","00:02:55","SPEAKER_00","そうなんですよやっぱり労働供給の制約っていうのは多くの先進国が直面している課題なんですね"
"00:02:55","00:03:05","SPEAKER_00","こういう環境だからこそ企業としては限られたリソースをじゃあどこに集中させるのっていうその戦略的な判断がもうめちゃくちゃ重要になってくるわけです"
"00:03:05","00:03:07","SPEAKER_01","リソース配分ですね"
"00:03:07","00:03:18","SPEAKER_00","特にSaaSみたいに顧客の裾野が広がりやすいビジネスだと本当にこれが生命線になるザモデルでも言われている本質って突き詰めると案外こういうところにあるのかもしれないですね"
"00:03:18","00:03:27","SPEAKER_01","なるほど。そこで具体的な戦略として出てくるのが、あの、蔡流さんのガイドブックにあったABM、アカウントベーストマーケティング。"
"00:03:27","00:03:28","SPEAKER_00","はいはいABMですね"
"00:03:28","00:03:30","SPEAKER_01","これってどういう考え方なん でしょう"
"00:03:30","00:03:46","SPEAKER_00","えーとですねABMっていうのはすごく簡単に言うとこの企業は将来的にすごく価値が高まりそうだぞって見込んだターゲット企業をまず絞り込むんですふもふもでそこにマーケティングとか営業のリソースをもう意図的に集中させるっていうアプローチですねなるほど"
"00:03:46","00:03:47","SPEAKER_01","選んで集中すると"
"00:03:47","00:04:06","SPEAKER_00","成功の鍵になるのがそのターゲット企業に共通するキーポテンシャルってやつを見抜くことキーポテンシャルはい例えば資料にあった経理サスの例だと特定の会計ソフトを使っている企業みたいなそういう隠れた共通項ですねこれを見つける"
"00:04:06","00:04:16","SPEAKER_00","それからリレーションマップっていうのを作ってその会社の中の誰がキーパーソンで誰と誰がどういう関係なのかそれをこう見える化するんです"
"00:04:16","00:04:18","SPEAKER_01","人間関係まで"
"00:04:19","00:04:24","SPEAKER_00","そうすることでより手角にピンポイントでアプローチできるようになるというわけです"
"00:04:24","00:04:30","SPEAKER_01","なるほどなぁなんか闇雲に当たるんじゃなくて狙いを定める感じですね"
"00:04:30","00:04:36","SPEAKER_00","でもそういう戦略を実行するとなるとやっぱり道具というかテクノロジーが必要になってきそうですね"
"00:04:36","00:04:37","SPEAKER_01","まさにおっしゃる通りです"
"00:04:38","00:04:47","SPEAKER_01","マークワイドリサーチのレポートにもありましたけど世界的にSFA営業支援システムの市場が伸びてるっていうのはまさにそういう背景があるからですよね"
"00:04:47","00:04:50","SPEAKER_00","効率化とかデータに基づいた意思決定とか"
"00:04:50","00:04:51","SPEAKER_01","そうですそうです"
"00:04:51","00:04:56","SPEAKER_01","セールスフォースみたいな大手はもちろん本当に色んなツールが出てきてますし"
"00:04:56","00:05:03","SPEAKER_00","国内を見ても、BMSマーケット動向でしたっけ?ITサービス、特にSaaSの分野がすごく伸びてる。"
"00:05:03","00:05:05","SPEAKER_01","伸びてますね"
"00:05:05","00:05:13","SPEAKER_00","M&Aも活発で、NTTデータさんとTerra Skyさんの提携とかああいうのを見るとやっぱりDXの需要が高いんだなと"
"00:05:13","00:05:23","SPEAKER_01","ええ、専門性を高めてその需要に応えようという動きですよね。ABMみたいな戦略をやる上での基盤が整いつつあるとも言えるかもしれませんね。"
"00:05:23","00:05:24","SPEAKER_00","確かに"
"00:05:24","00:05:31","SPEAKER_00","ただ、戦略があってツールがあっても、それを動かすその組織のパフォーマンス管理、"
"00:05:31","00:05:34","SPEAKER_00","これがちゃんとできてないと、手にかいた餅になっちゃう。"
"00:05:34","00:05:41","SPEAKER_01","いやー本当にそうなんですよそこで重要になってくるのがエクザクトリーの資料にもあったフォーキャスト"
"00:05:41","00:05:43","SPEAKER_01","つまり売上予測の精度"
"00:05:43","00:05:49","SPEAKER_00","フォーキャストの精度、これ営業担当者の報告をただ足し合わせるだけじゃダメなんですよね。"
"00:05:49","00:05:50","SPEAKER_01","全然ダメですね"
"00:05:51","00:05:54","SPEAKER_01","それだとどうしても希望的観測が入り込んじゃいますから"
"00:05:54","00:05:55","SPEAKER_00","ああ確かに"
"00:05:55","00:06:09","SPEAKER_01","そうじゃなくてもっと客観的に例えば商談がどのフェーズにあるのかちゃんと管理した上でこれはコミットほぼ確実こっちはアップサイドまあ可能性ありみたいに角度をちゃんと分類する"
"00:06:09","00:06:09","SPEAKER_00","ふむふむ"
"00:06:10","00:06:21","SPEAKER_01","で、過去のデータとか傾向値なんかも見ながら多角的に予測を組み立てていく必要があるんです目指すのはプラスマイナス5%から10%って言われてますね"
"00:06:21","00:06:25","SPEAKER_00","プラスマイナス5%から10%かなりシビアですね"
"00:06:25","00:06:31","SPEAKER_01","シビアですでもこれができないと結局さっき話したリソース配分の制度にも関わってきますから"
"00:06:31","00:06:40","SPEAKER_00","なるほどつながってるんですね予測だけじゃなくて実際に社員の人たちがどう動くかそれを導く報酬設計も大事だと"
"00:06:40","00:06:45","SPEAKER_01","まさにそこが肝です人は何で評価されるかで行動が決まりますからね"
"00:06:45","00:06:46","SPEAKER_00","ですよね"
"00:06:46","00:06:59","SPEAKER_01","会社の戦略として今はとにかく新規顧客を獲得してほしいとかこの新しいプロダクトを売ってほしいとかそういう意図があるんだったらそれをインセンティブプラン報酬の仕組みにちゃんと反映させないと"
"00:06:59","00:07:02","SPEAKER_00","具体的にはどういう工夫が考えられますか?"
"00:07:02","00:07:05","SPEAKER_01","例えば達成率によってコミッションのレートを変えるとか"
"00:07:06","00:07:11","SPEAKER_01","あとは担当する顧客の規模によって評価する期間を変えるとかですね"
"00:07:12","00:07:19","SPEAKER_01","SMB担当なら月字で細かく見てエンタープライズ担当なら市販期とか年次とか少し長いスパンで評価するとか"
"00:07:19","00:07:20","SPEAKER_00","なるほど"
"00:07:20","00:07:22","SPEAKER_00","評価サイクルも大事なんですね"
"00:07:22","00:07:28","SPEAKER_01","そうやってモチベーションを維持しつつ会社の戦略目標達成につなげていくわけです"
"00:07:28","00:08:07","SPEAKER_00","いやー今回の資料いろいろありましたけど労働力不足っていう大きなマクロな変化から始まってABMみたいな具体的な戦略それを支えるSFAとかのテクノロジーで最後はフォーキャストとか報酬設計っていう組織運営の細かいところまでなんか全部が一本の線でつながっている感じがしますねええ本当にそう思います制約のある中でどうやって成果を最大化するか"
"00:08:07","00:08:08","SPEAKER_01","3位一体ですね"
"00:08:08","00:08:20","SPEAKER_00","そうですねさてここまでいろいろ見てきましたけどこれを踏まえてリスナーのあなたが明日から自分の仕事とかチームで何か一つでも試せそうなことありますかね"
"00:08:20","00:08:21","SPEAKER_01","うーん"
"00:08:21","00:08:24","SPEAKER_00","ちょっとそんなことを考えてみる時間になれば嬉しいです"
"00:08:24","00:08:39","SPEAKER_01","本日のセッションはここまでとさせていただきます。ぜひコメント欄に番組の感想、リスナーの皆さんが聞きたいテーマなどお気軽に書き込みいただけましたら嬉しいです。またチャンネル登録、いいねもよろしくお願いします。ではまた次回お会いしましょう。"
whisper-medium.csv
"start","end","speaker","text"
"00:00:04","00:00:30","SPEAKER_01","こんにちは!ジニービジネスサテライトラジオを聞いていただきありがとうございますこのチャンネルは最近のビジネス市場とAIやデジタルソリューションの活用、マーケティングと経営のあり方について考えていくカジュアルトーク番組ですぜひコメント欄に番組の感想、リスナーの皆さんが聞きたいテーマなどをお気軽に書き込みいただけましたら嬉しいですまたチャンネル登録、いいねもよろしくお願いします"
"00:00:31","00:00:48","SPEAKER_01","さて、今回も様々な資料を読み込んできましたけど、日本の労働市場の未来から、B2B戦略のABM、あとはセールステックの動向、それから営業組織のパフォーマンス管理まで、結構幅が広いですよね。"
"00:00:48","00:00:52","SPEAKER_00","そうですね。まあでもそれぞれがこう繋がってるんですよね。"
"00:00:52","00:01:00","SPEAKER_01","ですよねこれらをつなぎ合わせて今のビジネス環境で特に大事なポイントっていうのを今日は深振りしていきたいなと"
"00:01:00","00:01:05","SPEAKER_00","まさに、避けられないのが、労働力不足という大きな課題。"
"00:01:05","00:01:15","SPEAKER_00","これに対して企業がどうやって戦略的にリソースを配分してテクノロジーを使って成長していくかそのあたりのヒントを探っていきましょう"
"00:01:15","00:01:16","SPEAKER_01","はい"
"00:01:16","00:01:20","SPEAKER_00","きっとあなたの日々の業務とか将来の計画に役立つ何か発見があると思いますよ"
"00:01:20","00:01:34","SPEAKER_01","マズラのパーソルさんの労働市場の未来推計2035これ結構インパクトありましたね2035年に労働時間が1日あたり1775万時間不足する"
"00:01:35","00:01:35","SPEAKER_00","へぇ"
"00:01:35","00:01:42","SPEAKER_01","これ2023年の1.85倍働き手でいうと384万人分"
"00:01:42","00:01:44","SPEAKER_01","深刻だなぁと"
"00:01:44","00:01:49","SPEAKER_00","そうなんですよね ただあのちょっと面白いというかポイントなのが"
"00:01:50","00:01:56","SPEAKER_00","働き手の数自体は実は増える見込みなんですよ2035年に向けて400万人ぐらい"
"00:01:56","00:01:59","SPEAKER_01","あ、そうなんですか?数は増えるのに時間が足りなくなる?"
"00:01:59","00:02:04","SPEAKER_00","それはつまりシニアの方とか女性、それから外国人の方々"
"00:02:04","00:02:09","SPEAKER_00","こういう就業者が増えることで一人あたりの労働時間が短くなる傾向にあると"
"00:02:09","00:02:10","SPEAKER_01","なるほど"
"00:02:10","00:02:13","SPEAKER_00","それに加えて働き方改革の影響もありますしね"
"00:02:13","00:02:14","SPEAKER_01","労働時間の短縮"
"00:02:14","00:02:21","SPEAKER_00","資料にもありましたけど、2070年には外国人労働者が人口の1割を占めるかもしれないなんて話も。"
"00:02:21","00:02:28","SPEAKER_01","へぇー、じゃあ単純に人が足りないっていうのとはちょっと違うんですね。働き方の中身が変わってくると。"
"00:02:28","00:02:33","SPEAKER_00","そういうことですだから長時間労働で頑張るマラソン型じゃなくて"
"00:02:33","00:02:34","SPEAKER_01","んん"
"00:02:34","00:02:40","SPEAKER_00","短い時間でみんなで効率よくつないでいくバケツリレイ型みたいな働き方に 変えていく必要があるんじゃないかと"
"00:02:40","00:02:42","SPEAKER_01","バケツリレー型わかりやすいですね"
"00:02:42","00:02:47","SPEAKER_01","これ日本だけの話じゃないっていうのもあの資料にありましたね、オランダとかスペインとか"
"00:02:47","00:02:55","SPEAKER_00","そうなんですよ。やっぱり、労働供給の制約っていうのは、多くの先進国が直面してる課題なんですね。"
"00:02:55","00:03:05","SPEAKER_00","こういう環境だからこそ企業としては、限られたディソースをどこに集中させるの?という戦略的な判断が、もうめちゃくちゃ重要になってくるわけです。"
"00:03:05","00:03:07","SPEAKER_01","リソース配分ですね"
"00:03:07","00:03:18","SPEAKER_00","特にSARSみたいに顧客の裾のが広がりやすいビジネスだと本当にこれが生命線になる。ザ・モデルでも言われている本質って突き詰めると案外こういうところにあるのかもしれないですね。"
"00:03:18","00:03:27","SPEAKER_01","なるほどそこで具体的な戦略として出てくるのがあの最竜さんのガイドブックにあった abmアカウントベースとマーケティング"
"00:03:27","00:03:28","SPEAKER_00","はいはい、ABMですね"
"00:03:28","00:03:30","SPEAKER_01","これってどういう考え方なんでしょう"
"00:03:30","00:03:46","SPEAKER_00","ABMというのは、すごく簡単に言うと、この企業は将来的にすごく価値が高まりそうだと見込んだターゲット企業をまず絞り込むんです。そこにマーケティングとか営業のリソースを意図的に集中させるというアプローチですね。"
"00:03:46","00:03:47","SPEAKER_01","選んで集中すると"
"00:03:47","00:04:06","SPEAKER_00","成功の影になるのが、ターゲット企業に共通するキーポテンシャルを見抜くことキーポテンシャル?例えば、資料にあった経理サスの例だと、特定の会計ソフトを使っている企業みたいな隠れた共通語を見つける"
"00:04:06","00:04:16","SPEAKER_00","それからリレーションマップっていうのを作って、その会社の中の誰がキーパーソンで、誰と誰がどういう関係なのか、それを見える化するんです。"
"00:04:16","00:04:18","SPEAKER_01","あはー、人間関係まで。"
"00:04:19","00:04:24","SPEAKER_00","そうすることでより手角にピンポイントでアプローチできるようになるというわけです"
"00:04:24","00:04:30","SPEAKER_01","なるほどなーなんか闇雲に当たるんじゃなくて狙いを定める感じですね"
"00:04:30","00:04:36","SPEAKER_00","でもそういう戦略を実行するとなると やっぱり道具というかテクノロジーが必要になってきそうですね"
"00:04:36","00:04:37","SPEAKER_01","まさにおっしゃるとおりです"
"00:04:38","00:04:47","SPEAKER_01","マークワイドリサーチのレポートにもありましたけど、世界的にSFA、営業支援システムの史上が伸びてるっていうのはまさにそういう背景があるからですよね。"
"00:04:47","00:04:50","SPEAKER_00","効率化とかデータに基づいた意思決定とか"
"00:04:50","00:04:51","SPEAKER_01","そうですそうです"
"00:04:51","00:04:56","SPEAKER_01","Salesforceみたいな大手はもちろん本当に色んなツールが出てきてますし"
"00:04:56","00:05:03","SPEAKER_00","国内を見ても、BUSマーケット同行でしたっけ?ITサービス、特にSASの分野がすごく伸びてる"
"00:05:03","00:05:05","SPEAKER_01","伸びてますねー"
"00:05:05","00:05:13","SPEAKER_00","M&Aも活発で、NTT DATAさんとTerraskyさんの定型とか、ああいうのを見るとやっぱりDXの需要が高いんだなと。"
"00:05:13","00:05:23","SPEAKER_01","専門性を高めてその需要に応えようという動きですよね。ABMみたいな戦略をやる上での基盤が整いつつあるとも言えるかもしれませんね。"
"00:05:23","00:05:24","SPEAKER_00","確かに"
"00:05:24","00:05:31","SPEAKER_00","ただ、戦略があってツールがあっても、それを動かす、その組織のパフォーマンス管理。"
"00:05:31","00:05:34","SPEAKER_00","これがちゃんとできてないと手に書いた文字になっちゃう"
"00:05:34","00:05:41","SPEAKER_01","いやー本当にそうなんですよそこで重要になってくるのがエクザクトリーの資料にもあったフォーキャスト"
"00:05:41","00:05:43","SPEAKER_01","つまり売上予測の制度"
"00:05:43","00:05:49","SPEAKER_00","フォーキャストの精度。これ営業担当者の報告をただ足し合わせるだけじゃダメなんですよね。"
"00:05:49","00:05:50","SPEAKER_01","全然ダメですね"
"00:05:51","00:05:54","SPEAKER_01","それだとどうしても希望的観測が入り込んじゃいますから"
"00:05:54","00:05:55","SPEAKER_00","ああ、確かに"
"00:05:55","00:06:09","SPEAKER_01","そうじゃなくてもっと客観的に例えば商談がどのフェーズにあるのかちゃんと管理した上でこれはコミットほぼ確実こっちはアップサイドまあ可能性ありみたいに角度をちゃんと分類する"
"00:06:09","00:06:09","SPEAKER_00","ふむ"
"00:06:10","00:06:21","SPEAKER_01","過去のデータとか傾向値なんかも見ながら多角的に予測を組み立てていく必要があるんです目指すのはプラスマイナス5%から10%って言われてますね"
"00:06:21","00:06:25","SPEAKER_00","プラスマイナス5%から10%かなりシビアですね"
"00:06:25","00:06:31","SPEAKER_01","シビアですでもこれができないと結局さっき話したリソース配分の制度にも関わってきますから"
"00:06:31","00:06:40","SPEAKER_00","なるほど繋がってるんですね。で、予測だけじゃなくて、実際に社員の人たちがどう動くか、それを導く報酬設計も大事だと。"
"00:06:40","00:06:45","SPEAKER_01","まさにそこが肝です人は何で評価されるかで行動が決まりますからね"
"00:06:45","00:06:46","SPEAKER_00","ですよね"
"00:06:46","00:06:59","SPEAKER_01","会社の戦略として今はとにかく新規顧客を獲得してほしいとかこの新しいプロダクトを売ってほしいとかそういう意図があるんだったらそれをインセンティブプラン報酬の仕組みにちゃんと反映させないと"
"00:06:59","00:07:02","SPEAKER_00","具体的にはどういう工夫が考えられますか"
"00:07:02","00:07:05","SPEAKER_01","例えば達成率によってコミッションのレートを変えるとか"
"00:07:06","00:07:11","SPEAKER_01","あとは担当する顧客の規模によって評価する期間を変えるとかですね"
"00:07:12","00:07:19","SPEAKER_01","SMB担当なら築地で細かく見てエンタープライズ担当なら市販機とか年次とか少し長いスパンで評価するとか"
"00:07:19","00:07:20","SPEAKER_00","なるほど"
"00:07:20","00:07:22","SPEAKER_00","評価サイクルも大事なんですね。"
"00:07:22","00:07:28","SPEAKER_01","A、そうやってモチベーションを維持しつつ会社の戦略目標達成につなげていくわけです"
"00:07:28","00:08:07","SPEAKER_00","いやー今回の資料いろいろありましたけど労働力不足っていう大きなマクロな変化から始まってABMみたいな具体的な戦略それを支えるSFAとかのテクノロジーで最後はフォーキャストとか報酬設計っていう組織運営の細かいところまでなんか全部が一本の線で繋がってる感じがしますねえー本当にそう思います制約のある中でどうやって成果を最大化するかそれにはやっぱり戦略的な集中とそれを可能に"
"00:08:07","00:08:08","SPEAKER_01","3位一体ですね"
"00:08:08","00:08:20","SPEAKER_00","そうですね。さて、ここまで色々見てきましたけど、これを踏まえて、リスナーのあなたが明日から自分の仕事とかチームで何か一つでも試せそうなことありますかね?"
"00:08:20","00:08:21","SPEAKER_01","うーん"
"00:08:21","00:08:24","SPEAKER_00","ちょっとそんなことを考えてみる時間になれば嬉しいです"
"00:08:24","00:08:39","SPEAKER_01","本日のセッションはここまでとさせていただきます。ぜひコメント欄に番組の感想、リスナーの皆さんが聞きたいテーマなどお気軽に書き込みいただけましたら嬉しいです。またチャンネル登録、いいねもよろしくお願いします。ではまた次回お会いしましょう。"
whisper-small.csv
"start","end","speaker","text"
"00:00:04","00:00:30","SPEAKER_01","こんにちは!ジェニービジネスサテライトラジオを 聞いていただきありがとうございますこのチャンネルは最近のビジネス市場と AIやデジタルソリューションの活用マーケティングと経営のあり方について考えていくカジュアルトーク番組ですぜひコメント欄に番組の感想、リスナーの皆さんが聞きたいテーマなどお気軽に書き込みいただけましたら嬉しいですまたチャンネル登録、いいねもよろしくお願いします"
"00:00:31","00:00:48","SPEAKER_01","さて、今回も様々な資料を読み込んできましたけど、日本の労働市場の未来からB2B戦略のABM、あとはセールステックの動向、それから営業組織のパフォーマンス管理まで、結構幅が広いですよね。"
"00:00:48","00:00:52","SPEAKER_00","そうですね まあでもそれぞれがこうつながってるんですよね"
"00:00:52","00:01:00","SPEAKER_01","ですよねこれらをつなぎ合わせて今のビジネス環境で特に大事なポイントっていうのを今日は深ぶりしていきたいなと"
"00:01:00","00:01:05","SPEAKER_00","まさに、特にやっぱり避けられないのがその 濃動力不足っていう大きな課題"
"00:01:05","00:01:15","SPEAKER_00","これに対して企業がどうやって戦略的にリソースを配分してテクノロジーを使って成長していくかその辺りのヒントを作っていきましょう"
"00:01:15","00:01:16","SPEAKER_01","はい"
"00:01:16","00:01:20","SPEAKER_00","きっとあなたの日々の業務とか将来の計画に役立つ何か発見があると思いますよ"
"00:01:20","00:01:34","SPEAKER_01","まずらのパーソルさんの労働史上の未来水景2035 これ結構インパクトありましたね2035年に労働時間が1日あたり1775万時間不足する"
"00:01:35","00:01:35","SPEAKER_00","へぇ"
"00:01:35","00:01:42","SPEAKER_01","これ、2023年の1.85倍、働き手で言うと384万人分。"
"00:01:42","00:01:44","SPEAKER_01","うーん 深刻だなぁと"
"00:01:44","00:01:49","SPEAKER_00","そうなんですよね ただあのちょっと面白いというかポイントなのが"
"00:01:50","00:01:56","SPEAKER_00","働き手の数、自体は実は増える見込みなんですよ2035年に向けて400万人ぐらい"
"00:01:56","00:01:59","SPEAKER_01","あ、そうなんですか?数は増えるのに時間が足りなくなる?"
"00:01:59","00:02:04","SPEAKER_00","それはつまりシニアの方とか女性それから外国人の方々"
"00:02:04","00:02:09","SPEAKER_00","こういう修行者が増えることで、一人当たりの労働時間があま短くなる傾向にあると。"
"00:02:09","00:02:10","SPEAKER_01","なるほど"
"00:02:10","00:02:13","SPEAKER_00","それに加えて働き方改革の影響もありますしね"
"00:02:13","00:02:14","SPEAKER_01","労働時間の短縮"
"00:02:14","00:02:21","SPEAKER_00","えぇ、資料にもありましたけど、2070年には外国人労働者が人口の1割を占めるかもしれないなんて話も。"
"00:02:21","00:02:28","SPEAKER_01","へぇーじゃあ単純に人が足りないっていうのとはちょっと違うんですね働き方の中身が変わってくると"
"00:02:28","00:02:33","SPEAKER_00","そういうことです だからあの長時間労働で頑張るマラソン型じゃなくて"
"00:02:33","00:02:34","SPEAKER_01","んふふ"
"00:02:34","00:02:40","SPEAKER_00","短い時間でみんなで効率よくつないでいくバケツリレー型みたいな 働き方に変えていく必要があるんじゃないかと"
"00:02:40","00:02:42","SPEAKER_01","バケツリレー型わかりやすいですね"
"00:02:42","00:02:47","SPEAKER_01","これ日本だけの話じゃないっていうのも資料にありましたね オランダとかスペインとか"
"00:02:47","00:02:55","SPEAKER_00","そうなんですよ やっぱり労働供給の制約っていうのは多くの先進国が直面してる課題なんですね うーん"
"00:02:55","00:03:05","SPEAKER_00","こういう環境だからこそ企業としては限られたリソースをじゃあどこに集中させるのっていうその戦略的な判断がもうめちゃくちゃ重要になってくるわけです"
"00:03:05","00:03:07","SPEAKER_01","リソース配分ですね"
"00:03:07","00:03:18","SPEAKER_00","特にサースみたいに、顧客の裾のが広がりやすいビジネスだと、本当にこれが生命戦になる。ザモデルでも言われている本質って突き詰めると、案外、こういうところにあるのかもしれないですね。"
"00:03:18","00:03:27","SPEAKER_01","なるほどそこで具体的な戦略として出てくるのがあの 才流さんのガイドブックにあったABMアカウントベースとマーケティング"
"00:03:27","00:03:28","SPEAKER_00","はいはい、DBMですね"
"00:03:28","00:03:30","SPEAKER_01","これってどういう考え方なんでしょう"
"00:03:30","00:03:46","SPEAKER_00","えーとですね、ABMっていうのはすごく簡単に言うとこの企業は将来的にすごく価値が高まりそうだとって見込んだターゲット企業をまず絞り込むんですそこにマーケティングとか営業のリソースを意図的に集中させるっていうアプローチですね"
"00:03:46","00:03:47","SPEAKER_01","選んで集中すると"
"00:03:47","00:04:06","SPEAKER_00","成功の限りになるのがそのターゲット企業に共通するキーポテンシャルってやつを見抜くこと 例えば資料にあった経理さすの例だと特定の会計ソフトを使ってる企業みたいなそういう隠れた共通行ですね これを見つける"
"00:04:06","00:04:16","SPEAKER_00","それからリレーションマップっていうのを作ってその会社の中の誰がキーパーソンで誰と誰がどういう関係なのかそれをこう見えるかするんです"
"00:04:16","00:04:18","SPEAKER_01","人間関係まで"
"00:04:19","00:04:24","SPEAKER_00","そうすることでより的確にピンポイントでアプローチできるようになるというわけです"
"00:04:24","00:04:30","SPEAKER_01","なるほどなぁ なんか 闇雲に当たるんじゃなくて 狙いを定める感じですね"
"00:04:30","00:04:36","SPEAKER_00","でもそういう戦略を実行するとなるとやっぱり道具というかテクノロジーが必要になってきそうですね"
"00:04:36","00:04:37","SPEAKER_01","まさにおっしゃる鳥です"
"00:04:38","00:04:47","SPEAKER_01","マークワイドリサーチのレポートにもありましたけど世界的にSFA営業支援システムの市場が伸びてるっていうのはまさにそういう背景があるからですよね"
"00:04:47","00:04:50","SPEAKER_00","効率化とかデータに基づいた石決定とか"
"00:04:50","00:04:51","SPEAKER_01","そうですそうです"
"00:04:51","00:04:56","SPEAKER_01","セールスポースみたいな大手はもちろん本当に色々なツールが出てきてますし"
"00:04:56","00:05:03","SPEAKER_00","国内を見ても、あの、BUメスマーケット同工でしたっけ?ITサービス、特にSASの分野がすごく伸びてる"
"00:05:03","00:05:05","SPEAKER_01","伸びてますね"
"00:05:05","00:05:13","SPEAKER_00","m&aも活発で、 nttデータさんとテラス会さんの提携とか、 あーいうのを見るとやっぱりdxの需要が高いんだなぁと"
"00:05:13","00:05:23","SPEAKER_01","えー、専門性を高めて、その需要に拘対用っていう動きですよね。ABMみたいな戦略をやる上での基盤が外の5つあるとも言えるかもしれませんね。"
"00:05:23","00:05:24","SPEAKER_00","確かに"
"00:05:24","00:05:31","SPEAKER_00","ただ、戦略があって、ツールがあっても、それを動かす、その組織のパフォーマンス管理"
"00:05:31","00:05:34","SPEAKER_00","これがちゃんとできてないと、手に書いたもちになっちゃう"
"00:05:34","00:05:41","SPEAKER_01","いやー本当にそうなんですよそこで重要になってくるのがエクザクトリーの資料にもあったフォーキャスト"
"00:05:41","00:05:43","SPEAKER_01","つまり売り上げ予測の精度"
"00:05:43","00:05:49","SPEAKER_00","フォーキャストの精度、これ営業担当者の報告を ただ足し合わせるだけじゃダメなんですよね"
"00:05:49","00:05:50","SPEAKER_01","全然ダメですね"
"00:05:51","00:05:54","SPEAKER_01","それだとどうしても希望的観測が入り込んじゃりますから"
"00:05:54","00:05:55","SPEAKER_00","ああ、確かに"
"00:05:55","00:06:09","SPEAKER_01","そうじゃなくてもっと客観的に、例えば商談がどのフェーズにあるのかちゃんと管理した上で、これはコミットほぼ確実。こっちはアップサイドまあ可能性あり、みたいに角度をちゃんと分類する。"
"00:06:09","00:06:09","SPEAKER_00","とも"
"00:06:10","00:06:21","SPEAKER_01","で、過去のデータとか、傾向値なんかも見ながら高く的に予測を組み立てていく必要があるんです目指すのは、プラスマイナス5%から10%って言われてますね"
"00:06:21","00:06:25","SPEAKER_00","プラスマイナス5%から10% かなりシビアですね"
"00:06:25","00:06:31","SPEAKER_01","シビアです。でも、これができないと、結局、さっき話したリソース配分の精度にも関わってきますから。"
"00:06:31","00:06:40","SPEAKER_00","なるほど繋がってるんですね で予測だけじゃなくて実際に社員の人たちがどう動くかそれを導く報酬設計も大事だと"
"00:06:40","00:06:45","SPEAKER_01","まさにそこが気持です。人は何で評価されるかで行動が決まりますからね。"
"00:06:45","00:06:46","SPEAKER_00","ですよね"
"00:06:46","00:06:59","SPEAKER_01","会社の戦略として今はとにかく新規顧客を獲得してほしいとかこの新しいプロダクトを売ってほしいとかそういう意図があるんだったらそれをインセンティブプラン報酬の仕組みにちゃんと反映させないと"
"00:06:59","00:07:02","SPEAKER_00","具体的にはどういう工夫が考えられますか"
"00:07:02","00:07:05","SPEAKER_01","例えば、達成率によってコミッションのレートを変えるとか"
"00:07:06","00:07:11","SPEAKER_01","あとは担当する顧客の規模によって評価する期間を変えるとかですね"
"00:07:12","00:07:19","SPEAKER_01","SMB担当なら月時で細かく見て、エンタープライズ担当なら市販機とか年時とか少し長いスパンで評価するとか"
"00:07:19","00:07:20","SPEAKER_00","なるほど"
"00:07:20","00:07:22","SPEAKER_00","評価サイクルも大事なんですね"
"00:07:22","00:07:28","SPEAKER_01","そうやってモチベーションを維持しつつ 会社の戦略目標達成につなげていくわけです"
"00:07:28","00:08:07","SPEAKER_00","いやー今回の資料いろいろありましたけど労働力不足っていう大きなマクロな変化から始まってABMみたいな具体的な戦略それを支えるSFAとかのテクノロジーで最後はフォーキャストとか報酬設計っていう組織運営の細かいところまでなんか全部が1本の線でつながってる感じがしますねええ、本当にそう思います制約のある中でどうやって成果を最大化するかそれにはやっぱり戦略的な集中とそれを可能に"
"00:08:07","00:08:08","SPEAKER_01","3位1体ですね"
"00:08:08","00:08:20","SPEAKER_00","そうですね。さて、ここまで色々見てきましたけど、これを踏まえて、あなたが、リスナーのあなたが明日から自分の仕事とかチームで何か一つでも試せそうなことをありますかね。"
"00:08:20","00:08:21","SPEAKER_01","んー"
"00:08:21","00:08:24","SPEAKER_00","ちょっとそんなことを考えてみる時間になれば嬉しいです"
"00:08:24","00:08:39","SPEAKER_01","本日のセッションはここまでとさせていただきますぜひコメント欄に番組の感想、リスナーの皆さんが聞きたいテーマなどお気軽に書き込みいただきましたら嬉しいですまたチャンネル登録、いいねもよろしくお願いしますではまた次回お会いしましょう"
kotoba-tech/kotoba-whisper-v2.2.csv
"start","end","speaker","text"
"00:00:04","00:00:30","SPEAKER_01","こんにちはジニービジネスサテライトラジオを聞いていただきありがとうございますこのチャンネルは最近のビジネス市場とAIやリジタルソリューションの活用マーケティングと経営のあり方について考えていくカジュアルトーク番組ですぜひコメントランに聞きたいテーマなどお気軽に書き込みいただけましたらうれです"
"00:00:31","00:00:48","SPEAKER_01","さて今回も様々な資料を読み込んできましたけど日本の労働市場の未来からB-B-B戦略のABABABABの同行それから営業組織のパフォーマンス管理まで結構幅が広いですよね"
"00:00:48","00:00:52","SPEAKER_00","そうですねまあでもそれぞれがつながってるんですよね"
"00:00:52","00:01:00","SPEAKER_01","これらをつなぎ合わせて今のビジネス環境で特に大事なポイントっていうのを今日は深ぶりしていきたいなと"
"00:01:00","00:01:05","SPEAKER_00","まさに特にやっぱり避けられないのがその労働力不足っていう大きな課題"
"00:01:05","00:01:15","SPEAKER_00","これに対して企業がどうやって戦略的にリソースを配分してテクノロジーを使って成長していくかそのあたりのヒントを探っていきましょう"
"00:01:15","00:01:16","SPEAKER_01","はい"
"00:01:16","00:01:20","SPEAKER_00","きっとあなたの日々の業務とか将来の計画に役立つ何か発見があると思いますよ"
"00:01:20","00:01:34","SPEAKER_01","マズラのパーソルさんの労働市場の未来推計2035これ結構インパクトあり、2035年に労働時間が1日当たり1775万時間不足する"
"00:01:35","00:01:35","SPEAKER_00","へえ"
"00:01:35","00:01:42","SPEAKER_01","これ2023年の1.85倍働き手でいうと384万人分"
"00:01:42","00:01:44","SPEAKER_01","深刻だなと"
"00:01:44","00:01:49","SPEAKER_00","そうなんですよね。ただ、ちょっと面白いというかポイントなのが"
"00:01:50","00:01:56","SPEAKER_00","働き手の数自体は実は増える見込みなんですよ2035年に向けて400万人ぐらい"
"00:01:56","00:01:59","SPEAKER_01","そうなんですか数は増えるのに時間が足りなくなる?"
"00:01:59","00:02:04","SPEAKER_00","それはつまりシニアの方とか女性それから外国人の方々"
"00:02:04","00:02:09","SPEAKER_00","こういう就業者が増えることで1人当たりの労働時間が短くなる傾向にあると"
"00:02:09","00:02:10","SPEAKER_01","なるほど"
"00:02:10","00:02:13","SPEAKER_00","それに加えて働き方改革の影響もありますしね"
"00:02:13","00:02:14","SPEAKER_01","労働時間の短縮"
"00:02:14","00:02:21","SPEAKER_00","資料にもありましたけど2070年には外国人労働者が人口の1割を占めるかもしれないなんて話も"
"00:02:21","00:02:28","SPEAKER_01","じゃあ単純に人が足りないっていうのとはちょっと違うんですね働き方の中身が変わってくると"
"00:02:28","00:02:33","SPEAKER_00","そういうことですだから長時間労働で頑張るマラソン型じゃなくて"
"00:02:33","00:02:34","SPEAKER_01","うん"
"00:02:34","00:02:40","SPEAKER_00","短い時間でみんなで効率よくつないでいくバケツリレー型みたいな働き方に変えていく必要があるんじゃないかと"
"00:02:40","00:02:42","SPEAKER_01","バケツリレー型分かりやすいですね"
"00:02:42","00:02:47","SPEAKER_01","これ日本だけの話じゃないっていうのも資料にありましたねオランダとかスペインとか"
"00:02:47","00:02:55","SPEAKER_00","そうなんですよ。やっぱり労働供給の制約っていうのは多くの先進国が直面してる課題なんですね。"
"00:02:55","00:03:05","SPEAKER_00","こういう環境だからこそ企業としては限られたリソースをじゃあどこに集中させるの?っていうその戦略的な判断がもうめちゃくちゃ重要になってくるわけです"
"00:03:05","00:03:07","SPEAKER_01","リソース配分ですね"
"00:03:07","00:03:18","SPEAKER_00","特にサースみたいに顧客の裾野が広がりやすいビジネスだと本当にこれが生命線になるあのザモデルでも言われている本質って突き詰めると案外こういうところにあるのかもしれないですね"
"00:03:18","00:03:27","SPEAKER_01","なるほどそこで具体的な戦略として出てくるのがあの財流さんのガイドブックにあったABABアカウントベーストマーケティング"
"00:03:27","00:03:28","SPEAKER_00","はいはいABMですね"
"00:03:28","00:03:30","SPEAKER_01","これってどういう考え方なんでしょう"
"00:03:30","00:03:46","SPEAKER_00","A.Mっていうのはすごく簡単に言うとこの企業は将来的にすごく価値が高まりそうだそうって見込んだターゲット企業をまず絞り込むんですそこにマーケティングとか営業のリソースを意図的に集中させるというアプローチですねなるほど"
"00:03:46","00:03:47","SPEAKER_01","選んで集中すると"
"00:03:47","00:04:06","SPEAKER_00","成功の限りになるのがそのターゲット企業に共通するキーポテンシャルってやつを見抜くことはい例えば資料にあった経理サスの例だと特定の会計ソフトを使っている企業みたいなそういう隠れた共通項ですねこれを見つける"
"00:04:06","00:04:16","SPEAKER_00","それからリレーションマップっていうのを作ってその会社の中の誰がキーパーソンで誰と誰がどういう関係なのかそれを見える化するんです"
"00:04:16","00:04:18","SPEAKER_01","人間関係まで"
"00:04:19","00:04:24","SPEAKER_00","そうすることでより手角にピンポイントでアプローチできるようになるというわけです"
"00:04:24","00:04:30","SPEAKER_01","なるほどななんか闇雲に当たるんじゃなくて狙いを定める感じですね"
"00:04:30","00:04:36","SPEAKER_00","でもそういう戦略を実行するとなるとやっぱり道具というかテクノロジーが必要になってきそうですね"
"00:04:36","00:04:37","SPEAKER_01","まさにおっしゃる通りです"
"00:04:38","00:04:47","SPEAKER_01","マークワイドリサーチのレポートにもありましたけど世界的にSFA営業支援システムの市場が伸びてるっていうのはまさにそういう背景があるからですよね"
"00:04:47","00:04:50","SPEAKER_00","効率化とかデータに基づいた意思決定とか"
"00:04:50","00:04:51","SPEAKER_01","そうですそうです"
"00:04:51","00:04:56","SPEAKER_01","セールスフォースみたいな大手はもちろん本当に色々なツールが出てきてますし"
"00:04:56","00:05:03","SPEAKER_00","国内を見てもBMSマーケット同行でしたっけ?ITサービス特にSの分野がすごく伸びてる"
"00:05:03","00:05:05","SPEAKER_01","伸びてますね"
"00:05:05","00:05:13","SPEAKER_00","M&Aも活発でNTTデータさんとテラスカイさんの提携とかああいうのを見るとやっぱりDXの需要が高いんだなと"
"00:05:13","00:05:23","SPEAKER_01","えー、専門性を高めてその需要に応えようという動きですよね。ABMみたいな戦略をやる上での基盤が整いつつあるとも言えるかもしれませんね。"
"00:05:23","00:05:24","SPEAKER_00","確かに"
"00:05:24","00:05:31","SPEAKER_00","ただ戦略があってツールがあってもそれを動かすその組織のパフォーマンス管理"
"00:05:31","00:05:34","SPEAKER_00","これがちゃんとできてないと絵に描いた文字になっちゃう"
"00:05:34","00:05:41","SPEAKER_01","いや本当にそうなんですよそこで重要になってくるのがエクザクトリーの資料にもあったフォーキャスト"
"00:05:41","00:05:43","SPEAKER_01","つまり売上予測の精度"
"00:05:43","00:05:49","SPEAKER_00","フォーキャストの精度、これ営業担当者の報告をただ足し合わせるだけじゃダメなんですよね"
"00:05:49","00:05:50","SPEAKER_01","全然ダメですね"
"00:05:51","00:05:54","SPEAKER_01","それだとどうしても希望的観測が入り込んでありますから"
"00:05:54","00:05:55","SPEAKER_00","ああ確かに"
"00:05:55","00:06:09","SPEAKER_01","そうじゃなくてもっと客観的に例えば商談がどのフェーズにあるのかちゃんと管理した上でこれはコミットほぼ確実こっちはアップサイドまあ可能性ありみたいに角度をちゃんと分類する"
"00:06:09","00:06:09","SPEAKER_00","ふむ"
"00:06:10","00:06:21","SPEAKER_01","過去のデータとか傾向値なんかも見ながら多角的に予測を組み立てていく必要があるんです目指すのはプラスマイナス5%から10%って言われてますね"
"00:06:21","00:06:25","SPEAKER_00","プラスマイナス5%から10%かなりシビアですね"
"00:06:25","00:06:31","SPEAKER_01","でもこれができないと結局さっき話したリソース配分の制度にも関わってきますから"
"00:06:31","00:06:40","SPEAKER_00","なるほど、つながってるんですね。で、予測だけじゃなくて、実際に社員の人たちがどう動くか、それを導く方針設計も大事だと。"
"00:06:40","00:06:45","SPEAKER_01","まさにそこが肝です人は何で評価されるかで行動が決まりますからね"
"00:06:45","00:06:46","SPEAKER_00","ですよね"
"00:06:46","00:06:59","SPEAKER_01","今はとにかく新規顧客を獲得してほしいとかこの新しいプロダクトを売ってほしいとかそういう意図があるんだったらそれをインセンティブプラン報酬の仕組みにちゃんと反映させないと"
"00:06:59","00:07:02","SPEAKER_00","画体的にはどういう工夫が考えられますか"
"00:07:02","00:07:05","SPEAKER_01","例えば達成率によってコミッションのレートを変えるとか"
"00:07:06","00:07:11","SPEAKER_01","あとは担当する顧客の規模によって評価する期間を変えるとかですね"
"00:07:12","00:07:19","SPEAKER_01","SMB担当なら築地で細かく見てエンタープライズ担当なら市販機とか年時とか少し長いスパンで評価するとか"
"00:07:19","00:07:20","SPEAKER_00","なるほど"
"00:07:20","00:07:22","SPEAKER_00","評価サイクルも大事なんですね"
"00:07:22","00:07:28","SPEAKER_01","そうやってモチベーションを維持しつつ会社の戦略目標達成につなげていくわけです"
"00:07:28","00:08:07","SPEAKER_00","今回の資料いろろありましたけど労働力不足という大きなマクロな変化から始まってABMみたいな戦略それを支える制約の中でそれを支えるセクノロジーで最後はフォーシェクトとか法集計という組織組織という組織が全部が全部が一本の線でつながって成果をするかそれにそう思います"
"00:08:07","00:08:08","SPEAKER_01","3位一体ですね"
"00:08:08","00:08:20","SPEAKER_00","さてここまでいろいろ見てきましたけどこれを踏まえてあなたがリスナーのあなたが明日から自分の仕事とかチームで何か一つでも試せそうなことありますかね"
"00:08:20","00:08:21","SPEAKER_01","うん"
"00:08:21","00:08:24","SPEAKER_00","ちょっとそんなことを考えてみる時間になれば嬉しいです"
"00:08:24","00:08:39","SPEAKER_01","本日のセッションはここまでとさせていただきますぜひコメント欄に番組の感想リスナーの皆さんが聞きたいテーマなどお気軽に書き込みいただけましたら嬉しいですまたチャンネル登録いいねもよろしくお願いしますではまた次回お会いしましょう"
kotoba-tech/kotoba-whisper-bilingual-v1.0.csv
"start","end","speaker","text"
"00:00:04","00:00:30","SPEAKER_01","こんにちはジェニービジネスサテライトラジオを聞いていただきありがとうございますは最近のビジネス市場とAIやデジタルソリューションの活用に考えていくカジュアルトーク番組ですぜひコメント欄に聞きたいテーマなどお気軽に書き込みいただけましたら嬉しいですらお楽しみによろしくお願いします"
"00:00:31","00:00:48","SPEAKER_01","さて今回も様々な資料を読み込んできましたけど日本の労働市場の未来からB-to-B-B-TALステックの動向、それから営業組織のパフォーマンス管理まで結構幅が広いですよね"
"00:00:48","00:00:52","SPEAKER_00","そうですねまあでもそれぞれがつながってるんですよね"
"00:00:52","00:01:00","SPEAKER_01","ですよねこれらをつなぎ合わせて今のビジネス環境で特に大事なポイントっていうのを今日は深ぶりしていきたいなと"
"00:01:00","00:01:05","SPEAKER_00","まさに特にやっぱり避けられないのがその労働力不足っていう大きな課題"
"00:01:05","00:01:15","SPEAKER_00","これに対して企業がどうやって戦略的にリソースを配分してテクノロジーを使って成長していくかその辺りのヒントを探っていきましょう"
"00:01:15","00:01:16","SPEAKER_01","はい"
"00:01:16","00:01:20","SPEAKER_00","きっとあなたの日々の業務とか将来の計画に役立つ何か発見があると思いますよ"
"00:01:20","00:01:34","SPEAKER_01","マズラのパーソルさんの労働市場の未来推計20355これ結構インパクトありましたね2035年に労働時間が1日当たり1775万時間不足する"
"00:01:35","00:01:35","SPEAKER_00","へえ"
"00:01:35","00:01:42","SPEAKER_01","これ2023年の1.85倍働き手でいうと384万人分"
"00:01:42","00:01:44","SPEAKER_01","うん深刻だなと"
"00:01:44","00:01:49","SPEAKER_00","そうなんですよね。ただちょっと面白いというかポイントなのが"
"00:01:50","00:01:56","SPEAKER_00","働き手の数自体は実は増える見込みなんですよ2035年に向けて400万人ぐらい"
"00:01:56","00:01:59","SPEAKER_01","そうなんですか数は増えるのに時間が足りなくなる?"
"00:01:59","00:02:04","SPEAKER_00","それはつまりシニアの方とか女性それから外国人の方々"
"00:02:04","00:02:09","SPEAKER_00","こういう就業者が増えることで1人当たりの労働時間が短くなる傾向にあると"
"00:02:09","00:02:10","SPEAKER_01","なるほど"
"00:02:10","00:02:13","SPEAKER_00","それに加えて働き方改革の影響もありますしね"
"00:02:13","00:02:14","SPEAKER_01","労働時間の短縮"
"00:02:14","00:02:21","SPEAKER_00","資料にもありましたけど2070年には外国人労働者が人口の1割を占めるかもしれないなんて話も"
"00:02:21","00:02:28","SPEAKER_01","じゃあ単純に人が足りないっていうのとはちょっと違うんですね働き方の中身が変わってくると"
"00:02:28","00:02:33","SPEAKER_00","そういうことですだから長時間労働で頑張るマラソン型じゃなくて"
"00:02:33","00:02:34","SPEAKER_01","うんうん"
"00:02:34","00:02:40","SPEAKER_00","短い時間でみんなで効率よくつないでいくバケツリレー型みたいな働き方に変えていく必要があるんじゃないかと"
"00:02:40","00:02:42","SPEAKER_01","バケツリレー型分かりやすいですね"
"00:02:42","00:02:47","SPEAKER_01","これ日本だけの話じゃないっていうのもあの資料にありましたねオランダとかスペインとか"
"00:02:47","00:02:55","SPEAKER_00","そうなんですよやっぱり労働供給の制約っていうのは多くの先進国が直面してる課題なんですねうん"
"00:02:55","00:03:05","SPEAKER_00","こういう環境だからこそ企業としては限られたリソースをじゃあどこに集中させるのっていうその戦略的な判断がめちゃくちゃ重要になってくるわけです"
"00:03:05","00:03:07","SPEAKER_01","リソース配分ですね"
"00:03:07","00:03:18","SPEAKER_00","特にサースみたいに顧客の裾野が広がりやすいビジネスだと本当にこれが生命線になるあのザモデルでも言われてる本質って突き詰めると案外こういうところにあるのかもしれないですね"
"00:03:18","00:03:27","SPEAKER_01","なるほどそこで具体的な戦略として出てくるのがあの財流さんのガイドブックにあったABMアカウントベーストマーケティング"
"00:03:27","00:03:28","SPEAKER_00","はいはいABMですね"
"00:03:28","00:03:30","SPEAKER_01","これってどういう考え方なんでしょう"
"00:03:30","00:03:46","SPEAKER_00","えーとですねABMっていうのはすごく簡単に言うとこの企業は将来的にすごく価値が高まりそうだそうって見込んだターゲット企業をまず絞り込むんですふもふもでそこにマーケティングとか営業のリソースを意図的に集中させるっていうアプローチですねなるほど"
"00:03:46","00:03:47","SPEAKER_01","選んで集中すると"
"00:03:47","00:04:06","SPEAKER_00","成功の鍵になるのがそのターゲット企業に共通するキーポテンシャルってやつを見抜くことキーポテンシャルはい例えば資料にあった経理サスの例だと特定の会計ソフトを使っている企業みたいなそういう隠れた共通口ですねこれを見つける"
"00:04:06","00:04:16","SPEAKER_00","それからリレーションマップっていうのを作ってその会社の中の誰がキーパーソンで誰と誰がどういう関係なのかそれを見える化するんです"
"00:04:16","00:04:18","SPEAKER_01","ああ人間関係まで"
"00:04:19","00:04:24","SPEAKER_00","そうすることでより手角にピンポイントでアプローチできるようになるというわけです"
"00:04:24","00:04:30","SPEAKER_01","なるほどななんか闇雲に当たるんじゃなくて狙いを定める感じですね"
"00:04:30","00:04:36","SPEAKER_00","でもそういう戦略を実行するとなるとやっぱり道具というかテクノロジーが必要になってきそうですね"
"00:04:36","00:04:37","SPEAKER_01","まさにおっしゃるとおりです"
"00:04:38","00:04:47","SPEAKER_01","マークワイドリサーチのレポートにもありましたけど世界的にSFAA営支援システムの市場が伸びてるっていうのはまさにそういう背景があるからですよね"
"00:04:47","00:04:50","SPEAKER_00","効率化とかデータに基づいた意思決定とか"
"00:04:50","00:04:51","SPEAKER_01","そうですそうです"
"00:04:51","00:04:56","SPEAKER_01","セールスフォースみたいな大手はもちろん本当にいろいろなツールが出てきてますし"
"00:04:56","00:05:03","SPEAKER_00","国内を見てもBMSマーケット動向でしたっけITサービス特にサスの分野がすごく伸びてる"
"00:05:03","00:05:05","SPEAKER_01","伸びてますね"
"00:05:05","00:05:13","SPEAKER_00","M&Aも活発でNTTデータさんとテラスカイさんの提携とかああいうのを見るとやっぱりDXの需要が高いんだなと"
"00:05:13","00:05:23","SPEAKER_01","ええ専門性を高めてその需要に応えようという動きですよねABMみたいな戦略をやる上での基盤が整いつつあるとも言えるかもしれませんね"
"00:05:23","00:05:24","SPEAKER_00","確かに"
"00:05:24","00:05:31","SPEAKER_00","ただ戦略があってツールがあってもそれを動かすその組織のパフォーマンス管理"
"00:05:31","00:05:34","SPEAKER_00","これがちゃんとできてないと絵に描いた餅になっちゃう"
"00:05:34","00:05:41","SPEAKER_01","いや本当にそうなんですよそこで重要になってくるのがエクザクトリーの資料にもあったフォーキャスト"
"00:05:41","00:05:43","SPEAKER_01","つまり売上測の精度"
"00:05:43","00:05:49","SPEAKER_00","フォーキャストの精度これ営業担当者の報告をただ足し合わせるだけじゃダメなんですよね"
"00:05:49","00:05:50","SPEAKER_01","全然ダメですね"
"00:05:51","00:05:54","SPEAKER_01","それだとどうしても希望的観測が入り込んじゃりますから"
"00:05:54","00:05:55","SPEAKER_00","ああ確かに"
"00:05:55","00:06:09","SPEAKER_01","そうじゃなくてもっと客観的に例えば商談がどのフェーズにあるのかちゃんと管理した上でこれはコミットほぼ確実こっちはアップサイドまあ可能性ありみたいに角度をちゃんと分類する"
"00:06:09","00:06:09","SPEAKER_00","ふむふむ"
"00:06:10","00:06:21","SPEAKER_01","過去のデータとか傾向値なんかも見ながら多角的に予測を組み立てていく必要があるんです。目指すのはプラスマイナス5%から10%って言われてますね"
"00:06:21","00:06:25","SPEAKER_00","プラスマイナス5%から10%かなりシビアですね"
"00:06:25","00:06:31","SPEAKER_01","シビアですでもこれができないと結局さっき話したリソース配分の制度にも関わってきますから"
"00:06:31","00:06:40","SPEAKER_00","なるほどつながってるんですねで予測だけじゃなくて実際に社員の人たちがどう動くかそれを導く報酬設計も大事だと"
"00:06:40","00:06:45","SPEAKER_01","まさにそこが肝です人は何で評価されるかで行動が決まりますからね"
"00:06:45","00:06:46","SPEAKER_00","ですよね"
"00:06:46","00:06:59","SPEAKER_01","会社の戦略として今はとにかく新規顧客を獲得してほしいとかこの新しいプロダクトを売ってほしいとかそういう意図があるんだったらそれをインセンティブプラン報酬の仕組みにちゃんと反映させないと"
"00:06:59","00:07:02","SPEAKER_00","画体的にはどういう工夫が考えられますか?"
"00:07:02","00:07:05","SPEAKER_01","例えば達成率によってコミッションのレートを変えるとか"
"00:07:06","00:07:11","SPEAKER_01","あとは担当する顧客の規模によって評価する期間を変えるとかですね"
"00:07:12","00:07:19","SPEAKER_01","SMB担当なら月地で細かく見てエンタープライズ担当なら市販機とか年時とか少し長いスパンで評価するとか"
"00:07:19","00:07:20","SPEAKER_00","なるほど"
"00:07:20","00:07:22","SPEAKER_00","評価サイクルも大事なんですね"
"00:07:22","00:07:28","SPEAKER_01","そうやってモチベーションを維持しつつ会社の戦略目標達成につなげていくわけです"
"00:07:28","00:08:07","SPEAKER_00","いや今回の資料いろいろありましたけど労働力不足っていう大きなマクロな変化から始まって、ABMみたいな具体的な戦略、それを支えるセクノロジー、最後はフォーキャストとか報酬設計という組織運営の細かいところまで全部が一本の線でつながってつながってつながってつながっている感じがしますね。本当にそう思います。"
"00:08:07","00:08:08","SPEAKER_01","3位一体ですね"
"00:08:08","00:08:20","SPEAKER_00","そうですねさてここまでいろいろ見てきましたけどこれを踏まえてあなたがリスナーのあなたが明日から自分の仕事とかチームで何か一つでも試せそうなことありますかね"
"00:08:20","00:08:21","SPEAKER_01","うん"
"00:08:21","00:08:24","SPEAKER_00","ちょっとそんなことを考えてみる時間になれば嬉しいです"
"00:08:24","00:08:39","SPEAKER_01","本日のセッションはここまでとさせていただきますぜひコメントランに番組の感想、リスナーの皆さんが聞きたいテーマなどお気軽に書き込みいただきましたら嬉しいですまたチャンネル登録、いいねもよろしくお願いします。ではまた次回お会いしましょう。"

考察 (処理時間と文字起こし精度):

  • 処理速度:
    • openai/whisper-small は実時間の約1/5 (113秒) で処理を完了。
    • openai/whisper-mediumkotoba-tech モデルは実時間の約60% (300-330秒) 。
    • openai/whisper-large-v3 は最も遅く、実時間に近い466秒を要する。
  • 文字起こし精度 (詳細結果は省略):
    • openai/whisper-large-v3: 最も高精度。固有名詞・専門用語の認識、句読点挿入が良好。全体的に最も高品質な結果。
    • openai/whisper-medium: large-v3 に次ぐ精度。一部固有名詞等で差はあるが、速度と精度のバランスは良い。
    • openai/whisper-small: 最速だが誤りが最も多い。単語誤認識 (例: 労働力→濃動力) が散見される。速度優先時の選択肢だが、精度には注意が必要。
    • kotoba-tech モデル (v2.2, bilingual-v1.0): 今回の音声では medium と同程度の速度・精度。専門用語認識 (例: ABM→ABABAB) や言い回しに特有の癖が見られる。
  • 総評:
    • 今回の実験環境 (MacBook Air M3, CPU実行) では、速度重視なら small、精度重視なら large-v3 が適している。
    • mediumkotoba-tech モデルは、速度と精度のバランスを取りたい場合の選択肢となる。

まとめ

本記事では、Google NotebookLMの音声概要機能を他の音声合成ソフトで再現するプロジェクトの第一歩として、ローカル環境で音声ファイルの話者分離と文字起こしを行う方法について解説しました。

  • 話者分離には pyannote/speaker-diarization-3.1、文字起こしには Whisper (例: whisper-large-v3) を利用するPythonプログラムを作成し、その使い方と簡易版コードを紹介しました。
  • 開発したプログラムはGitHubリポジトリで公開しています。

https://github.com/hikaru-shiga-geniee/audio-diarization-transcript

  • さらに、MacBook Air (M3) 環境において、複数のWhisperモデル (large-v3, medium, small, kotoba-tech系) を用いた際の処理時間と文字起こし精度を比較しました。

次回予告:

次回の記事では話者分離済みの文字起こしデータを利用して、実際に音声を合成する方法について解説する予定です。具体的には、人気のある音声合成エンジンである VOICEVOX や、高品質な音声合成を実現できる Style-Bert-VITS2 などの技術を用いて、テキストデータを任意の声で読み上げる手順を紹介します。

GENIEE TechBlog
GENIEE TechBlog

Discussion