🙊

Windowsでwhisper.cpp(GPU)を動かす

2024/06/16に公開

Windows(Visual Studio)でwhisper.cpp(CUDA)を動かすための手順を記録。
(観測範囲内で同じことやってる記事はなかったのでいいよね?)

基本的には、whisper.cppのCIを参考にビルドしていく

ビルド環境

Visual Studio:2022
インストールオプション:

cmake 3.20.0(Visual Studio付属)
Windows: 11, 24H2(OSビルド26100.712)
GPU: 3070 Ti(8GB)
CUDA 12.4.1

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2024 NVIDIA Corporation
Built on Thu_Mar_28_02:30:10_Pacific_Daylight_Time_2024
Cuda compilation tools, release 12.4, V12.4.131
Build cuda_12.4.r12.4/compiler.34097967_0

環境構築

CUDA Toolkit をダウンロード、インストール
環境変数の確認

Visual Studio 2022を Visual Studio Installer経由でインストール
何度か再起動

whisper.cppをクローン

ビルド

Visual Studioでクローンしたwhisper.cppのフォルダを開いて、PowerShellを起動

buildフォルダにプロジェクト作成

cmake -S . -B ./build -A x64 -DCMAKE_BUILD_TYPE=Release -DWHISPER_CUDA=ON
ログ

PS J:\repository\whisper.cpp> cmake -S . -B ./build -A x64 -DCMAKE_BUILD_TYPE=Release -DWHISPER_CUDA=ON
-- Building for: Visual Studio 16 2019
-- The C compiler identification is MSVC 19.29.30154.0
-- The CXX compiler identification is MSVC 19.29.30154.0
-- Detecting C compiler ABI info
-- Detecting C compiler ABI info - done
-- Check for working C compiler: C:/Program Files (x86)/Microsoft Visual Studio/2019/Community/VC/Tools/MSVC/14.29.30133/bin/Hostx64/x64/cl.exe - skipped
-- Detecting C compile features
-- Detecting C compile features - done
-- Detecting CXX compiler ABI info
-- Detecting CXX compiler ABI info - done
-- Check for working CXX compiler: C:/Program Files (x86)/Microsoft Visual Studio/2019/Community/VC/Tools/MSVC/14.29.30133/bin/Hostx64/x64/cl.exe - skipped
-- Detecting CXX compile features
-- Detecting CXX compile features - done
-- Found Git: C:/Program Files/Git/cmd/git.exe (found version "2.28.0.windows.1")
-- Looking for pthread.h
-- Looking for pthread.h - not found
-- Found Threads: TRUE
-- Found CUDAToolkit: C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v12.4/include (found version "12.4.131")
-- cuBLAS found
-- The CUDA compiler identification is NVIDIA 12.4.131
-- Detecting CUDA compiler ABI info
-- Detecting CUDA compiler ABI info - done
-- Check for working CUDA compiler: C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v12.4/bin/nvcc.exe - skipped
-- Detecting CUDA compile features
-- Detecting CUDA compile features - done
-- CMAKE_SYSTEM_PROCESSOR: AMD64
-- x86 detected
-- GGML CUDA sources found, configuring CUDA architecture
-- GGML Configuring CUDA architectures 52;61;70
-- Configuring done
-- Generating done
-- Build files have been written to: J:/repository/whisper.cpp/build

buildフォルダでビルド
結構時間がかかるので待つ

cd build
cmake --build . --config Release
ログ(長いので最後らへんだけ)

whisper-mel-cuda.cu
tmpxft_00005a34_00000000-7_whisper-mel-cuda.compute_70.cudafe1.cpp
ggml.c
ggml-alloc.c
ggml-backend.c
ggml-quants.c
コードを生成中...
whisper.cpp
ライブラリ J:/repository/whisper.cpp/build/Release/whisper.lib とオブジェクト J:/repository/whisper.cpp/build/Release/whisper.exp を作成中
whisper.vcxproj -> J:\repository\whisper.cpp\build\bin\Release\whisper.dll
Building Custom Rule J:/repository/whisper.cpp/examples/bench/CMakeLists.txt
bench.cpp
bench.vcxproj -> J:\repository\whisper.cpp\build\bin\Release\bench.exe
Building Custom Rule J:/repository/whisper.cpp/examples/CMakeLists.txt
common.cpp
common-ggml.cpp
grammar-parser.cpp
コードを生成中...
common.vcxproj -> J:\repository\whisper.cpp\build\examples\Release\common.lib
Building Custom Rule J:/repository/whisper.cpp/examples/main/CMakeLists.txt
main.cpp
main.vcxproj -> J:\repository\whisper.cpp\build\bin\Release\main.exe
Building Custom Rule J:/repository/whisper.cpp/examples/quantize/CMakeLists.txt
quantize.cpp
quantize.vcxproj -> J:\repository\whisper.cpp\build\bin\Release\quantize.exe
Building Custom Rule J:/repository/whisper.cpp/examples/server/CMakeLists.txt
server.cpp
server.vcxproj -> J:\repository\whisper.cpp\build\bin\Release\server.exe
Building Custom Rule J:/repository/whisper.cpp/CMakeLists.txt

ビルドが終わるとwhisper.cpp/build/bin/Release にexeとdllが出来できている。

どうやらexeがdllを参照しているようなので、実行するときは同じ階層に置いておく必要があった。

あとCUDAでビルドしているのでCUDAのdllは参照できるようにしておく必要がある。
パッケージ化する際は一緒に入れておく必要があるだろう。

使ってみる

main.exewhisper.dllだけコピーする モデルファイルggml-xxxもダウンロード、文字起こしする音声ファイルも用意

ターミナルで以下のコマンドを実行

.\main.exe -m ggml-large-v2.bin -f sample.wav -l ja -fa
whisperの最初と最後の方の出力

.\main.exe -m ggml-large-v2.bin -f sample.wav -l ja -fa
whisper_init_from_file_with_params_no_state: loading model from 'ggml-large-v2.bin'
whisper_init_with_params_no_state: use gpu = 1
whisper_init_with_params_no_state: flash attn = 1
whisper_init_with_params_no_state: gpu_device = 0
whisper_init_with_params_no_state: dtw = 0
whisper_model_load: loading model
whisper_model_load: n_vocab = 51865
whisper_model_load: n_audio_ctx = 1500
whisper_model_load: n_audio_state = 1280
whisper_model_load: n_audio_head = 20
whisper_model_load: n_audio_layer = 32
whisper_model_load: n_text_ctx = 448
whisper_model_load: n_text_state = 1280
whisper_model_load: n_text_head = 20
whisper_model_load: n_text_layer = 32
whisper_model_load: n_mels = 80
whisper_model_load: ftype = 1
whisper_model_load: qntvr = 0
whisper_model_load: type = 5 (large)
whisper_model_load: adding 1608 extra tokens
whisper_model_load: n_langs = 99
whisper_backend_init: using CUDA backend
ggml_cuda_init: GGML_CUDA_FORCE_MMQ: no
ggml_cuda_init: CUDA_USE_TENSOR_CORES: yes
ggml_cuda_init: found 1 CUDA devices:
Device 0: NVIDIA GeForce RTX 3070 Ti, compute capability 8.6, VMM: yes
whisper_model_load: CUDA0 total size = 3093.99 MB
whisper_model_load: model size = 3093.99 MB
whisper_backend_init: using CUDA backend
whisper_mel_init: n_len = 3001, n_len_org = 1, n_mel = 80
whisper_init_state: kv self size = 251.66 MB
whisper_init_state: kv cross size = 251.66 MB
whisper_init_state: kv pad size = 7.86 MB
whisper_init_state: compute buffer (conv) = 34.82 MB
whisper_init_state: compute buffer (encode) = 285.86 MB
whisper_init_state: compute buffer (cross) = 9.38 MB
whisper_init_state: compute buffer (decode) = 99.23 MB

system_info: n_threads = 4 / 16 | AVX = 1 | AVX2 = 1 | AVX512 = 0 | FMA = 1 | NEON = 0 | ARM_FMA = 0 | METAL = 0 | F16C = 1 | FP16_VA = 0 | WASM_SIMD = 0 | BLAS = 1 | SSE3 = 1 | SSSE3 = 1 | VSX = 0 | CUDA = 1 | COREML = 0 | OPENVINO = 0

main: processing 'sample.wav' (29104262 samples, 1819.0 sec), 4 threads, 1 processors, 5 beams + best of 5, lang = ja, task = transcribe, timestamps = 1 ...

whisper_mel_init: n_len = 184901, n_len_org = 181901, n_mel = 80


whisper_print_timings:     load time =  2016.45 ms
whisper_print_timings:     fallbacks =   0 p /   0 h
whisper_print_timings:      mel time =  1161.65 ms
whisper_print_timings:   sample time = 17146.38 ms / 38667 runs (    0.44 ms per run)
whisper_print_timings:   encode time =  7605.12 ms /    69 runs (  110.22 ms per run)
whisper_print_timings:   decode time =  1467.35 ms /   162 runs (    9.06 ms per run)
whisper_print_timings:   batchd time = 98492.02 ms / 38163 runs (    2.58 ms per run)
whisper_print_timings:   prompt time =  1992.00 ms / 15338 runs (    0.13 ms per run)
whisper_print_timings:    total time = 130110.01 ms

flash attentionが有効化されている

whisper_init_with_params_no_state: use gpu    = 1
whisper_init_with_params_no_state: flash attn = 1
whisper_init_with_params_no_state: gpu_device = 0
whisper_init_with_params_no_state: dtw        = 0

CUDAが有効化されている

system_info: n_threads = 4 / 16 | AVX = 1 | AVX2 = 1 | AVX512 = 0 | FMA = 1 | NEON = 0 | ARM_FMA = 0 | METAL = 0 | F16C = 1 | FP16_VA = 0 | WASM_SIMD = 0 | BLAS = 1 | SSE3 = 1 | SSSE3 = 1 | VSX = 0 | CUDA = 1 | COREML = 0 | OPENVINO = 0

利用するGPU、largeモデルでも3100MB程度しかGPU利用されないのは良い。

whisper_backend_init: using CUDA backend
ggml_cuda_init: GGML_CUDA_FORCE_MMQ:   no
ggml_cuda_init: CUDA_USE_TENSOR_CORES: yes
ggml_cuda_init: found 1 CUDA devices:
  Device 0: NVIDIA GeForce RTX 3070 Ti, compute capability 8.6, VMM: yes
whisper_model_load:    CUDA0 total size =  3093.99 MB
whisper_model_load: model size    = 3093.99 MB

実行中のパフォーマンス

ほぼ100に張り付いている

30分の音声が130110.01 ms = 130s =2.1分程度で処理できているのはすんごい。

文字起こしの内容

出力物

ラジオポッドキャスト「とにかくよし」B面
とにかくよし
B面では、外に出すのがはばかれる内容、あまり良くない内容
つまりB面の内容についてお話しします
音声合成は使わず、生声のままお届けしていますのでご注意ください
最近ちょっと思うところがあって
メルカリってあるじゃないですか
個人フリーマーケット的な場所で
結構前からある日本の企業なんですけど
そこで元々自分の方も結構使ってて
主にパソコンとかいらなくなったやつを売ってたんですけど
結構4,5年前ぐらいは普通に売れてたかなって感じ
最近ちょっと変わってきたかな
客層また変わっちゃったのかなっていう感じがあって
というのもマックブックのプロの
Intelの最後らへんのやつで2017年のやつがあって
まずもともと実店舗の買い取りのサービスをやってたんですよね
イヨシスって言うんですけど福岡だと天津のあたりにあって
そこで下取りみたいな感じ4,5万円ぐらいだったら売れそうかなってところで見てて持ってったら
ちょっと1万5千円と打ち上げを引いたんですけど
細かくは出してくれなかったんですけどタッチバーがないと
であとはサンダーボルトのType-Cの端子
ちょっと古いってことね型がね
古い古い古いのもあるけどまぁ緩いと
あっ緩いってこと?
緩くてちょっとそこはダメですねって言われて
でまぁ1万5千円ですって
結構厳しいね
そうですね厳しかったんで
まぁじゃあちょっと考え直そうかなってことで
一旦回収して下取りだったんで見積もりだったんで
ちょっとメルカリ出そうかなってところで
相場感を調べたらだいたい売れてるので言うと
5万円から4万3万円ぐらいで売れてるんで
1割引いて総量かかっても
まぁそれでもこっちで売った方がお得だなってところで
でちょっと商品ページ作って今出してるんですけど
ちょっとなんか違うなっていうか
最近まだいろいろメルカリ向きのアップしてると思うんですけど
ちょっとなんか変な客層が多いかなっていう
前と比べてね
そうですね
でもう一つ商品の展示の仕方がちょっと変わっちゃってるかなってところがあって
まずショップの展示の仕方からちょっと話そうかなと思うんですけど
もともと個人がそれぞれ出してるっていう感じのが一つだと思うんですけど
それ以外で業者
メルカリショップっていう業者が出せるところがあって
同じページに出てくるんですけど
メルカリショップで出してるのは会社が出してますよみたいなやつなんですよね
でまぁだいたいその読み込みがちょっと遅いんですよ
メルカリショップを開いた時分かんないですけど
商品の検索した段階でメルカリショップかどうかってか分からなくて
で読み込んだ時なんかおそらくそのネイティブのアプリじゃなくてなんかウェブページが開いてるのかなっていうそういう挙動してるので
そこでなんか重いなって思ったらメルカリショップかって感じで
それがまずいらないっていうかいらないっていうか邪魔っていうか分けてほしい
って思ったんですけどもメルカリショップを除外するっていうオプションがなかったりして
あとは個人ではあるんですけど商品のサムネとか見ると商品の何だろうな
業者が作ってるようなサムネ分かりますかね
うん分かる分かる
値段がもう書いててサムネに文字でスペック書いててみたいな
それがもう10個ぐらい一気に同じような見た目のサムネが出て
そういうのがあって個人が売りづらい環境になってきてるなってところは感じてました
もう一つ客層が悪くなったんじゃないかっていう部分
もともとメルカリってひどいコメントが多いっていうか
出した瞬間に3万円値引きできますかみたいな
わけわからん出引きしてとりあえずばっちゃうみたいな感じの人多かったなと思うんですけど
最近はなんかちょっとねそもそも文章おかしいというか
日本人じゃないというか日本語じゃないんじゃないかみたいなそういうコメントが多くて
翻訳してんのかな
分かんないですけど
例えば日本の人だったらこんにちはとか言ってお値引きできますかみたいな
そもそも値引き額言わないとかできますよって言ったら
2000円とかできますかみたいなそういうやり方もいるんですけど
そもそもいきなり値段をパッと貼り付けて何も言わない
例えば7000円で売ってたら5000円でしかもエンドマークの表記が後ろなんですよ
5000円みたいな
なんかおかしいなと思って同様の出品MacBook Proの2017版を見てたら
同じような人が他の商品でもコメントしてて
同じような人のやつを何個かピックアップして見てみた感じ
まあちょっと別の男の人かなって外国人かなっていう感じの名前の人が多くて
本人確認してないと
ああそういうことか
2本目付けてるやつもこんな名前付けるかなっていう名前
田中とか高橋とか山田とか付けてて
特に何も買ってなかったりするんで
ちょっと怪しいなと購入者側が怪しいなと
もしこういう人が購入した場合って
すり替えとかそういうの起こりうるじゃないですか
買ったけど問題があったって返品してるって
返品したやつが違ったみたいな
そういうのが増えてきてるのかなっていうところが感じますね
そういうのってメルカリ側が対応してるんかね
例えば出すときに写真撮ってこれをちゃんと送ったよとか
そういうのがないと確かにすり替えられたらどうしようもないよね
ですね
その辺はどうなってるんだろうね
注意喚起はしてなかったっぽいですけどね
また事務局で対応したりとか返寄するからとか
実際にまだ被害に遭ったことないんで何とも言えないし
出品者が今自分が言ってるのは確定ではないんで
そうだねちょっと難しいね
だから今さむしろAIの方が丁寧な文章を書いてくれるから
あんまり日本語がおかしい方がおかしいよね
おかしいってかそっちの方がむしろ人間味があるというか
頑張って人間がやったのかなって気はするよね
確かに
と思うけどね分かんないメルカリの状況
僕はちょっとやったことないから
あと最近の越境で買えるようになってて
例えばよくあるのはMacとかじゃなくて
アニメのグッズとか
ああいうのをメルカリ側が他のサイト
海外のサイトからアクセスできるようにして
欲しいのあったら海外のサイトで購入すると
その間に代理業者が入ってそれで買ってくれると
それで結構おいしいというか
売ってる方としては結構代理業者が買ってくれるから
トラブルもなく結構高めで買ってくれるみたいな
そういうのもあるみたいですね
確かに日本のやつをね文化というかアニメでもいいけど
日本のねもうちょっとワナやつとかを売ろうとするときには
それ使うといいかもね
けどMacBook Proに関してはちょっと違うかなと
円安なんで
確かに
お得かもしれないですね
そうだね確かにね結局一番高いところで売れればいいわけだからね
ちょっとそれは是非売れたらねどういう展末だったかを
とりあえず今ネサゲー
ブロック機能ってあって
もし売りたくないとかあったらブロックできるんですよ
検索ページに出てこないとかできるんで
それで怪しい人は片っ端しかブロックして入れてるんで
ちょっといいねがつかなくなっちゃったんですけど
ちょっと今ネサゲーしてやってますね
まあね自分のここまでっていうラインを決めてやればいいからね
結構いいやつなんでねi7のSSD256で拡張してて
メモリーも16GBあるんで
普通にねなんかね学生さんとかねちょっと
試してみたいなとかいう人にはいいと思うけどね
今インテルのやつだとダメかな
どうなんかね
需要あると思うんですよね
インテルで作ってて保守しないといけなくてみたいな
あるし今ね別にねそのインテルだろうがM1 M2 M3だろうが
あんまりねそこまで意識しないと俺は思いたいけどね
まあまあ頑張ってちょっとやってみて
もう一つは前回以前もちょっと話したかなと思うんですけど
クレジットカードの国際ブランドVisaマスターカードあたりが
表現に関しての要請をしてて
それに対して対応するっていうのがあって
あのちょっと面白いのがまとめとしてそのニコニコ大百科に記事ができてて
これで各会社プラットフォームでどういう対応したかっていうところを書いてて
まあそうですねあの前回はエイシス
DLサイトがちょっと一旦停止してますって話してて
でも完全にDLサイトも完全に停止なんでもう使えなくなってるということで
ちょっと別のところにも使ってくださいよという話になってましたね
それ以外にも他のところも結構喰らってて
特にピクシブとかファンティアとかですね
ファンティアっていうのはピクシブのファンボックスとファンティアが
ファンティアって虎の穴が運営してる
毎月お金払って作品を見る
うんうん分かる分かる分かる
サブスクかサブスクサービス
作者が毎月何本か画像投稿するんでそれを限定で見れますみたいなのがあって
同じようにピクシブもファンボックスってのがあってクリエイターシーンとかやってたんですけど
対応としてはピクシブの方は結構表現規制なんかを強めて表現修正して何とかまだ使えてるのかな
でファンティア虎の穴の方はだいぶ厳しい状況にあるんですね
止められたのかな
でまぁあとはそうねビザ目指したかとか
あとニコニコは段階的に止められてて
ビザも今まだ交渉中ではあるけど
アメリカンエクスプレスとかもやってて
請求は止まってて
復活したらその時の決算をまとめて請求しますと
そういう状況になってますと
それでいろんなところが影響を受けてるってところがあって
自分もビザとか使ってたんでJCBでカード作ろうかなと
ちょうどDMMJCBカードっていうちあんがあるカードがあるんですよ
これが新規発行すると9000ポイントもらえると
それがDMMのサイトで何でも使えますと
であとはそれ以外でDMMのカードを使うと2000円もらえますと
これ面白かったのがすぐ申し込んで
内容を申し込むときに結構いろんな情報を入れないといけないんですけど
もう1日ぐらいで審査通って
カード届くのは時間がかかるんですけど
DMMに紐づけましたよと決済
カード登録されてますよとDMMの会員たちに
でもそのまま使えますと
すぐ使えるようになってるみたいですね
すごいねDMMね
この間ちょっとねニュースでね
仮想コインが流出したってので大丈夫かなと思ったけど
まあまあまあこういうこともやってるわけよね
DMMとかっていうのはクレジットカード会社持ってるわけじゃなくて
ポケットカードとかそういうところ会社に
一周明かしと悪い悪い忘れましたけど
そういうところに頼んでやってもらうと
そういう事業のとこにもやってもらって
使えるようにするとこれもJCBということで
あそうかJCBはね確かに日本を応援するというか
日本のねカード会社だからいいかもね
JCBが対応しないとは言ってないですけどね
もしかしたら表現規制してくるかもしれないなんて見えないですけど
確かにねどうかね
僕は結構この事件に関しては茅野外というか
あんまり虎の穴とかそういう表現の自由に
表現の自由を抑えつけるようなサイトとかでは
カードを使ったことがないので全然わかんなくて
なんで僕はもうビザが便利なんで
ビザでええやんみたいな感じでやってはいますけどね
基本的にそうですねエロいコンテンツに対して
表現規制ですねニコニコ大百話やつとか見てると
基本的にそこら辺を何とかしろっていう風にやらされてる
まあちょっとねこれは結構いろんな問題になりそうなので
やっぱりなんて言うんだろうねグローバルになってきたからこそ
いろいろ起きる話ではあるよねやっぱりその
潔癖じゃないまあ言ってることは正しいんだけどね
言ってることは正しいというかこれが犯罪を助長するよね
とか言われればまあそういう側面もあるし
何とも言えないみたいな気にはなるけど
もともとそのポルノハーブが起点だったんだよね
ポルノハーブで問題があるリベンジポルノとか
そういうのがあってそれをその責任っていうのが
ポルノハーブだけじゃなくて決済をかけてる
クレジット会社会にもあるっていう風に
そういう裁判がされてっていうところが
一番の元って言われてますよね
けどなんかねクレジットカード会社が大きくなってるんなら
そういう責任を負うようになるんかね
ほぼインフラみたいになってるからクレジットカード
持ってなきゃダメみたいな国によってはそうだったりするから
やっぱりそういうところでみんな逃げれなくなってる
逃げれないというかもうどうしようもなくなってはいるかもしれないね
犯罪に使われるとねやっぱり犯罪
もときに使われる犯罪とかになってくるとやっぱ
退治せざるを得ないってなるから
そうだねあそこはあるかもしれないね
ここはいろいろ日本のコンテンツとかもちょっと難しいっていうか
過去の文化とかもあったりするから一概に何とも
いろいろ言いたい人はいっぱいいるだろうから
こういう逃げ道があるといいねぐらいしかないね
やっぱ近県でもらって近くのところで監禁したほうがいいね
そうな洗浄していく必要があるかもしれないけどね
みなさんあちらに行かれてますよね
そうねいろいろちょっとあると思うけど
ちょっと俺そういうのにはちょっとあんま
お金がかかってくるとやっぱり人間ね怖いじゃん
俺は別にいいなと思うけど
怖いよねその世界ね
どっちもね正義を執行しようとする側も
今のでええやんっていう側も怖いから関わりたくない
いろいろ利権が関わってくるとねやっぱり命も狙われるんで
僕としてはなるべくどっちも好きですっていうスタイルで行こうと思う
どっちにも堅入れしないっていう関係ないからすいませんっていう方向に行こう
じゃあ次のやつですけど
じゃあ僕の方で僕の方はですね最近その
僕はちょっと絵とか漫画とか見ますけど
学習コンテンツ何が言いたいかというと最近僕ちょっと
山登りしたいなとかその新しい趣味を今ちょっと一気に増えたんですよね山登りするとか
あとこう仏教徒になるとかこう言い始めて
それでなんかユーネクスト僕入ってるんですけど
これはのさっき大久保氏が言ったみたいにその僕はのもともとネットフリックス入ってたんですけど
日本の会社を応援しようかなと思ってネットフリックスやめて
今ユーネクストの方に入ってます
ユーネクストでコンテンツ見ててちょっとその僕が見たいようなやつで
例えば仏教の話とかあとその山登りの話ってまあまあなかなかコンテンツがないわけですよ
ただユーネクストにそのNHKオンデマンドっていうなんか月に別料金払うと
NHKのコンテンツいろんなのが見られるんですけど
うちテレビないんでNHK見れないんでそもそもなんでそういうのが見られると
もともとユーネクストって月額払うんですけど1200円か1400円かちょっと覚えてないですけどぐらい
ポイントとして返ってくるんですよね
なんで普通に追加料金払わずにNHKオンデマンドっていうので
990円だったかな月990円払うポイントで払うと見れるっていうので
最近それでこういろいろ見てるわけですよ山登りのやつもありますし
あとですね最近よく見てるのが100分で明朝を読むみたいな
っていうのがあってそれが4話ぐらい4話とかまあそれ見てるんですけど
もともとブッキーのやつ見てたんですけど100分で明朝とか見始めるじゃないですかそうすると
最近みたいなやつだとアドラーの心理学とか見るわけですよ
でアドラーの心理学見るじゃないですかで興味あるなと思って面白そうだなと思って
で僕最近Kindle Unlimitedにも入ったわけですよいろんな本読めるからとか
そういうのがあるんですけどもともとはですね
面白そうだなと思ってで僕最近Kindle Unlimitedにも入ったわけですよいろんな本読めるから
そうするとアマゾンでそのアドラー心理学とかで調べて
Kindle Unlimitedで見れるやつでまたそれを読んで選んで読むみたいな
そういう学習がですねなんかすごいはかどるという
100分で明朝でまず気になるやつがあったらそれをKindleで探して
調べてみるとでまあ100分で明朝だけじゃなくて他の例えばですね
刀鍛冶とかあとはその
例えば僕が見てたのはその奈良にあるお寺のお話があって
それをどういうふうに回収するかとかそういうので建築学の人が出てきて
建築って何やろうなとかそういうのをいっぱい見てたりとか
そういうワードがあるんでそのワードを入れてKindle Unlimitedで
サーチするときにKindle Unlimitedがどうか選べるんで
そうとできるんでそれでやってみてみるとかそうやってますので
ちょっと思ったのがもちろんそれで学習がいっぱいはかどってますよって
読むのめっちゃ時間かかるわみたいなのはあるんですけど
やっぱりKindle Unlimitedって誰でも登録できるじゃないですか
誰でもというか別に業者だけではなくてその中で書いてる人
だから多分あれって多分結構AIで生成された画像集みたいなのが
例えば仏像とか仏像とかで僕調べてたんですけどあるんですよねそういうのが
仏像であるんですか
仏像でもある仏像か仏教かなんかでAIのやつがあって
画像化なんかを多分その自動生成しまして置いてあって
だから多分その興味があるかないかは別に
Kindle Unlimitedに入ってる人はただで見れるから
AIみたいな感じで見てくれると思うんですよね
多分そういうのを狙ってんじゃないかなと思って
だから売れるというよりもKindle Unlimitedに入ってる人が
見てくれることによってあれちょっと確かKindle Unlimitedで
見てくれるとなんか広告費みたいなのが入るんですよね多分
そうだから売れなくてもKindle Unlimitedで読んでくれた人のやつで
広告かなんかが入るっていうので収益化してるんじゃないかなと思って
非常にいいやり方だいやいいやり方というか検索する側からすると
あんま嬉しくないですけど
まあなんかそうやってやってる人いるんだなと思って見てました
なんで自分もですねちょっとKindle Unlimitedで
本書いてみたいなって気持ちになりましたね
もちろんその普通のコンテンツですけど
買う人は買ってみてほしいしそうじゃなくて
Unlimitedで見たい人はサラサラと読んでくださいみたいなのが
あってもいいなって気はしましたね
そうですね自分もTwitterの4コマ漫画とか4コマっていうか
よくあるやつ川尻小玉
ああはいはいはい
あれはKindle Unlimited普通にKindleで見れるから
ツイッターで見るよりこっちで見やすいんで見せたりしますね
であの人もたぶんUnlimitedだからこう書いてるんだろうね
そうなんかお金にはなってるらしいですよね無料で
そうそうそうだからああいうのはいいなと思って見てますね
まあそれを狙いすぎるとあれだけどね
そのAIかなんかで大量に作られるときついけど
そうじゃなければいいかなと思ってて
いやその今もうなんかあの僕らの業界
研究者の業界でもちょっと話がずれるんですけど
あのそういう問題が起きてて何かっていうと
例えば論文書くじゃないですか
英語化するの大変じゃないですか
だから英語化を例えばAIにさせるんですよね生成AI
でそうすると生成AIってなんかそのトレインされてるから
そのトレインされた人がよく使ってた英単語とかが出てくるらしいんですよ
だからなんか読む人が見ると
これなんかチャットGBで作られたっぽい英語の論文だなっていうのがあるらしいんですよね
だから日頃使わないような単語が出てくると
でそれを例えばですね
それをアクセプトされるじゃないですか
なら今度はまたそれを学習してとかそれを見て論文書くから
っていう風になってこう要は
自己自家中というか
そうそうそう自分で自分を学習して
だからそのあれみたいな
なんて言うんだろうな
AIが作ったコンテンツが学習に使われてる映画になるみたいなこうなってて
だからああってなるから
だから今本とかももしそのAIとかが作った内容が
普通に面白いなと思うけど
なんかちょっと変なのが混ざると
人間ってまあ違和感を無視するじゃないですか
だからそれがこう
けどAIはそれいいんだってどんどん入ってて
なんか変になっていくっていうのが
なんかなければいいなとは思いますけどね
その学習コンテンツの中に入らないといいなとは思うんですけど
いいっていうかまあ
っていう感じですね
マイクロソフトが出して
ファイ3か
これあのあれですよね
学習データもなんか教科書のような
高品質なちょっと定義わかんないです高品質なデータで
やったらその
より少ない
モデルでもいい制度得られましたみたいな
話してたりするんで
データやっぱデータに
部分に話になってきてる
ところもありますよね
だからまあ学習やつはねそれもあるけど
だからちょっとそのいやKindleを見ながらね
Kindle Unlimitedですそうとしながら
そんなこと考えてた
もうちょっとなんかいいんだけどね
と思いながらね
例えばちょっと変えただけでもいいわけじゃないですか
例えば青空文庫から取ってきて
ちょっと例えばなんか
整形してなんとかして出すとかしても別に
よくはないけどそんな風になったりとかすると
あんまりもう儲かるんなら
やっぱりモチベーションが儲かるってなると
そっち側に行っちゃうから
なんか
勉強してる僕からすると
なんだかなーって気がしますね
さっきも言ったように
たまたまUNEXTで見て
面白そうだなと思って調べてるコンテンツなんで
初心者向け
そこにその分野に明るいわけじゃないから
なんか変なのがあっても気づかないですよね
こういうもんかなと思ってしまう
品質が保証されてるかどうかを判断ができないというか
そう
だからそれは一般的によく言われる
人間が書いたいい教科書選べよって言われるかもしれないですけど
その場合はお金を払って
見るコンテンツになっちゃうから
Kindle Unlimited入ってると
とりあえず無料のやつでやってみて
興味があったら高いやつ買ってもいいかなとかなると
変なことになっちゃうから
と思って見てますね
けどこの学習方法はおすすめ
最近だからアニメとか見てないんですよね
いつもだったらアニメを見てたんですけど
今もずっとひたすら
特に100分で名著とかって
コンテンツが大量にあって
500話ぐらいあったりするんですよ
500話ぐらいある
1個20分強ですね
4つに分けるんで100分で名著なんで
25分でいいかな
100分ぐらい
っていう風な感じになってるんで
一応さっき言ったように
仏教系か
ちょっとパーって見ててこれ面白そうみたいな感じで選んでるんで
ちょっと500も見やしないと思うんですけど
500話あるんで多分
そうですね100何歩くらいかな
結構勉強になってますね
楽しい楽しいすげー楽しいと思って
やってますね
って感じですかね
はいじゃあ今週は以上になります来週もよろしくお願いします
よろしくお願いします
次回は以下のサービスツールの利用でお送りしました
チャットGTT
リスパー
ボイスボックス
ずんだもん
四国めたん
中国うさぎ
大田敷
スポティファイフォーポッドキャスター
おしまいです
ご視聴ありがとうございます
またお会いしましょう

感想

whisper(X)はポッドキャストの文字起こしで利用していたが、今回whisper.cppをwindowsで利用できるか検証した。機能等は一長一短あるが、ビルド後の利用の手軽さは魅力があるので、機能交換も考えている。
開発者およびコントリビューター感謝 🤗

とにかくヨシ!というポッドキャストを大体毎週やってますのでよければ聞いてほしいです。
今回試した音声の配信はこちら 👇
https://open.spotify.com/episode/5gU9H172Wlk1Odmpeo2DrN?si=e11efb94509c4d92
👆

Discussion