whisperの ちょうどいい 精度

2022-11-24

AI PC whisper 音声認識

t f B! P L

whisper関連記事は以下の4つ


AIで音声認識「whisper」を試したい その1.

AIで音声認識「whisper」を試したい その2.

whisperで作成した字幕を編集

whisper→Subtitle Edit→DeepL翻訳


whisper導入後、数回使ってみて、一番ちょうどいい精度が分かった。


  1. 超高精度 Large
  2. 高精度 Medium
  3. 中精度 Small
  4. 低精度 Base
  5. 最低精度 Tiny

のうちの、2. 高精度(Medium CPU版)


である。

私の音声、私のPC環境、におけるちょうどいい精度なので

あくまでも参考程度に。


超高精度(Large)がイマイチな理由

・フィラーを拾いすぎる

確かに精度はものすごく高い。

「”超”高精度」を謳っているだけのことはある。

ただ、精度が高すぎるのか、フィラーを拾いすぎる。

(えー、とか、ああ、とか。)

削除されている(拾われない)フィラーもあるのだが、

拾う・拾わないの基準が分からない。


・字幕がズレる

上記フィラー「あー」が、たとえ「あー」だけであっても2秒表示される。

(最低表示秒数が2秒なのかもしれない)

それ以降の字幕がズレる。

調整が大変である。


高精度(Medium)がちょうどいい理由

・フィラーを拾わない

超高精度と違い、フィラーをほぼ拾わない。

もし欲しいフィラーがあればあとから追加すればいいだけなので、

私としてはこっちの方がありがたい。


・1字幕の長さがちょうどいい

フィラーを拾わないこともあってか、超高精度よりも1字幕が長い。

一文一字幕、という感じ。

短く細切れに生成されるより、まとまった文で生成されたものを分割する方が楽なので

やはり私にはこちらの方がいい。


・精度は充分に高い

“超”がつかない高精度ではあるが、精度は充分に高いと感じる。

3回目にして“気炎(きえん)”をちゃんと「気炎」と読み取ってくれていた。

固有名詞は最初からあまり期待していなかったのでびっくりした。

AI…だからなのか?よく分からないがすごい。


精度を問わず起こること

・エラー

同じ単語が何度も繰り返される、

同じ文が2回繰り返される、などのエラーがたまに起こる。

20分ほどの音声で1~2箇所なので、修正しきれないほどではない。


・時間がかかる

夜仕掛けて朝確認するので確かなことは分からないが、

20分ほどの音声で、

高精度 …4~5時間

超高精度…7~8時間

位かかっている感じ。

(動画のエンコードと同時に行っているので余計に時間がかかっているおそれあり。

あと単に私のPCはスペックがそれほど高くない。)

これはまぁ覚悟の上なので問題ない。



投稿日:2022年11月24日
初出:2022年11月16日

このブログを検索

ブログ アーカイブ

ラベル

スマホ (81) ゲーム (78) ポケモンスリープ (69) Pokemon Sleep (68) 睡眠 (68) PC (63) おなかのうえ寝 (36) 生活 (18) 色違いポケモン (18) Blogger (9) Googleドキュメント (8) Googleスプレッドシート (7) MiBand (7) srt (7) スマートウォッチ (7) 字幕 (7) whisper (6) グッドスリープデー (6) AI (5) Aviutl (5) GIMP (5) HTML (5) SubtitleEdit (5) テキストエディタ (5) マウス (5) 日本語 (5) 素人 (5) 音声認識 (5) CSS (4) DeepL (4) Logicool (4) M705 (4) 正規表現 (4) Excel (3) Pokémon GO Plus + (3) Wordle (3) exo2srt_srt2exo (3) ゴープラプラ (3) ハラビロカマキリ (3) フォント (3) ワークアウト (3) 健康 (3) (3) (3) 3DS (2) DH5 (2) DH7 (2) Googleドライブ (2) PS3 (2) PSVita (2) Switch (2) YouTube (2) csv (2) openAI (2) vtt (2) あつ森 (2) イタリック体 (2) エンテイリサーチ (2) ガスコンロ (2) スイクンリサーチイベント (2) トイレ (2) トイレつまり (2) バーナーキャップ (2) マイクアーム (2) マイクスタンド (2) メイリオ (2) モニタ (2) ライコウリサーチ (2) ラバーカップ (2) リンナイ (2) 戦歴 (2) 東京ガス (2) 機器設定パスワード (2) 漢字 (2) 漢字ル (2) 特殊文字 (2) 知識 (2) 色違い (2) 言葉 (2) 言葉で遊ぼう (2) 電池 (2) 100均 (1) ASCII文字 (1) Alexa (1) Android (1) AutoHideMouseCursor (1) Bluetooth (1) DesktopOK (1) Docs to Markdown (1) EchoDot (1) FLOOR (1) Fitbit (1) Gmail (1) Googleカレンダー (1) Googleフォト (1) Googleワン (1) Gメン75 (1) HERO (1) HYPERLINK (1) HeTeMuLu Creator (1) MROUND (1) PAI (1) PIXLR (1) PNG出力 (1) RX10Elements (1) Roycel (1) TODAY (1) TV (1) USB-DAC (1) Unicode (1) Unicode文字 (1) Windows11 (1) iPad (1) iZotope (1) radiko (1) srt2exo.bat (1) table (1) あたら (1) じじい (1) その他 (1) ちゃんとしよ! (1) ねむりの約束 (1) ばばあ (1) アイキャッチ (1) アサダローポンプ (1) アプリ名称 (1) イヤホンジャック (1) インデント (1) インバーター鳴き (1) イーブイ (1) ウィジェット (1) ウィンドウ (1) ウォーキング (1) ウォーターサーバー (1) ウーピー・ゴールドバーグ (1) エクスポート (1) エラー (1) カーソル (1) キャッシュ消去 (1) キャプチャーボード (1) クランプ (1) ゲーム実況 (1) ゲーム音 (1) ゴープラプラ、Pokemon GO (1) サマーフェスティバル (1) ショックマウント (1) ショートカットキー (1) シリコン樹脂 (1) スナックエンドウ (1) スナップエンドウ (1) スピーカー (1) スマートアラーム (1) セメダイン (1) ソシャゲ (1) ソリティアファームビレッジ (1) タグ (1) タスクバー (1) ダイソー (1) ダブルゆめのかけらリサーチ (1) ダブルクォーテーション (1) テキスト (1) トマトジュース (1) ドッキング (1) ドリカム (1) ニンテンドーSwitch (1) ハロウィン (1) ハートマーク (1) バッチファイル (1) パススルー出力 (1) パッコンバー (1) フォントサイズ (1) フリーセル (1) ボタン (1) ポケモンGO (1) ポケモンすくすくウィーク (1) ポケモンピクロス (1) ポケモン寝顔発見ウィーク (1) マウスオーバー (1) マルノーム (1) ミーハー (1) モザイク (1) ラベル (1) リブリー (1) 二段階認証 (1) 介護用品 (1) 伊藤園 (1) 保存 (1) 入力 (1) 制御文字 (1) 可笑しい (1) 変換 (1) 容量不足 (1) 巨人の星 (1) 帯状疱疹 (1) 手がかじかむ (1) 接着剤 (1) 改行 (1) 文字コード表 (1) 文字入力 (1) 斜体 (1) 条件付き書式 (1) 標語 (1) 水ぼうそう (1) 滑り止め (1) 漫符 (1) 牛乳パック (1) 物忘れ (1) 画像編集 (1) 睡眠導入 (1) 短押し (1) 移動 (1) 編集できない (1) 老眼 (1) 老舗 (1) 自動バックアップ (1) 薬飲み忘れ防止 (1) 行選択 (1) 表示形式 (1) 西川貴教 (1) 解決済み (1) 認証システム (1) 辞書 (1) 逆転検事 (1) 逆転裁判 (1) 部分フィルタ (1) 録音 (1) 長押し (1) 靴下 (1) 音声 (1) 麦茶 (1)

Translate

QooQ