字幕ファイルは最大4つ必要。今のところ。

2022-12-03

csv DeepL exo2srt_srt2exo PC srt SubtitleEdit whisper YouTube

t f B! P L

字幕をつける作業自体は「whisper」でだいぶ軽量化されたが、

.srtファイル自体を複数用意しなくてはいけない事態になっている。


1.大元の字幕ファイル.srt

whisperで音声認識し、Subtitle Editでいい感じに編集したファイル。

これをもとに他のファイルを作っていく。


→関連ブログ記事

正規表現で置き換え


2.srt2exo.bat用ファイル.srt

Aviutlに読み込ませるためにsrt2exo.batでexoファイルに変換する必要がある。

そのためのファイル。

半角!?を全角!?に変換したもの。

(Aviutlで読み込んだ字幕は、ニコニコ動画用)


→関連ブログ記事

バッチファイルで半角!が削除される


3.翻訳用ファイル.srt

理由その1.

動画の開始から最初の字幕までのオフセット時間、これが必ず発生するのだが

whisperでは無視される。

例えば、動画を開始して最初の5秒は無音、次の1秒で「こんにちは」と発話したとしても


  00:00:00,000 --> 00:00:06,000 こんにちは。


と認識される。

日本語のみのファイルでよければ、SubtitleEditで開始位置を調整するだけでいいのだが

このあとsrt→csv→txtにしてDeepLで翻訳し、

また逆の順番で戻したりするうちに字幕の順番がズレたり、とにかく面倒くさい。

そのため、


  00:00:00,000 --> 00:00:05,000 *翻訳用のダミー*

  00:00:05,000 --> 00:00:06,000 こんにちは。


というふうに、前にダミーの字幕を挿入して作成する。

最初はスペースなどを挿入してやっていたのだが、

翻訳のときに何らかの文が入っていた方がよいことがわかったのでこの方法に落ち着いた。

(もちろんアップロードする前にダミーの字幕は削除するようにしなくてはならない。)


理由その2.

これは動画の内容にもよるのだが、

ゲーム内のセリフを読んだりするとき日本語では「」を使う。

これをそのまま翻訳すると“”で変換される。

この「ダブルクオーテーション」の扱いが非常に面倒くさい。

csvへの変換時に思ったような挙動にならないことが多いのだ。

カンマ区切りとの相性が悪いのだと思う。

タブ区切りで試したりもしたのだが、面倒くさいのでもう翻訳時には「」は削除することにした。

故に、テキストエディタで「」をすべて削除する。


4.YouTube日本語字幕用ファイル.srt

3.翻訳用ファイル.srt - 理由その2.で書いたように、

ゲーム内のセリフを読んだりするとき日本語では「」を使う。

同じセリフをわざわざ日本語字幕で表示する必要はないし

大体のゲームでセリフはゲーム下部に表示されるので、字幕とかぶる。

なので、セリフはカットする。

2.srt2exo.bat用ファイル.srtで Aviutl編集時にも同様の編集をする。



whisper、字幕ファイルに関する記事はこちら


AIで音声認識「whisper」を試したい その1.

AIで音声認識「whisper」を試したい その2.

whisperで作成した字幕を編集

whisper→Subtitle Edit→DeepL翻訳

whisperの ちょうどいい 精度

正規表現で置き換え

バッチファイルで半角!が削除される



投稿日:2022年12月3日
初出:2022年11月23日

このブログを検索

ブログ アーカイブ

ラベル

スマホ (81) ゲーム (78) ポケモンスリープ (69) Pokemon Sleep (68) 睡眠 (68) PC (63) おなかのうえ寝 (36) 生活 (18) 色違いポケモン (18) Blogger (9) Googleドキュメント (8) Googleスプレッドシート (7) MiBand (7) srt (7) スマートウォッチ (7) 字幕 (7) whisper (6) グッドスリープデー (6) AI (5) Aviutl (5) GIMP (5) HTML (5) SubtitleEdit (5) テキストエディタ (5) マウス (5) 日本語 (5) 素人 (5) 音声認識 (5) CSS (4) DeepL (4) Logicool (4) M705 (4) 正規表現 (4) Excel (3) Pokémon GO Plus + (3) Wordle (3) exo2srt_srt2exo (3) ゴープラプラ (3) ハラビロカマキリ (3) フォント (3) ワークアウト (3) 健康 (3) (3) (3) 3DS (2) DH5 (2) DH7 (2) Googleドライブ (2) PS3 (2) PSVita (2) Switch (2) YouTube (2) csv (2) openAI (2) vtt (2) あつ森 (2) イタリック体 (2) エンテイリサーチ (2) ガスコンロ (2) スイクンリサーチイベント (2) トイレ (2) トイレつまり (2) バーナーキャップ (2) マイクアーム (2) マイクスタンド (2) メイリオ (2) モニタ (2) ライコウリサーチ (2) ラバーカップ (2) リンナイ (2) 戦歴 (2) 東京ガス (2) 機器設定パスワード (2) 漢字 (2) 漢字ル (2) 特殊文字 (2) 知識 (2) 色違い (2) 言葉 (2) 言葉で遊ぼう (2) 電池 (2) 100均 (1) ASCII文字 (1) Alexa (1) Android (1) AutoHideMouseCursor (1) Bluetooth (1) DesktopOK (1) Docs to Markdown (1) EchoDot (1) FLOOR (1) Fitbit (1) Gmail (1) Googleカレンダー (1) Googleフォト (1) Googleワン (1) Gメン75 (1) HERO (1) HYPERLINK (1) HeTeMuLu Creator (1) MROUND (1) PAI (1) PIXLR (1) PNG出力 (1) RX10Elements (1) Roycel (1) TODAY (1) TV (1) USB-DAC (1) Unicode (1) Unicode文字 (1) Windows11 (1) iPad (1) iZotope (1) radiko (1) srt2exo.bat (1) table (1) あたら (1) じじい (1) その他 (1) ちゃんとしよ! (1) ねむりの約束 (1) ばばあ (1) アイキャッチ (1) アサダローポンプ (1) アプリ名称 (1) イヤホンジャック (1) インデント (1) インバーター鳴き (1) イーブイ (1) ウィジェット (1) ウィンドウ (1) ウォーキング (1) ウォーターサーバー (1) ウーピー・ゴールドバーグ (1) エクスポート (1) エラー (1) カーソル (1) キャッシュ消去 (1) キャプチャーボード (1) クランプ (1) ゲーム実況 (1) ゲーム音 (1) ゴープラプラ、Pokemon GO (1) サマーフェスティバル (1) ショックマウント (1) ショートカットキー (1) シリコン樹脂 (1) スナックエンドウ (1) スナップエンドウ (1) スピーカー (1) スマートアラーム (1) セメダイン (1) ソシャゲ (1) ソリティアファームビレッジ (1) タグ (1) タスクバー (1) ダイソー (1) ダブルゆめのかけらリサーチ (1) ダブルクォーテーション (1) テキスト (1) トマトジュース (1) ドッキング (1) ドリカム (1) ニンテンドーSwitch (1) ハロウィン (1) ハートマーク (1) バッチファイル (1) パススルー出力 (1) パッコンバー (1) フォントサイズ (1) フリーセル (1) ボタン (1) ポケモンGO (1) ポケモンすくすくウィーク (1) ポケモンピクロス (1) ポケモン寝顔発見ウィーク (1) マウスオーバー (1) マルノーム (1) ミーハー (1) モザイク (1) ラベル (1) リブリー (1) 二段階認証 (1) 介護用品 (1) 伊藤園 (1) 保存 (1) 入力 (1) 制御文字 (1) 可笑しい (1) 変換 (1) 容量不足 (1) 巨人の星 (1) 帯状疱疹 (1) 手がかじかむ (1) 接着剤 (1) 改行 (1) 文字コード表 (1) 文字入力 (1) 斜体 (1) 条件付き書式 (1) 標語 (1) 水ぼうそう (1) 滑り止め (1) 漫符 (1) 牛乳パック (1) 物忘れ (1) 画像編集 (1) 睡眠導入 (1) 短押し (1) 移動 (1) 編集できない (1) 老眼 (1) 老舗 (1) 自動バックアップ (1) 薬飲み忘れ防止 (1) 行選択 (1) 表示形式 (1) 西川貴教 (1) 解決済み (1) 認証システム (1) 辞書 (1) 逆転検事 (1) 逆転裁判 (1) 部分フィルタ (1) 録音 (1) 長押し (1) 靴下 (1) 音声 (1) 麦茶 (1)

Translate

QooQ