whisper関連記事は以下の3つ
whisperで音声認識し、Subtitle Editで編集した字幕データを
DeepLで各国語に翻訳してみた。
Subtitle Edit to DeepL
YouTubeなど別途srtファイルをアップロードできる場合はもっと使用範囲が広がる。
そのうちのひとつが、翻訳機能である。
YouTubeでは自動翻訳も使えるが、体感では結構精度が低い。
見ている動画が話し言葉中心なのもあると思う。
解説動画などしっかり原稿を読んでいる感じの動画ならばまた違うんだろう。
DeepLであれば話し言葉も結構いい感じに訳してくれる(これも体感)ので
DeepLで翻訳したい。
1. srtファイルをcsvファイルに変換
Subtitle Editにも変換できる機能があるのだが、
それで変換したCSVはなぜかうまく開けなかったので、こちらで変換する。
2. 字幕データのみテキスト化
1. で変換したCSVファイルをGoogleスプレッドシートかExcelで開く。
字幕データの方だけ(タイムスタンプは除いて)選択し、コピー
テキストエディタにペーストする。
3. DeepLで翻訳
2. のテキストをコピペしてDeepLで翻訳。
ファイルをdocxファイルなどに変換してファイルごと翻訳、という手もあるが
無料プランではファイル数に制限があるため、ちょっと実用的ではない。
コピペでも文字制限(~5,000文字)があるが、回数制限はないようなので、
文字制限にひっかかってしまうようであれば、何回かに分けて行う。
(ちなみに20分程度の音声データであれば文字制限にはひっかからなかった。
タイムスタンプを除いた文字数なので結構余裕はあると思う。)
4. 翻訳結果をcsv化
1.のcsvの字幕データの方に翻訳結果をコピペし、保存。
5. 4.のcsvをSubtitle Editで開き、srtファイルで保存
ここで何故か一部の文の文頭と文末に ” (ダブルクオーテーション)が挿入される、という不具合が発生。
最初はエラー(文が長すぎる、とか)の表示なのかと思ったが、
正常な文にもランダムに挿入されている。
(Subtitle Editの提案するエラーを修正してもなお ” (ダブルクオーテーション)は表示されたままだった)
とりあえずsrtファイルで保存し、
テキストエディタで ” (ダブルクオーテーション)を置き換えなどで削除した。
5. 上の代替案、字幕データ変換くんでcsv→srtに変換
↑の方法だとエラーが出るのでこちらで行うことにした。
字幕データ変換くん - jimakudata.udtalk.jp
UDトークから書き出された会話ログのCSVデータを字幕データ(SRT形式)に変換します。
とあるが、UDトークのcsvファイルでなくても変換できた。
色々な不具合
最初はタイムスタンプごとDeepLで翻訳していたのだが、
どうも英語だとエラーが出るので、
タイムスタンプは除いたデータで翻訳した方がいいようだ。
※中国語(簡体字)では英語のときのようなエラーは出なかった。
翻訳結果
英語の場合、もちろん固有名詞などはちゃんと翻訳されないことも多いが、
正確にローマ字表記してくれることもある。
例:オオナズチ
・Great Crested Grebe
・Oonazuchi
両方あり。
あと主語がおかしいことが多いが、これは日本語は主語が曖昧すぎる言語なので仕方ない。
他は概ね良い。と思う。
(私の拙い英語力での判断)
中国語(簡体字)はよく分からない。
投稿日:2022年11月22日
初出:2022年11月14日
0 件のコメント:
コメントを投稿