| スクリプト名 | 主な用途 | 対応する問題No |
|---|---|---|
🎚 request_adjust_audio_volume.py |
音声が聞き取りづらい場合に使用 | 4 |
🧼 request_advanced_noise_reducer.py |
音声に雑音等がある場合に使用 | 1, 2, 3 |
⏱ request_audio_drift_corrector.py |
文字起こし不整合が発生した場合に使用 | 9, 10 |
🧩 request_audio_gap_filler.py |
片方しか文字起こしされていない場合に使用 | 8 |
📝 request_transcription.py |
文字起こしする場合に使用 | 8, 9, 10 |
目的
音声が小さい、または聞き取りづらい場合に使用。
コンプレッサ・リミッタ処理により、音量を均一化し聴取性を改善。
対応する問題No: 4
主要パラメータ
threshold: -20.0
ratio: 2.5
attack_ms: 10
release_ms: 250
make_up_gain_db: 3.0
入出力
入力:voice/input/{date}_{uuid}_processed.mp3
出力:voice/output/{date}_{uuid}_processed.mp3
対象:excel/<ファイル名>.xlsx 内の date, uuid
処理フロー
Excelから対象一覧を取得
音声を読み込み、コンプレッションとゲイン調整を適用
出力ファイルとして保存
エラーログに失敗を記録
注意点
ノイズ除去後に実行
音量の上げすぎはノイズを増幅させるため注意