本ページでは、YAONにおける納品後の欠損データ・品質不良のうち、 「技術的欠損」「文字起こし不整合」「通信障害」「運用上のミス」など、 納品前後で検出された問題を整理しています。
| No | 問題種別 | 主な事象 | 原因概要 | 対応方針 | 備考 | 対応スクリプト名 |
|---|---|---|---|---|---|---|
| 1 | 音声不良(周囲ノイズ) | 周囲の音が入り聞き取りづらい | 収録環境の外部音/通信ノイズ | ハウリング緩和が確認できたため、全データにノイズ除去を実施 | ノイズ除去で改善見込みあり。リファイメント不可データの削減目的。 | request_advanced_noise_reducer |
| 2 | 音声不良(相手音声混入) | 通話相手の音声が混在し正解判定が困難 | 通信経路混線またはモニター側がヘッドセットではなくスピーカーで音声出力会話をしたため拾っている | ハッキリと相手の音声が入っているため、正解の声の判別が不可のため対応不可 | 他の処理優先。技術的再現が難しい。 | request_advanced_noise_reducer |
| 3 | 音声不良(雑音) | 雑音が多く聞き取りづらい | 通信ノイズ・マイク感度 | 重度には効かないが、軽・中度には一定効果あり。 | request_advanced_noise_reducer | |
| 4 | 音声不良(モニター無発言) | モニター音声がほぼなし(物音のみ) | 通信障害/録音異常 | ノイズ除去+ノーマライズで対応。 | request_adjust_audio_volume | |
| 5 | 音声・テキスト不一致 | 同一IDで内容が異なる | DB紐づけ不整合/文字起こし処理異常 | 再文字起こしにより修復可能だったため、再実施 | ||
| 6 | テキスト欠損 | conv_textが空白 | オペレーター作業ミス | 再文字起こしにより修復 | ||
| 7 | 一部未文字起こし | 会話後半が文字起こしされていない | DB登録時の不具合 | 再文字起こしで修復 → 実施済 | ||
| 8 | 片側未文字起こし | 途中からモニター発話が欠落 | 原因は不明だが、モニターの回線トラブルによるものの可能性が高い | 動画は生きているため動画から音声データを生成し同期させ再文字起こしを実施 | request_audio_gap_filler | |
| request_transcription | ||||||
| 9 | 文字起こし不整合(無音切り取り) | 一部区間が欠落し時系列ズレ | 音声同期処理ミス | 無音挿入により再同期 → 実施済 | request_transcription | |
| request_audio_drift_corrector | ||||||
| 10 | 文字起こし不整合(通信不良) | 一時的な通信切断により時系列ズレ | 一時通信途絶 | No.9と同方針で対応済 | request_transcription | |
| request_audio_drift_corrector | ||||||
| 11 | 誤記載データ | テキストに「通信不良」など誤記 | オペレーター入力ミス | 削除予定のデータのため、削除済 | ||
| 12 | 通信中断・映像破損 | 通信断により会話途中で終了 | 通信障害/収録異常 | 欠損データとして別フォルダ格納 → 実施済 | 再処理対象外。納品対象から除外済。 |