🧾 欠損データ詳細:問題一覧(YAON)

概要

本ページでは、YAONにおける納品後の欠損データ・品質不良のうち、 「技術的欠損」「文字起こし不整合」「通信障害」「運用上のミス」など、 納品前後で検出された問題を整理しています。


🎧 問題一覧

No 問題種別 主な事象 原因概要 対応方針 備考 対応スクリプト名
1 音声不良(周囲ノイズ) 周囲の音が入り聞き取りづらい 収録環境の外部音/通信ノイズ ハウリング緩和が確認できたため、全データにノイズ除去を実施 ノイズ除去で改善見込みあり。リファイメント不可データの削減目的。 request_advanced_noise_reducer
2 音声不良(相手音声混入) 通話相手の音声が混在し正解判定が困難 通信経路混線またはモニター側がヘッドセットではなくスピーカーで音声出力会話をしたため拾っている ハッキリと相手の音声が入っているため、正解の声の判別が不可のため対応不可 他の処理優先。技術的再現が難しい。 request_advanced_noise_reducer
3 音声不良(雑音) 雑音が多く聞き取りづらい 通信ノイズ・マイク感度 重度には効かないが、軽・中度には一定効果あり。 request_advanced_noise_reducer
4 音声不良(モニター無発言) モニター音声がほぼなし(物音のみ) 通信障害/録音異常 ノイズ除去+ノーマライズで対応。 request_adjust_audio_volume
5 音声・テキスト不一致 同一IDで内容が異なる DB紐づけ不整合/文字起こし処理異常 再文字起こしにより修復可能だったため、再実施
6 テキスト欠損 conv_textが空白 オペレーター作業ミス 再文字起こしにより修復
7 一部未文字起こし 会話後半が文字起こしされていない DB登録時の不具合 再文字起こしで修復 → 実施済
8 片側未文字起こし 途中からモニター発話が欠落 原因は不明だが、モニターの回線トラブルによるものの可能性が高い 動画は生きているため動画から音声データを生成し同期させ再文字起こしを実施 request_audio_gap_filler
request_transcription
9 文字起こし不整合(無音切り取り) 一部区間が欠落し時系列ズレ 音声同期処理ミス 無音挿入により再同期 → 実施済 request_transcription
request_audio_drift_corrector
10 文字起こし不整合(通信不良) 一時的な通信切断により時系列ズレ 一時通信途絶 No.9と同方針で対応済 request_transcription
request_audio_drift_corrector
11 誤記載データ テキストに「通信不良」など誤記 オペレーター入力ミス 削除予定のデータのため、削除済
12 通信中断・映像破損 通信断により会話途中で終了 通信障害/収録異常 欠損データとして別フォルダ格納 → 実施済 再処理対象外。納品対象から除外済。