AIリテラシー データ品質要件
カテゴリ: 技術的要件・適合性

データ品質要件(Data Quality Requirements)は、高リスクAIシステムの学習、検証、テストに使用されるデータセットに対して求められる厳格な品質基準です。「Garbage In, Garbage Out(ゴミを入れればゴミが出る)」というAIの特質を踏まえ、高品質なデータこそが安全なAIの前提であるとしています。
3つの主要要件
- 関連性と代表性:データは、そのAIが使用される地理的・行動的な環境や文脈を適切に反映(代表)している必要があります。欧州市場向けなら欧州のデータ特性を考慮しなければなりません。
- エラーの欠如と完全性:データに含まれる誤りを可能な限り排除し、欠損がない完全な状態を目指す必要があります。
- バイアスの監視と検出:データに含まれる可能性のある偏見(バイアス)を特定し、それを修正するための特別な処理を行うことが義務付けられます。
これらを満たすために、データの収集プロセス、クリーニング手順、アノテーション基準などを文書化し、厳格に管理する「データガバナンス」が求められます。