ヒストグラムは、データの散らばり具合を視覚的に捉える事ができる優秀なツールだけど、異常点の発見自体をそのものずばり示すのではない。その散らばり具合を観察して、対象のデータがどのような母集団であるのか気を配らなければならない。下図では、幾つかのパターンを用意し母集団のデータの散らばり具合を想定したが、このように特徴を予想しながらデータ分析の手がかりを探していく。 不正の兆候がないか調査する為の次のステップは、その母集団から異常値を抜き出す有効なシナリオを立てデータを分析していく作業だ。ここでは前回紹介した「固定資産購入案件の決済権限確認テストデータ」を例に話しを進める。
前回のテストデータを監査ソフトへ取り込んでヒストグラムを作図すると、下記のようになる。最小値1,000、最大値150,000で、等級の幅は14,900で10等分の表示に設定してある。目盛りが切りのいい数字にならない処……
川島 肇