30代からの再勉強日記(ビジネス系/IT系の一般論の理屈を考えてみる)

徐々に、新たなタスクを起こし任せる側になりました。将来検討のためにも、一般論やセオリーを勉強・考察し外部へ共有する事で学びを深めたいと思います。皆さんにも役立つ所があれば幸いです。※最近ミッション変更となり、更新頻度落が落ちます。

データ品質の評価項目(デジタル庁と東京都資料より)

 データ利活用はよく言われますが、どうやって品質のよいデータを収集すべきなのかはあまり言及されません。最初は有志がデータ収集していても段々更新されなくなり、あまり意味がないデータ集になってしまうケースも残念ながら散見されます。

 仕組み化の前にまず、データの品質はどのように考えるべきか調査すると、デジタル庁と東京都のガイドラインがわかりやすく、残しておきたいと思います。

 

cio.go.jp

https://cio.go.jp/sites/default/files/uploads/documents/data_hinshitu_guide_beta_20210831.pdf

●データオーナーにとってのデータ品質管理の意義は以下のように整理されま
す。
・ データ収集コストを低減できる。
・ データ収集を迅速化できる。
・ データ更新を容易にできる。
・ データ更新にまつわる問題を回避できる。
・ 内部でのデータ活用を容易にできる。
・ データ公開を容易にできる。
・ 利用者側でのデータ活用が進む。

 

データ品質の評価軸は下記15項目が上げられてますね。

何かデータ品質を検討する必要がある際は、この項目が参考になりそうです。

データの品質は、網羅性の確認等、コンピュータによる検証が有効な項目が
多いため、積極的にコンピュータによる確認を導入するなどの対策が効果的で
す。
本ガイドブックでは、データ自体の品質を、ISO/IEC 25012 に沿って評価し
ます。
1. 正確性 (Accuracy)
2. 完全性 (Completeness)
3. 一貫性 (Consistency)
4. 信憑性 (Credibility)
5. 最新性 (Currentness)
6. アクセシビリティ (Accessibility)
7. 標準適合性 (Compliance)
8. 機密性 (Confidentiality)
9. 効率性 (Efficiency)
10. 精度 (Precision)
11. 追跡可能性 (Traceability)
12. 理解性 (Understandability)
13. 可用性 (Availability)
14. 移植性 (Portability)
15. 回復性 (Recoverability)

 

 

より簡易にまとめられるのは、東京都のガイドラインですね。

上記のデジタル庁のガイドラインを参考にして作成されてます。

 

■重点5項目(データの中身に関係)

https://www.digitalservice.metro.tokyo.lg.jp/digitalguideline/doc/gizyutsuguidline_zenbun.pdf

 

■データ品質の評価項目(15個の解説)

https://www.digitalservice.metro.tokyo.lg.jp/digitalguideline/doc/hinshitsuhyoukakoumoku.pdf