G検定で学習しましたが、AIには精度のよいデータが大量に必要です。ではどれくらいからというと、定量的な値はなくやってみるしかない答えがない領域です。
それでもあえて語るならAIライブラリの「scikit-learn」のチートシートより、データが50データ未満の物はもっとデータ集めよとあるので、それ以下は語るにおよばず。
また、「バーニおじさんの定義」として割と有名な話だと、対象が持つ特徴数(次元数)の10倍以上のデータは最低限必要との事。
(例、体重、身長など2次元データなら20個、X次元データなら10X個)
そんな中、保険の推奨との事でどれくらいの次元数なのかはわかりませんが、1700万個というのはよく集めたなと思わされますね。実精度は中の人でないとわかりませんが、もし今後AIに関わる案件があった際にはこの事例から、データを集めるいいネタになるかと思いました。
「第一生命さんの実用AIは1700万個のデータみたいなのですよ。なので弊社もかき集めて少なくとも1000万個のデータはないとダメですよ」など、号令をかけやすくなるかなと思いました。