何かデータ解析したい時に、生データが表記ゆれしてしまう事あるかと思います。
名称が違えば、半角全角違いなどで、同じデータでも違うように見えてしまう事あるかと思います。
ルールを統一しておきたいと思いますが、ならそのルールのルールは何かないかと調べてみたところ、政府が公表しているのがあったのでここに記しておきたいと思います。
概要)
行政基本情報データ連携モデル標準ガイドライン「日付及び時刻」
日付、時刻、期間、時間帯、期間、季節など、それぞれどのように入力すべきか、ルールが記載されています。
例、全部書くと発散するので、最初の方だけ
1.1 日付
日付のデータは以下の形式とする。半角を使用する。
YYYY-MM-DD
YYYY:西暦年 4 桁
MM :月 2 桁(1 桁の場合には前に 0 をつける)
DD :日 2 桁(1 桁の場合には前に 0 をつける)
例)2017-09-01
1.2 曜日
曜日のコード及びデータは、以下のとおりとする。
1:月曜日
2:火曜日
3:水曜日
4:木曜日
5:金曜日
6:土曜日
7:日曜日
あと、わかりやすく参考になりやすい所は各冒頭ですね。こうすべしという所が記載されている所。
期間は、「開始日」、「終了日」と「開始時刻」、「終了時刻」の4つのデータ項目で設定することが望ましい。
(中略)
日付及び時刻に関して、「金曜日は 17 時まで」等の特記事項を記載する場合
には、上記のデータ項目内に記述するのではなく「備考」のデータ項目を付加し対応する。
もし、新たに集めるべきデータがあるのであれば、このようなルールに従って作成しておくと、フリーソフトやライブラリなどに食わせやすくなるかもしれませんね。