meta.kimura

感情の率直と、思索の明澄と、語と文との簡潔とです。

データってのは意外とめんどくさい。

f:id:meta-kimura:20211216134557j:plain

 データってのは意外とめんどくさい。というよりは、みんなデータってのをあまり理解していないのかもしれない。データに限らず、簡単だと思ってることが意外と難しい面を持っているってことはよくある。運用する側に立って、初めて気づく難しさ、ってやつだろうか。いや、それにしても、ちょっとは知っておいて欲しいもんだなと、思ったりする。
 例えば、ある商品Aの月間売上を知りたいとする。これぐらいなら、まぁ、どっかのBIツールだったりEXCELだったりで適当に整理すればそれなりの結果が出てくるだろう。ちょっとしっかりしたデータベースがあれば、適当にselect文を書けばいい。そのハズである。入力に間違いがなければ。
 では、ある商品群Category Aの月間売上を知りたい人はどうすればいいだろうか。Category AにはA1、A2、A3が含まれている、という定義があれば、難なくデータを取り出せる。しかし、例えば、この商品群が「雑貨」とかなら、どうだろう。「食品」でもいい。さて、自社が扱っている商品の中で、何が「雑貨」で何が「商品」なのか、きっちり分けられるだろうか。包丁は雑貨でいいだろうか。醤油は食品っぽいけど、調味料というカテゴリーに入っているかもしれない。さぁ、どうだろう。

●◯。。。...

 残念ながら、データを眺めたい人が「Category Aの売上を教えて」とは注文してくれない。そういったキッチリ分類されたカテゴリーの集計データは定期的な報告で挙げられていることが多い。注文はイレギュラーだから発生する。そして、わかっていない人ほど、ざっくり注文する。
 「ちょっと雑貨の状況みたいんだよね」「食品好調だって聞くけど、どんくらいなのか調べたくてさ」とか。まぁ、この手の輩はデータ担当がとても嫌う部類の人間であろう。ちょっとそのデータ集計の難しさを説明すると、「まぁ、いいから。ざっくりで。ばっと見たいんだよ」と言われてしまう。真に受けてはいけない。かなり誤差の混じったデータが、そのまま走ってしまう。あとから5%違ってました、ってことになって、なぜかデータ担当が怒られる。このテーブル(表)からこうやってデータ出しました、と説明書きを書いておいても、それほどの効果は期待できない。

●◯。。。...

 これ、基本的には依頼元のリテラシーと人格の問題なのかなと思ってしまうが、そう思えば思うほど、打つ手が見当たらなくなる。人格なんて、ほんとどうしようもない。リテラシーなら、教育が必要なのだろう。とはいえ、データの依頼元なんてほぼ全てが「上」なのであって、自分より賢く、より詳しいとされる人間なのだ。「IT詳しくなくってさ」という姿勢で、学びにくる人格と時間的余裕があれば問題ないのだが、得てして、まぁ、そういう人ばかりではない。

 ふむ、迂遠である。
 もう少し、踏み込んで言おう。わたしは今、医療に関わっている。そういうことである。
 さらに医療との関わりで言えば「誰が、いつからいつまで、どの病気にかかっていたか」という何とも基本的と思えるデータが、実は非常に困難だったりする。期間の定義が曖昧過ぎるために、「この期間中で、この病気にかかってた患者のデータが欲しい」と言われても、困る。
 その病気はいつからはじまったのか、その開始日で検索するのか、病気を医師が認識した日なのか、はてさてその病気はいつまで続いたのか。特に終了の部分は明確に入力されないだろう。治ったら病院に来ないし、症状が落ち着いただけかもしれない。とても単純で、シンプルだと思われる依頼でさえ、この有様なのだ。

●◯。。。...

 プログラミング教育の話題を目にする。小学校からプログラミングを取り入れて、という話で、もう、それに期待するしかないのかなぁ、なんて思ったりしている。
 データの二次利用が進まない原因の、半分はこういったリテラシーの不足にあるんじゃないかと思っている。もう半分は、個人情報保護についての意識とリテラシーの不足だろうなぁ。

(こういう愚痴ならいくらでも書けるな。。。笑)



m(_ _)m