ドミニク・チェンが監訳ってことで、ちょっとおっとなって手にとった。まぁ、こういう系のテーマで読みやすそうなものを探していたのもある。結局、読みやすいってだけで、あんまり得るものがあるわけでもないんやけど。
にしても、ビッグデータって言葉はどんぐらいの鮮度なんだろうか。もうそろそろ賞味期限切れになってきてる気がしていて、それはそれで恐ろしい。なんか、データなんかビッグなのが普通だ、みたいなことになると、普段からデータベースに触れているものとしては、ちょっとやめてよ、ソンナコトイッタッテ、コッチタイヘン、ってなテンションになってしまう。だいたい、ビッグデータってレコード数が普通に億を超えてくるので、処理に時間がかかるかかる。サーバ負荷もえらいもんになるんだろうなぁ、と思う。
まぁ、そんな桁のデータの結合とかやったことがないからわからぬが。
●◯。。。...
ビッグデータと言うか、データ全般の話かなぁ、なんて考えながら読んだ。個人のスケール、団体のスケール、自治体のスケール、国家のスケール、世界のスケール。広がれば広がるほどデータ数は増えてビッグデータっぽくはなる。
けど、個人スケールのデータだって、データはデータで、いろんなセンシング技術によってログが取れるようになってきたおかげで、いろんな活用が見えてきた。スマートウォッチがわかりやすいだろう。Fitbitとかでヘルスログみたいなのを取る人はだいぶ増えた。睡眠時間や脈拍、血中の酸素濃度とかも最近は取れるんだったか。それらが見える化されることで、なんかしらの生活習慣の改善があったり、なかったりしている。これもまた、真っ当なデータの活用だと思う。ビッグだからどうこうってな話でもないだろう。
●◯。。。...
つまるところは収集と活用だ、という構成にはなるほどだった。そんでもって、やっぱり大きな壁は個人情報なのだ。個人情報をどうやって個人情報ではなくするか。匿名化するってのは、これが、なかなか難しい。CDR(携帯電話の通話記録らしい)が結構有望だってことで、何度も出てくるのだが、ふむ、これってどうなのだろう。位置が入ってくるとどうしても「個人を特定できる」形になってしまう。この辺りはどう考えるべきかは、悩ましい。いくらボヤかす技術が発達したところで、本気になって調べれば個人を特定できてしまう。ピントを甘くするとデータの精度も下がる。このトレードオフのバランスをどこで取るか、ってことかなぁ。
個人情報関連では、同意、というか、情報を提供する側が提供する情報としない情報を主体的に選択できる状況の担保がポイントになる。あとはその提供によって得られる利益が目に見えているかどうか。ある程度データの活用がイメージできていれば、情報も差し出しやすくなるってことらしく、それは納得。とはいえ、マイニングする立場からは、それが難しいって話もわかってしまう。ふーむ。
●◯。。。...
データの2次利用なんて言葉も最近よく聞くようになった。個人情報保護法も2次利用を想定しながら、新しくなるってことだったような気がする。そろそろ社会的な合意がなされて、しっかりとした制度ができて欲しいなぁ、と思ったりもするけど、たぶん、難しいだろうなぁ。マイナンバーもできたんだし、PHR(パーソナルヘルスレコード)もさっさと整備しなよ、というのは、自分の個人情報にわりと頓着がない、わたしの意見。
m(_ _)m