データには幾つもの顔がある


データアナリティクスというのは特別な作業であって、その道の専門家がするものだと思っていたのですが、最近ふと気づいたら、巷にデータアナリストが溢れている気がします。

もちろん「データの分析」にはピンからキリまであって、ピンのほうは、誰もが日常的に無意識に行っているので、それをデータアナリティクスと呼ぶのなら、人類皆データアナリストです。たとえば、神経痛がひどくなったから今日は雨だとか、鼻が動いたから彼は嘘をついているとか、経験上、記憶に蓄積されたデータをもとに予測を立てるようなことは、誰しも四六時中やっているはずです。

実際には、「データアナリティクス」とわざわざ銘打って行う作業は、ピンからキリの「キリ」にほうを指していて、専門家が体系的な行う分析作業のはずです。いや、はずでした。と過去形で言うべきでしょう。

昨今はデータアナリティクスが日常に普及して、人類皆データアナリスト状態になっている気がします。たとえば、新型コロナウイルスがどれだけ危険なのか、あるいは実は騒ぎ過ぎなのか、世界中ににわかデータアナリストが大勢いて、感染者数や致死率などのデータをもとにネットなどで論戦を張っています。にわかデータアナリストと言うと、非難しているように聞こえますが、決して悪いことではありません。誰もが自分で考えるようになったのは良いことです。

ただ、データの一面だけを分析して立てた仮説を世間に広める人が増えるのは危険なことかもしれません。

たとえば、コロナの感染者数や人口比など、さまざまなデータをグラフで示して、ほら結局こういうことだ!とSNSなどで世間に公表するデータアナリストが大勢います。そこで提示されたデータは一見、完璧に見えますが、重症者がそこに至った過程はデータに反映されていません。全体数が病院の収容力より低くても、あるいは高くても、個々の患者の容態の急変具合による現場の切迫度、あるいは余裕度が、全体数からは測れない場合が多々あるはずです。

もっと言えば、感染者の推移をいくら多面的に分析しても、ウイルスの変異の推移も考慮に入れなければ、これまでの対策が不十分だったか、やり過ぎだったか、これから対策を強化すべきか、緩めるべきか、個人が発表する説はあくまで仮説に過ぎません。仮説でも影響力を持つことが、人類皆データアナリスト状態の怖い点です。分析結果を見る側がそれをしっかり意識していればよいのですが、鵜呑みにする人も多くて、社会の分断にさえつながりかねません。

コロナ以外の例を挙げると、最近、日本のここ10年の労働人口統計をもとにした英語記事を見かけました。個人のSNSではなく、有力メディアです。女性と外国人労働者の社会進出が拡大して、日本の労働市場の多様化が進んだという、日本の発展を好意的に捉えた内容でした。おや?と思って、コメント欄にひと言添えたくなったのですが、日本が海外で高評価されるのなら敢えて口を挟むこともないかと放っておきました。内心は、その急増した女性労働者と外国人労働者が自分のやりたい仕事を満足してやっていることを願うばかりです。ここ10年で家計の苦しさが増して、仕方なしに派遣やパートに出る女性が増えたとか、単純労働でこき使われて、話が違うではないかと憤慨している外国人労働者が増えたとか、そういう可能性は、日本の労働市場データからはまったく見えていないようです。そのデータでは、おそらく高齢者の労働人口もちょうどいい具合に増えていて、日本が年功序列を脱却したように見えていることでしょう。

これに限らず、どんなデータにも裏の顔があるかもしれない、ということは常に意識したほうがよさそうです。それは本来データアナリストの仕事だったのですが、昨今は誰もがデータアナリスト化しているので、ネットやテレビで単に情報を見る側の人も、すべて真に受けるのではなく、データアナリスト的な観察眼が必要な時代になりました。

 

関連したトピックス

    None Found

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください