工信部のデータの例
中国で公表されている統計データを整理していると数値が明らかにオカシイものが見つかることがよくあります。私たちはこうした統計データは、その内容ではなく表示において再確認するようにしているのですが、相当高い頻度で当たります。
例えば過去に見つけたものではモバイル契約数の月次報告では、黒竜江省の数字がなぜか足し算に入っていないというものもありました。Excelなりで裏では作業されているのでしょうが、特定の月ではなく複数月に跨っていたので明らかにチェック漏れだといえます。
工信部のデータでモバイル契約数の推移を見てて、明らかに変な推移があるのでおかしいなと思ったら、足し算間違ってますがな! 例えばこれ。2014年2月の中部のモバイル契約数。黑龙江が足し算に入ってないw いくつもこういう月があるよ! pic.twitter.com/z1fhLoZaAh
— Kentaro Iemoto (@iemoto) 2015, 4月 27
固定電話の数値があわない
そして、本日の悩ましいデータはこちら(http://www.miit.gov.cn/n11293472/n11293832/n11294132/n12858447/16843776.html)。工信部が公表している農村部と都市部の固定電話、そして携帯電話の契約数の月次報告の8月分です。
細かくは省きますが、城市电话(都市部の固定電話)の合計値が17,739.7万契約、农村电话(農村部の固定電話)の合計値が6,146.5万契約となっているわけですが、各省・市の値を合計すると都市部は17,459.2万契約、農村部は6,427万契約となります。数字が合いません(涙)。
間違いさがし。の巻き。
上の黒竜江の事例のようにどこかの数値が含まれていないのかと思い、それぞれの行列の数値の足し算を確認してみますがオカシイところは見つかりません。小数点以下の端数の問題ではないと考えられるため悩んでみたところ、都市部の数値は各省の数値の合計より280.5万「多く」、農村部の数値は280.5万「少ない」ことが分かりました。なーんだ。
つまり、データを整理していた誰かが最後に280.5万契約を都市部の合計数値に足してしまい、一方で農村部の数値から280.5万契約減らしてしまったと考えられます。各省の数値にミスは無いと思われます。もっとも、280.5万という数字がどこから出てきたのかはよく分かりません。あえて指摘すると、ここは完全なる推測ですが、陕西と新疆の農村部数値の合計がほぼこれに近いため、このあたりが原因ではないかと。
データの利用には十分な注意を。
私自身たくさんのこのような事例にあたっているため感覚がやや麻痺しがちですが、中国のデータを用いる際、仮にそれが官公庁によるものであるとしても、少なくとも公表されている数値内での矛盾の有無は確認することが望ましいでしょう(かたいこと言ってみました)。