2007年 11月 23日
CD2枚に2500万人のデータ?
奥村先生のブログ「英国で人口の4割の個人情報が紛失」にも書かれてるが,果たしてCD2枚に2500万人のデータが入るのだろうか?

 BBC Newsの「Brown apologises for records loss」には
The Revenue and Customs data on the two missing discs includes names, dates of birth, bank and address details.
のように「discs」と書かれているが,下のイラストには「 LOST CDS - SEQUENCE OF EVENTS」というキャプションが入ってるし,その説明には
18 October - Junior official from HMRC in Washington, Tyne and Wear, sends two CDs containing password-protected records to audit office in London through courier TNT, neither recorded nor registered
と書かれているからCDなんだろう。
 「MISSING DATA INCLUDES 」には,紛失されたCDに記録されているデータの元である用紙が掲載されている。
 社会保険番号は9桁,生年月日は6桁だし,名前や郵便番号付きの住所も書く欄がある。

さて,CD-Rは700MBなので,2枚で1400MB。これを2500万人で割り算すると58.7となる。一人当たり58バイト程度しかない。そのうち15桁は社会保険番号と生年月日だとすると43バイトで住所,氏名,性別が記録できる必要がある。

住所の一部が同じとか,ファミリーネームやファーストネームが同じという人が多いだろうから(同じ地域なんだから),うまくデータ圧縮できたんだろう。Windows標準のZIPだったのか,知りたいなぁ。LHAだったらCD1枚にできたりして!(^^)!
 で「password-protected」と書かれているから,圧縮ファイルにパスワードがかかっていただけなのではなかろうかと想像する。
[PR]

by ji3faf | 2007-11-23 20:01 | 情報教育


<< きめセリフは関西弁で      「ゴロー 行きまーす,なんてな」 >>


にほんブログ村 教育ブログへ




Map