制作物に、意図していない情報が勝手に付加される世の中
いつのまにやら、文書や画像や動画を作ると、製作者が意図していない情報がソフトウェアや電子機器によって勝手に付加される世の中になっていたりします。問題点についてまとめるための、自分用のメモ。まとまってません。
---
まずは最近話題の事件 ふたつ
Harry Potter and the Digital Fingerprints(EFF)
ハリーポッター最新作の発売前、全ページを写したデジカメ画像が漏洩したそうですが、その画像ファイルには各種のメタ情報がデジカメによって付加されており、間抜けな漏洩犯人の撮影条件の詳細やデジカメの機種からシリアル番号までばればれだったそうな。極端な場合、シリアル番号とユーザー登録情報が結びつけば、写真一枚から完全に個人を特定できる場合もあるでしょう。
ネットに写真を公開している人は多いでしょうが、この漏洩犯の間抜けさを笑える人は、どれくらいいるでしょう?
もうひとつ、EFFから
Is Your Printer Spying OnYou?(EFF)
世の中のカラープリンタの多くは、印刷物に対して、印刷者の各種情報が特定できる目に見えない情報を勝手に付加しているそうです。もちろんユーザーの大部分は知りません。具体的には、印刷日時やプリンターのシリアルナンバーが、目に見えない黄色いドットパターンで描かれています。おそらく目的は著作権関連やら偽札防止なのでしょうが、あなたのうちや職場のカラープリンタも例外じゃない……かもしれませんよ。
これも参照
見えますか? カラーレーザープリンターの印刷物に埋め込まれた暗号コード(Technobahn)
実は結構前から話題だったりします。
プリンタが追跡コードを強制的に付加している?(セキュリティ&コンサドーレ札幌 2005.10.19)
その他、関連するかも知れない最近のニュースとか
アップルのDRMフリー音楽、ファイルには購入者の名前入り?(Technobahn 2007/5/31)
Officeファイルのプロパティに個人情報を保存させない(ITmedia)
---
付加される情報の例とか
(1)全てのファイルの場合
ファイルである限り、ファイル名、作成年月日、容量、利用したアプリケーション、持ち主などは自動的に付加されれますね。
(2)wordファイル
プロパティとして、タイトル、作成者、会社名、etc
(3)デジカメの写真ファイル
Exifという規格の場合、日付、時間、焦点距離などの撮影条件、etc。さらにカメラの機種やシリアルナンバーまで記録されています。上のハリーポッター漏洩事件の写真は、この規格でした。
(4)音楽のMP3ファイル
ID3タグにアーティスト、アルバム名、日付、そしてなんでも入れられるコメント文字列、などの情報が。
(5)印刷物(紙)
上の例であげたカラープリンタが内緒で印刷しているドットパターンの場合、プリンターのメーカー名、機種名、シリアル番号、印刷された日時などの情報だそうです。
(5)その他 (妄想含む)
映像だろうがグラフィックだろうがテキストだろうが、ありとあらゆるものに対して、アプリケーションや機器が情報を勝手に付加する可能性があります。しかも、その事実や内容が公開されていないものも多数あると思われます。
最悪の場合、PCで作成されたデータにはMACアドレス。さらに携帯電話で作成されたデータには、電話番号やGPSによる情報まで付加される可能性が考えられます。機器のシリアルナンバーの場合も含めて、ここまでの情報があれば、ほぼ完全な形で個人情報をトラッキングできるかもしれません。
---
ユーザーが知っているかどうかによる分類
(a)付加される情報の内容がユーザに公開され、削除方法が存在するもの
上のデジカメのファイルの例の場合、一応規格が公開されてます。素人で知っている人は少ないでしょうが。また最近は、情報漏洩防止のため、あえて電子透かし挿入アプリケーションを導入している法人も多いかも知れません
(b)付加される情報の内容がユーザに公開されていない、または削除不可能なもの
上のプリンタのドット情報などは、メーカーは存在自体を認めていません。その他、独自フォーマットを採用しているアプリケーションは、なんらかの情報を付加してる可能性があります。ちょっと倫理的に問題があると思われますね。
---
付加される方式による分類
(c)ユーザが作成した情報とは別に、切り離して記録されるもの
規格が公開されている普通のメタデータの類は、大抵これです。著作物のデータはそのままで、メタデータが付け加えられます。上のプリンタのドット情報も、制作物が文字情報だけの場合には、この分類になると思います。(ドットは文字と関係ないから)
(d)ユーザーが作成した情報にまぎれて付加されるもの
画像や音楽のファイルに、人間には認識できないノイズとして任意の意味のある情報を載せることが可能です。俗にステガノグラフィと呼ばれる技術です。上のプリンタのドット情報は、出力したのが画像や写真の場合、この分類になるでしょう。
ユーザーが知らないでこの方式をとられると、道義的な問題やプライバシーの問題のほかに、ユーザーの著作物のデータそのものを勝手に改変してしまうという意味で、かなり問題があるような気がします。
| 固定リンク


コメント