【Wayback】 黒歴史の削除を断念した 【machine】

 時に事実の立証は難しい。


そんな時期がボクにもありました

 私がプライベートでインタネットを使い始めたのは2000年頃だと思う。当時は情報を発信することに優越感があり、個人のサイト(ホームページと呼んだ)を作成し、公開するのがちょっとしたブームになっていた。

 日立のPrius DECK 650R7CDに続き、IBMのホームページビルダー ver.6を買った私は、シコシコとサイトを構築し、プロバイダが回線のオマケに貸してくれたサーバで公開した。十数年をかけた紆余曲折はあったが、プロバイダのサービス(ホームページ公開用サーバの無料貸与)が終了したのに伴い、私のサイトも消滅した。

 若かりし私がネットに浮かれポンチだった頃の成果物とあって、当時のコンテンツは目も当てられないシロモノだった。時流もあって、相互リンクしていたサイトの多くも消滅が相次ぎ、検索サイトの結果からも消え、時を経るごとに、痕跡すら失われつつある。


Big Brother is watching you.

 そうはいっても未だに“当時”の片鱗を見られる。インターネットアーカイブが提供するWayback machineにアーカイブされているからだ。当時の私が公開していたサイトのURLを知っていれば、今だに誰でも閲覧できる。その内容は主に画像を中心に欠落があり不完全である。当時の私がHTMLを学ぶ一環でクローラ対策を施していた期間はアーカイブされていないが、初期や末期の様子を伺うことはできる。


ふと思い立って

 自身の管理下を離れた状態で公開され続けていることは知っていたが、今になってなんとなく気持ち悪く思え、「やはり消しておきたい」と思った。色々面倒臭い事は見聞きしていたので、少し調べ直した結果、現在の私には、アーカイブされてしまった情報の権利者であることを証明する術がなく、削除の要請を受理させるのが難しそうな事を理解した。

 インターネットアーカイブは、コンテンツの権利者に要求されれば削除に応じるのだが、コンテンツの権利者であることを証明するには、「アーカイブされた内容に管理者として明記されたメールアドレスを用いて削除申請のメールを送信する」など、幾つかの手段が提示されており、それに則っていない場合は応じてもらえないのだ。

 「人の作ったコンテンツを勝手に保存しておいて」と言いたくもなるが、「そもそも不特定多数が自由に参照できる状態で公開したのはあなたです」と言われたら「ぐぅ…」の音も出ない。「でも…」と反論できるか?彼らは人の創作物を盗用し、自身の創作と偽っているわけではなく、公開された当時と同じ状態を(可能な限り)再現し続けているだけなのだ。難しい。
 彼らにとっては、「人が過去にこさえたコンテンツを勝手に公開し続けるな」と言う主張と同じように、「すべて保存すると言っておきながらなぜ○○のコンテンツはないのだ」と言う主張を受ける可能性もある。その場合を考慮すれば、安易な削除要請の受け付けもリスクと考えているだろうことは想像に易く、納得できる面もある。

 個人的には、自覚の有無や回線の内外を問わずノアの箱舟を再現したがるアメリカ人の行動を興味深く思う。


まずは単純にメールを送信

 手っ取り早く削除の要請をメールで送信してみた。送信先は、公式サイトの情報に不備があり、提示されているにもかかわらず反応してもらえないアドレスがあるとのことで、有望とされるアドレス3つ(info@archive.org, wayback@archive.org, wayback2@archive.org)へ同時に送信した。文面は検索して見つけたサイト(アドレスは忘却)から丸パクリし、URLのみ変えた以下の内容だった。

Please eliminate my site <アーカイブから削除して欲しいサイトのURL> from Wayback Machine. Thank you.

 超ぶっきらぼうだが、英語で送らなければならない都合上、仕方がなかった。


意外にも迅速な返信

 時差もあるが、噂と違って反応は迅速だった。送られてきた文面は定型文の様だが、そのまま載せて良いか判断できないので、Google翻訳(悔しいけど優秀だね)で日本語化した文面を以下へ掲載する。

こんにちは、

インターネットアーカイブでは、ウェブサイト/ウェブページをWayback Machine(web.archive.org)から除外できますが、次のいずれかを行って、サイト/ページの所有者またはコンテンツの作成者であることを確認するようお願いします。
(注:これらのオプションは、以前のWayback Machineキャプチャにあるコンテンツ、および/または指定した期間に関連するドキュメントを参照しています。)

*サイト/ページに記載されているメインのメール連絡先からリクエストを送信し、それがどこにあるかを示します(存在する場合)。
*登録者のメール(WHOISルックアップで公開されている場合はリンク可能)またはサイトにリストされているウェブマスターのメールからリクエストを送信します。
*サイト/ページの所有者または除外したいコンテンツの作成者としてあなたを識別する方法であなたの個人情報(名前、連絡先、自己の画像)がサイト/ページに表示される場所を教えてくださいこの場合、有効な写真付き身分証明書のスキャンを介して本人確認をお願いします(生年月日、住所、電話番号などの機密情報は編集可能です)。
*サイトの所有者として、および/またはページの所有者/コンテンツの作成者としてサイトに宛てられたホスティング会社またはレジストラからの通信を転送します。

(注:誰かの名前/ユーザー名、および/またはサイト/ページ/アカウント間のハイパーリンク/リダイレクト自体の単純な言及は、通常、アーカイブを除外するには不十分です。)

これらのオプションのいずれも利用できない場合は、このメールへの返信でお知らせください。

できるだけ多くのアーカイブを保存していただけるとありがたいです。したがって、懸念される特定のURLまたはディレクトリのみがある場合はお知らせください。残りのアーカイブは利用可能にしておきます。
ご存知かもしれませんが、インターネットアーカイブは非営利のデジタルライブラリであり、Wayback Machineを介してインターネットの自由にアクセス可能な履歴レコードを維持しようとしています。アーカイブ内の資料は、営利目的でインターネットアーカイブによって悪用されることはありません。

 結論を言えば却下された。予想通りなので問題ない。

 *の一つ目は「アーカイブされている内容に管理者として掲載されているメールのアドレスを用いて削除を申請しろ」である。だが私が当時のコンテンツに管理者として載せていたメールアドレスは変更したため今は使えない。

 *の二つ目は不勉強でよくわからない。

 *の三つ目は無理だ。当時はインタネット上の情報管理が今よりも格段にルーズだったとはいえ、さすがに自身の肖像や実名および住所などを公開していなかった。

 *の四つ目は恐らくサイトに関するプロバイダなどとのやり取りを言っているのだと思うが、ほとんどの処理がWebページを介して行われたため、メールを始めとした電子ファイルは残っていない。メールがあったとしても、メーラの乗り換えなどにより、古い物は喪失している。


現在のブログと連携させ再度メールを送信

 あるサイトの情報に「アーカイブされた内容に移転先として現在のブログをリンクしていたので、現在のブログ内に削除したい旨を表明したページを作成し、削除を要請するメールへブログに作成したページのURLを記載することで管理者であることを立証した」との情報を見つけた。

 そこで私もこのブログにパスワードを掛けた固定ページを設け、そこへ以下の内容を記した。

To The Internet Archive Team.

Please delete the Web site (アーカイブから削除して欲しいサイトのURL) that I managed in the past from the archive.

The email address at that time (アーカイブから削除して欲しいサイトのURLで管理者として公開していたメールアドレス) was changed due to spam countermeasures.

I am convinced that the URL linked with HTML archived at the end (2016/09/03) is the TOP page of this blog, which is sufficient for proof of being an administrator.

 簡単に言えば「アーカイブされているURLの内容を削除して欲しい。当時のメールアドレスはスパム対策で失効した。最後となる2016年09月03日にアーカイブされた内容に記されたURLは提示したブログのTOPページであり、管理者の証明にじゅうぶんと思う」である。その上で先のページを告知するメールを以下の文面で送付した。

Hello,

To prove that I was the administrator of the archived content, I posted a request for deletion and the reason for the deletion on my blog.

Please check the web page below and delete the archive.

URL : (ブログで公開した削除要請のページURL)
Password : (上記を閲覧するのに必要なパスワード)

 簡単に言えば「アーカイブされたコンテンツの管理者であることを証明するために、削除のリクエストと削除の理由をブログに投稿しました。以下のWebページを確認して、アーカイブを削除してください」である。


ダメだしを食らう

 今回の返答も素早かった。その内容を前回と同様にGoogle翻訳で日本語化して以下へ掲載する。

こんにちは、

ここでご回答いただきありがとうございます。

(ブログのURL)に除外リクエストを投稿しても、最初の返信で言及したように、本質的に[アーカイブから削除して欲しいサイトのURL]の所有権を証明するものではないことに注意してください。

誰かの名前/ユーザー名、および/またはサイト/ページ/アカウント間のハイパーリンク/リダイレクト自体の単純な言及は、通常、アーカイブを除外するには不十分です。
残念ながら、このリクエストに関するサイト/ページの所有権またはコンテンツの作成者をまだ確認できていません。

または、該当する場合、著作権ポリシーに従って著作権侵害の申し立てを送信することもできます。著作権ポリシーは、http://www.archive.org/about/terms.phpのサイトに掲載され、以下に複製されます。

著作権ポリシー:
インターネットアーカイブは、他者の知的財産権およびその他の所有権を尊重します。インターネットアーカイブは、適切な状況およびその裁量で、特定のコンテンツを削除するか、他者の著作権またはその他の知的財産権を侵害していると思われるコンテンツへのアクセスを無効にする場合があります。インターネットアーカイブを介して入手できる資料によって著作権が侵害されていると思われる場合は、インターネットアーカイブ著作権エージェントに次の情報を提供してください。

*侵害されたと主張する著作物の特定。
*苦情を申し立てる資料がインターネットアーカイブコレクション内のどこにあるかの正確な説明。
*あなたの住所、電話番号、メールアドレス。
*紛争のある使用が著作権所有者、その代理人、または法律によって許可されていないという誠実な信念があるというあなたによる声明。
*偽証罪の罰則に基づいてなされた、あなたの通知の上記情報は正確であり、あなたは関係する著作権の所有者であるか、その所有者に代わって行動する権限があるというあなたによる声明;そして
*電子署名または物理署名。

インターネットアーカイブ著作権エージェントには、次の方法でアクセスできます。

 却下されたうえに「著作権を侵害されたとするならば…」と言う話しに拡大されつつある。かつての私が作ったコンテンツをアーカイブから消して欲しいだけなのだが…。


少しムッとして再々度メールを送信

 正直に言えばイラっとした。世界中のコンテンツを勝手に保存しておいて、英語にしか応答しねーし…。そこで最初の応答に記載されていた一文「これらのオプションのいずれも利用できない場合は、このメールへの返信でお知らせください。」を引用した以下の文面を返信した。

Hello.

> If none of these options are available to you, please let us know in a reply to this email.

Is there any other way?

The email address (アーカイブから削除して欲しいサイトのURLで管理者として公開していたメールアドレス) used to manage the site (アーカイブから削除して欲しいサイトのURL) you want to delete from the archive is It has expired.

The only information that can identify the administrator contained in the archive appears to be the expired email address.

There is no record of interaction with the provider about the site.

I have the complete source code (5.3MB) including the missing part in the information archived on 2016/09/03.

 「『返信でお知らせください』との事だが、私に何かできますか?削除して欲しいアーカイブされた内容に使われていたメールアドレスは失効済み。削除して欲しいアーカイブされた内容に含まれた管理者を特定できる情報はメールアドレスのみと思われる。削除して欲しいアーカイブされたサイトに関するプロバイダとのやり取りは記録がない。2016/09/03にアーカイブされた情報の欠落部分を含む完全なソースコード(5.3MB)は持っている」と。要は「あなた方がアーカイブした内容では欠落している情報を含むソースコードを持っていること以外に管理者だったことを証明する術が私には思いつかない」と主張したのだ。

 願わくば「確認するからソースコードを見せてくれ」と言って欲しかった。そうなった場合、既にアーカイブ済みの内容を補填するのに使われやしないか?など懸念はあるが、ソースコードの提示と引き換えに削除してもらえる可能性があると見込んだのだ。


切って捨てられる

 中身がない上に毛髪も乏しい頭を絞ってでっち上げた内容は、そっけない返事で済まされた。以下はGoogle翻訳で日本語化した内容。

こんにちは、

以前の返信で提供された指示に従って、著作権侵害の申し立てを送信できます。

 「だからさぁ…権利を侵害されたなんて言っているんじゃないんだYO!活動の趣旨には一定の理解が及ぶんだけど、かつての私が作成および公開したコンテンツは現在の私の思想や趣旨に沿っておらず、今後は公開したくないので、アーカイブから削除して欲しいだけ。要請の正当性に対しナーバスになっている理由も察してはいるんだけど、誠実に可能な限りの手段で管理者だったことを表明している要求を、受け付けてはもらえないか?と言ってるんだけどっ!?」
 …と、キレそうになった。

 言語の問題があるとは言え、返答のそっけなさは怒らせてしまった可能性を示唆しており、失敗だったかもしれない。


画像を根拠に再々々度メールを送信

 そんな時にWebを検索し直すと、「サイト内で公開していた画像がアーカイブされていた場合、全く同じ画像を添付し根拠にすれば受け付けてもらえるかもしれない」とする記事を見つけた。最初に申請したメールへの返答に書かれていた手段では、個人情報として「自己の画像(要は自撮りまたはセルフィ)」を例示されていたので諦めたが、サイトへ掲載した当時の愛車などを撮った画像であれば提示できる。末期にアーカイブされた内容で使っていた画像を加工する前の原本を探し出し、添付したメールを以下の文面で送信した。

Hallo.

I found evidence that I was the creator of “アーカイブから削除して欲しいサイトのURL”.

I have attached the original image of the image posted on the site you want to delete.

Archived as “アーカイブから削除して欲しいサイトで公開していた画像のURL” on May 26, 2011 and December 20, 2012.

 簡単に言えば「『アーカイブから削除して欲しいサイトのURL』の作成者である証拠として、削除して欲しいサイトに投稿された画像の原本を添付しました。2011年5月26日および2012年12月20日に『アーカイブから削除して欲しいサイトで公開していた画像のURL』としてアーカイブされています。」と言う内容である。被写体に言及していないのは故意である。


おじさん、とうとうシカトされる

 同時期にメインPCが不調に陥り、メールの送受信が滞ってしまった。Windows 10に標準のアプリ、メール(IMAPに対応したWebサービスのメールが前提で機能に乏しい)を使っていることもあり、本件に関するやり取りを含む送信メールも喪失してしまった。

 環境をでっちあげ、メールをチェックしたが、返信は届いていなかった。「話が通じないうえにしつこい面倒なジャップだ」と思われたのかもしれない。


おじさん、心が折れる

 ココで諦めた。彼らが先のメールで提示した著作権侵害に対する申請は、ハードルが高い。

 私はインターネットを使い始めて20年になろうとしている。初期のメールアドレスは残っていない。アーカイブされた内容に、現在の私が行使できるメールアドレスは含まれていない=メールアドレスでは自身がアーカイブされた内容の権利者であることを立証できない。
 アーカイブから削除して欲しいサイトと同じドメインのメールアドレスなら申請が通るらしいが、私が契約していたプロバイダは、メールとホームページで下層ドメインが違ったのも分が悪い。

 検索の結果では、「アーカイブされた内容に移行先としてリンクしていた現在のブログに削除の意向を表明したページを公開し、そのURLを削除を申請するメールに記載して知らせたことで削除してもらえた」との報告があったので真似てみたが、取り合ってもらえなかった。

 先方が管理するアーカイブでは欠落している分も含めたソースコードの提示を示唆してみたが、相手にされなかった。

 メールに記された「提示した手段が行使できないなら返信で相談してね」を信じて問い合わせたら「著作権侵害を申し立てる権利があるよ」って…。なら最初からそう書きゃいいじゃん…。それにそう言うことじゃねぇんだよ…。

 Webを検索して得られた情報では通用していた内容と、ほぼ同じ行動をとっても却下されているので、機械翻訳の結果や担当した方の解釈に影響を受けたり、経時により運営団体のスタンスが変化している可能性もある。なんにせよ非英語圏の人間は不利なことが否めない。

 腑に落ちない面はあるが、先方が提示する条件を満たせているか危うい自覚はある。機械翻訳の英文に迅速な返信を寄越し、やり取りに応じてくれたことを思えば、運営団体の対応は誠実と思う。担当してくれた方はギークじゃないかな。

 個人でサイトなどを管理した経験がある場合、サーバから消したり、検索エンジンに申請して結果から除外してもらうなどし、Webから消したつもりになっても、Wayback machineにアーカイブされていないか確認したほうが良い。アーカイブされていた場合、管理者であることを証明する手段を有している内に、保持させるかどうか?一考することをお勧めする。
 なにかと変化が激しいネット社会。先送りしていると、サービスの終了など(プロバイダのサーバ名が変更になるなど)により、権利者であることを立証できなくなる可能性がある。当初からrobots.txtなどで対処しておけば安心度を高められる。


一度ネットで公開した情報を完全に消すことは不可能

 つまりはそう言うことだ。公開する側の自由度と同じように、公開された側の自由度も高いのである。その様相は「自由には責任が伴う(キリッ」と言う、面倒臭ぇ先人の発言そのもの。幸いにもWayback machineのアーカイブは、検索サイトのクローラが機能しない?ので、公開されていた当時のURLを知らない者は閲覧できないのが救いではある。

 だがそういった情勢はいつ覆るかわからない。加えて言えば、削除の申請が受理されても安心できない。どこのサイトかは忘れたが、削除が受理され表示されなくなったが、その際に表示される英文メッセージは、解釈によって「表示しないだけ」と受け取れるそうで、アーカイブから削除されたかどうか微妙に感じておられるようだった。

 ネットへ流出した公開を望まぬ情報は非常に厄介だ。“忘れられる権利”や“デジタルタトゥー”などという単語が出現するのは端的な例だ。訴訟など正式な法的手段に訴えることも可能だが、手続きに専門的な知識を要求される(≒カネが必要になる)ため、多くの方にとって非現実的であろうし、可能であっても時間を要する=その間にも情報は拡散する=イタチごっこ=決定的な収束は難しい。

 TwitterやInstagramのように、利用者が膨大で更新も頻繁なプラットフォームのURLはクロールが追い付きにくいが、閲覧者によって保存され、彼らによって転載・拡散されるなどした情報は、誰にも制御できない状態でインタネット上を漂い続ける。その過程でアーカイブされれば、未来永劫に渡って保存され、その削除も難しい。

 パソコンの大先生として、強く肝に銘じておきたい。


 どんなサイトを消そうとしたのか?“Sorry Japanese Only.”などと書き、全世界と繋がっている感をアッピールしていたようなアレだよ…。んじゃ。

C-Low について

私はロボットではありません 森の木を数え続け 穴を掘っては埋め戻す シベリアで生きるべきヒトです 頭上の星に羨望を抱き 足元の砂に固執します 理解や共感を得られない 排斥の対象です 競争力が乏しく 活路を見い出せません 需要が皆無で 居場所はありません 過程を終え 結果に至っています 社会に適応できない私の発言を 鵜呑みにしないでください ※アイコン(半額シール)の著作権は“イラスト素材 夢想屋”にあります https://musouya-haru.xyz/2019/04/20/discount-seal/
カテゴリー: コンピュータとインターネット, 雑談・愚痴・独り言 タグ: , , , , , パーマリンク

【Wayback】 黒歴史の削除を断念した 【machine】 への15件のフィードバック

  1. 匿名 より:

    お節介ながら失礼します。

    コメントを見ていたら、心配そうなものがありましたが何通もメールを送ってあっちの方から「こいつ第三者(偽物)だな」と思われて、著作権侵害や個人特定の開示請求、「海外の裁判所に来い」というものがメールや自宅に届いたのですか?

    • C-Low より:

      コメントありがとうございます
      文面から新規の方とお見受けしたのでそのつもりで返答します

      ご質問にある 「あっちの方」=インターネットアーカイブの管理者と解釈し返答します
      記事の執筆者かつコメントへの返答者である私は「著作権の侵害」「個人特定の開示請求」「海外の裁判所への呼び出し」等されておりません
      2024年04月08日~2024年04月09日に計3回コメントいただいた“匿名”様のことは存じかねます

  2. C-Low より:

    コメントの階層が限界の3に達したため新規に書き込みます

    >他にもそのウェイバックマシンからは「なりすまし」とか「裁判します」とか訴えはありましたか?
    ありません

  3. 匿名 より:

    初めまして。

    ウェイバックマシンの削除って難しいのですね!!!

    断念してからそのウェイバックマシンから何かメッセージとかは来たのですか?

    • 匿名 より:

      (追記)特に海外から「迷惑メール」とかで訴えられたりしたのはありましたか?

    • C-Low より:

      コメントありがとうございます

      >断念してからそのウェイバックマシンから何かメッセージとかは来たのですか?
      インターネットアーカイブとのやり取りは記事で報告した内容が全てです

      >(追記)特に海外から「迷惑メール」とかで訴えられたりしたのはありましたか?
      ありません

      • 匿名 より:

        他にもそのウェイバックマシンからは「なりすまし」とか「裁判します」とか訴えはありましたか?

  4. C-Low より:

    コメントの階層が制限の3に達したため
    返信として新規に書き込みます

    >時間が経てば消える可能性はありますか?
    経時のみを理由に削除される可能性は低いです

    >5年経過すれば完全削除されると思います。
    私が知る限り20年も前のシロモノが保存されています

    どの情報がいつ保存されるか?は
    我々外の人に知る由は無く
    恐らくロボット(プログラム)による自動処理なので
    中の人に聞いても答えられないと思います

    匿名さんの経験談に関しては
    ツイ廃≒単位期間当たりの更新が過多だったためクローラーが追い付かず
    保存されずに済んだ…逆も真なり…のだと思います

  5. 匿名 より:

    こんちには、ウェブアーカイブのことがよくわからないのですが
    私も黒歴史があります
    Twitterなんですがもうツイートも消し、魚拓はほとんど残っていません
    ウェブアーカイブで
    Twitter @アカウント名で色々検索しでヒットしませんでした
    また、10人くらいの規模の公開のTwitterアカウントもurlで検索しましたがウェブアーカイブされていませんでした
    ウェブアーカイブって全て記録されているわけではないのですか?

    • C-Low より:

      コメントありがとうございます

      回答 : 彼らが合法的に可能な限り全て保存されます

      Wayback machineの基本的な行動原理は
      「Webにおける全てを保存する」だった筈ですが
      資源(≒金)に限界があると共に
      アクセスする権利がない情報は参照できず保存されません

      記事にも記した通り
      Twitterを始めとしたSNSは
      利用者が膨大で更新の頻度も高いため
      よほど長期間にわたり公開しっ放さない限り
      クローラーが追い付かず保存されにくくはある…筈です

      • 匿名 より:

        そうなんですね、あと時間が経てば消える可能性はありますか?私は四年前ツイ廃(フォロー5000フォロワー5000毎日ツイート2年間使用)でしたがその当時のURLは11件しか残ってませんでした。そのアカウントは削除しました。
        逆に2年前のTwitter(フォロー20フォロワー600 そんなにツイートしてない)動かしてなかったものは1200件ほど残っていてびっくりしました。このアカウントも消しました。

      • 匿名 より:

        あと追記なんですがそのアカウント(フォロー5000フォロワー5000)の前のユーザーネームは一件も出ませんでした
        5年経過すれば完全削除されると思います。

  6. 匿名 より:

    半年くらいずっと諦めずに、あの手この手とメールしていたら、最後に決めてとなる言葉がヒットし、削除されました。
    一方的でも、送り続けるのがコツだと思いました。

    • C-Low より:

      コメントありがとうございます

      おめでとうございます!
      HAN-TOSI!?
      凄いなぁ…根気の成果ですね

      私は身悶えながら静観しております
      看過できなくなった暁には
      匿名さまの報告(≒可能性はある?)を胸に
      再挑戦しようと思います

  7. C-Low より:

    日本における知的財産権の前提に
    「公開済みの情報で特許は取得できない」
    と言う条件があることを
    以前の職場で見聞きした不確かな記憶がある

    米国の司法では以下のような判断が下された
    https://gigazine.net/news/20200130-us-court-scraping-legalized/

    おじさんの敗訴は確実である

コメントを残す