كيفية أرشفة المواقع الإلكترونية وجميع محتويات الإنترنت

بِسْمِ اللَّـهِ الرَّحْمَـٰنِ الرَّحِيمِ

أحيانًا عندما تزور موقعًا إلكترونيًا معينًا، قد تضع إشارة مرجعية عليه لقراءته لاحقًا أو لإضافته كمرجع أو لأي سبب آخر، ثم تعود لزيارته لتكتشف أن الموقع مُعطّل أو النطاق منتهي الصلاحية. لا توجد طريقة لاسترجاع المعلومات/المحتوى من الموقع الإلكتروني. هنا يأتي دور الأرشفة، يمكنك أرشفة الصفحة أو الموقع الإلكتروني محليًا أو على موقع إلكتروني خارجي حتى تتمكن من زيارته لاحقًا إذا حدث أي شيء يجعله غير قابل للوصول. مِن أحد فوائد أرشفة المواقع “الإخبارية/المقالات” عند نشرها فورا، ستمكّنك من قراءتها دون Paywall لاحقًا.

المواقع الشهيرة للأرشفة مثل https://web.archive.org و https://archive.ph مفيدة للغاية وسهلة الاستخدام. بالمناسبة، موقع https://archive.org محظور في العراق، يمكنك الوصول إليه من خلال خدمة تور المخفية (تحتاج إلى متصفح تور) أو عبر VPN. ولكن هذه المواقع يمكنها منع الوصول إلى الموقع المؤرشف إذا كان يحتوي على محتوى ينتهك قانون الألفية الرقمية (DMCA) أو يتعارض مع شروط الخدمة (TOS) الخاصة بهم لسبب ما (مثل البيانات المخترقة وما إلى ذلك).

هنا تساعدك الأدوات مفتوحة المصدر التي تحفظ مواقع الويب محليًا على جهازك.

كما هو الحال مع أي نُسخة احتياطية، يجب توزيعها عبر وسائل مختلفة مثل قرص صلب (HDD) آخر في حالة تلف القرص الصلب الرئيسي في جهازك.

الأداة الأقدم والأشهر هي wget و استخدام أمر مثل wget --warc-file ، لقد حظي أداة wget بدعم WARC منذ عدة سنوات. إنها أبسط وأسرع طريقة على الإطلاق لإنشاء أرشيف. لا يمكنها دائمًا التعامل مع المواقع الديناميكية المعقدة للغاية ولن تتعامل مع “تطبيقات” الويب بشكل صحيح، وبعض المواقع لديها تدابير مضادة قد تتسبب في فشلها. إنها خيار جيد لتجربته أولاً.

هنالك إضافة لكروميوم (Chromium) https://archiveweb.page (تم إنشاؤه بواسطة فريق webrecorder) يولّد الأرشيفات الأكثر اكتمالاً. ما عليك سوى النقر فوق الزر لبدء التسجيل، وسيقوم بإنشاء الأرشيف أثناء التصفح، بما في ذلك عند التفاعل مع المحتوى الديناميكي، أو التصفح إلى عناوين URL متعددة، أو استخدام أي ملفات تعريف ارتباط حقيقية أو معلومات تسجيل دخول في متصفحك، وما إلى ذلك.

تنويه :warning:: كن حذرًا من أدوات التتبُع والاستيثاق، ستحتوي ملفات الأرشيف الناتجة عن هذه الطريقة على ملفات تعريف ارتباط (cookies) لتسجيل الدخول والتتبُع. ليس من الآمن مشاركة الأرشيفات من جلسة تم تسجيل الدخول إليها. أوصي بإنشاء ملف تعريف منفصل للمتصفح يحتوي على هذه الإضافة ومسح ملفات تعريف الارتباط الخاصة بها بانتظام. راجع هذا التحذير من المطور الرئيسي، وهذه الملاحظة حول كيفية حفظ ملفات تعريف الارتباط في الأرشيف.

بمجرد الانتهاء، يتم حفظ أرشيف في الإضافة، ويمكنك “تنزيل” (في الواقع مجرد نسخ من وحدة التخزين المحلية للإضافة) أرشيف WACZ الناتج.

يتضمن الإضافة مشغل أرشيف يعتمد على نفس الكود مثل replayweb.page أيضًا، حتى تتمكن من تصفح أرشيفاتك بالكامل في الإضافة، هنا شرح سريع للإضافة.

بالنسبة لـتويتر Twitter/X الذي يحظر أرشفة منشوراته، يمكنك استخدام https://threadreaderapp.com/

هنالك مناقشة حول أرشفة المواقع البصلية .onion و لكن من الأفضل أن لا تضيف إضافات إلى متصفح تور إذا كنت ستسخدمة لإغراض غير الأرشفة.

عرض الأرشيفات باستخدام replayweb.page

يمكن لمشروع https://webrecorder.net/ آخر، https://replayweb.page، “إعادة تشغيل” ملفات أرشيف الويب، وخاصة تنسيقات WARC وWACZ.

  • يمكن استضافته ذاتيًا، وسهل الإعداد حقًا. أضِف حزمة replaywebpage NPM واستخدم مكون الويب <replay-web-page> الخاص بها لعرض الأرشيفات.

  • إنه آمن. فهو يمنع الصفحة المؤرشفة من الوصول إلى أي شيء خارج الأرشيف.

  • إنه يعمل على المواقع الثابتة (static sites)، دون الحاجة إلى كود من جانب (server-side) الخادم.

أرشفة مواقع التواصل الاجتماعي

ادوات أخرى و مصادر

https://github.com/ArchiveBox/ArchiveBox/wiki/Web-Archiving-Community#other-archivebox-alternatives

إضافة SingleFile جيدة لحفظ صفحة ويب كاملة في ملف HTML واحد.

إذا لديك أي سؤال أو استفسار.
انضم إلى مجموعة مجتمع أسس على:

ماتركس: https://matrix.to/#/#general:aosus.org

تيليجرام: Telegram: View @aosus

إذا وجدت المقالة مفيدة وتريد دعمي لمواصلة نشر المزيد من المقالات، تبرّع إلى عنوان العملة الرقمية الآمنة مونيرو

الخاصة بي:

85ZUT4vX6HJBDFpLoprbsMBWPih1nHpbqCYMnLYT4MxRSqfvfRpv9d1f6edyMyDr9dHsrryUn44LbLhQ82GSv4r2EH6B6MQ

6 إعجابات