10547575 248833148647455 5753183542493471764 n

10547575_248833148647455_5753183542493471764_n

قبل ظهور برامج ضغط الملفات كانت الملفات تأخذ حجم كبير  على القرص الصلب او اثناء التحمٌل من النت وبظهور هذه البرامج استطاعت تقلٌل حجم الكثٌر من الملفات بواسطة العدٌد من الطرق سوف نشرحها فٌيما بعد
مما ساهم فًي تقلٌيل الحجم وتوفٌر مساحة حرة فًي القرص الصلب  وسهل من عملٌية التحمٌل من الوٌيب 
وفًي حال قمت بتنزٌل عدة برامج وملفات من اإلنترنت من قبل فقد تكون تعرفت إلى ملفات بصٌيغة zip . او rar
خصوصاً نظام الضغط هذا المستخدمً في الانترنت rar

حيث يتيح  من تقلٌل العدد الاجمالي  من وحدات ً المساحة  Bits & Byte لملف ما وبالتالي اصبح نقله أسرع عبر خادمات الانترنت ويحتل مساحة أقل

عند حفظه على قرص ما. حالما تم تنزيل الملف

يقوم الحاسب باستخدام برنامج مثل WinZip  أو WinRAR او غٌره… لتوسٌع الملف 

وإعادته إلى حجمه الاصلي . وفي حال كان كل شيء ٌيعمل بشكل صحٌح فإن الملف المعاد توسٌيعه هو نفسه الملف الاصلي
قبل أن تجري عملٌية ضغطه
من النظرة الاولى يبدو الموضوع غامضا ً جداً.

كيف بالامكان تقليل عدد البيانات ومن ثم إعادتها إلى وضعها الاصلي  

برامج ضغط الملفات:
WinRAR-
WinZip-
ZIP-7-
KGB-
وغٌرها……….

آلية عمل برامج ضغط الملفات:
هل  تسائلت مع نفسك كيف تعمل خاصية ضغط الملفات التي على حاسوبك ؟

لعلك سمعت ببرامج ضغط الملفات
كبرنامج WinRAR؟ او برنامج ZIP لكن السؤال المطروح كيف تعمل هذه البرامج وكيف يمكنها ان توفر لنا المزيد من
المساحة في القرص الصلب عبر ضغط الملفات ؟ .

هناك أسلوبٌن في عملية ضغط الملفات والتي تعتمدها اغلب برامج ضغط الملفات:
1- الغير منقوص lossless

2- lossy المنقوص
تعال لنتعرف علٌهما عن قرب.
نبدأ بالطريقة الاولى Lossless
بالنسبة للضغط غير المنقوص، تحصل على نفس الملف بالضبط عندما تقوم بفك الضغط.

الضغط غير المنقوص هو
المستخدم في برامج الضغط مثل WinRAR
هذه العملية يمكن ان نطلق عليها كذلك اسم الضغط بدون خسارة و بدون فقدان البيانات ، كيف ؟

فطريقة Lossless تعمد
على إعادة تمثيل البيانات اي اننا سنقوم بحذف التكرار فقط مع االحتفاظ بالبيانات الاصلية

ايجاد التكرار

تحتوي معظم ملفات الحاسب تكرارا الى جد ما فهي تحتوي المعلومات نفسها مدرجة مرارا وتكرارا وببساطة فان برامج ضغط الملفات تتخلص من هذا التكرار فعوضا عن ادراج المعلومة نفسها مرة تلوه الاخرى يقوم برنامج ضغط الملفات بادراج هذه المعلومة مرة واحدة فقط ومن ثم يعود اليها كلما ظهرت في البرنامج الاصلي 

وكمثال على هذا لنلق النظرة على صيغة مالوفه من المعلومات الا ووهي “الكلمات “

في خطاب تنصيبة عام 1961 اطلق الرئيس الامريكي جون كيندي مقولته الشهيره :

Ask not your country can for you . ask “what you can do for your

وترجمتها :

لا تسل ماذا يمكن ان يقدمه لك بلدك , اسال ماذا يمكنك ان تقدم لبلدك 

يوجد في الجمله الانجليزية 17 كلمة و 61 حرفا و 16 فراغا وفاصلة واحدة ونقطة واحدة وفي حال كان كل حرف او فراغ او علامة ترقيم تاخذ وحدة قياس واحدة من الذاكرة فسيكون حجم الملف الكلي 79 وحدة ولاختصار حجم هذا الملف لابد من البحث عن التكرار وسنلاحظ ما يلي :

ask : تتكرر مرتين 

what : تتكرر مرتين 

country :  تتكرر مرتين

can : تتكرر مرتين

do :  تتكرر مرتين

for :  تتكرر مرتين

you :  تتكرر مرتين

وبجاهل الفرق في شكل الاحرف ما بين كبير وصغير فان نصف الجمله مكرر تقريبا . تسع كلمات وهي 

ask, not, what, your, country, can, do, for, you

تعطي كل ما تحتاجة هذه الجمله لاتمام المعنى .

ولبناء القسم الثاني من الجملة فان كل ما يلزم هو الاشارة الى الكلمات في الجزء الاول ووضعها في الفراغات المناسبة مع علامات الترفيم سنرى فيما سياتي كيف تقوم انظمة ضغط الملفات بانجاز هذه المهمة .

الية البحث عن تكرار :

بغرض تقليص الملفات تستخدم معظم برامج ضغط الملفات عدة قواميس من المتواليات الحسابية المتوافقة مع LZ وتشير LZ الى اسمي مخترعي المتواليات وهما LEMPEL  و ZIV 

فيما يشير القاموس الى المنهج المستخدم في فهرسة اجزاء المعطيات , تختلف انظمة ترتيب القواميس لكن طريقة انشائها سهله وتشبه عملية ترقيم الجداول وعند استعراض مقوله كيندي الشهيره يمكن اختيار الكلمات المتكرره ووضعها في فهرس مرقم ومن ثم كتابه الرقم عوضا عن كتابه الكلمه كلها وهكذا سيكون لدينا القاموس التالي :

Ask
What
Your
Country
Can
Do
For
YOU

وبالتالي سيصبح بالامكان قراءة الجملة على الشكل التالي 

NOT2345678. 128567341 

عند معرفة طريقة عمل النظام سيصبح من السهل اعادة بناء العباره الاصليه باستخدام القاموس وهذا تماما ما يفعله برنامج فك ضغط الملفات عندها يعيد توسيع الملف الذي يجري تنزيله ومن ناحية اخرى فان بعض الملفات المضغوطة تتوسع من تلقاء نفسها ولانشاء هذا النوع من الملفات يقوم المبرمج بتضمين الملف المضغوط برنامج توسيع بسيط يعيد الملف اليا الى شكلة الاصلي تماما حالما يتم تنززيله لكن ما مقدار المساحى التي تم توفيرها مع هذا النظام ان 

NOT 2345678. 1128567341 بالتاكيد اقصر من 

Ask not what your country do for you. Ask what you

ومن المهم عدم نسيان الحاجة الى حفظ قاموس الضغط من الملف ان احتساب مستلزمات ملف ما في مخطط ضغط حقيقي ستكون معقدة بعض الشيء ولكن بالعودة الى الفكرة القائله بان كل حرف او فراغ ياخذ وحدة قياس واحدة من الذاكرة 

لوجدنا فورا بان العبارة الكاملة ستحتل 79 وحدة من الذاكرة فيما ستاخذ الجملة المضغوطة بيما فيها الفراغات 37 وحدة والقاموس الذي يتضمن الكلمات والارقام سياخذ ايضا 37 وحدة مما سيجعل حجم الملف الاجمالي 74 وحدة وبالتالي لا يوجد تقليل ملموس لحجم الملف 

لكن تبقى هذه الجملة واحدة فقط ويمكن لنا تخيل ما يمكن لبرنامج الضغط فعلة في حال العمل على بقية خطاب كيندي حيث سنجد هذه الكلمات بالتاكيد بالاضافه الى كلمات كثيرة اخرى بالتالي سيعيد البرنامج كما سنرى لاحقا كتابة القاموس الخاص بذلك النص للحصول على تنظيم اكثر فاعليه 

البحث عن الانماط :

في المثال السابق قمنا باختيار كل الكلمات المكرره ووضعناها في القاموس وكانت هذه الطريقة بالنسبة لنا واضحة لكتابة القاموس لكن برنامج الضغط يرى الامر بشكل مختلف تماما فهو لا يحتوي على اي مفهوم عن الكلمات المنفصلة وانما يبحث عن الانماط فقط 

ويقوم البرنامج باختيارها بعنايه لتضمينها في القاموس ليقلل من حجم الملف قدر الامكان في حال التعامل مع العبارة في المثال , من هذا المنظور سيتم التوصل الى قاموس مختلف كليا عندما يقوم برنامج ضغط الملفات بتفحص عبارة 

كيندي فاول ما سيظهر بشكل متكرر 

not what your ask

هنالك نمط متكرر يمثل في الحرف T متبوعا بفراغ بين الكلمتين NOT و WHAT

وفي حال قيام برنامج الضغط بكتابة هذه المعلومة في القاموس يمكن كتابة القيمة 1 في كل مرة يكون فيها حرف T متبوعا بفراغ لكن هذا النمط لا يتكرر بشكل كافي في هذه العبارة القصيرة لجعل كتابة هذا المدخل في القاموس مجديا وبالتالي فان البرنامج  سيمحو هذا النمط 

الشي التالي الذي قد يلاحظه البرنامج هو ظهور OU في كلتا الكلمتين 

country  your

وفي حال كانت هذه الوثيقة اطول فان كتابة هذا النمط في القاموس سيوفر الكثير من المساحة حيث تعتبر OU تركيبا لغويا مالوفا في اللغة الانجليزية لكن طالما استمر برنامج ضغط الملفات في العمل على هذه الجملة فانه سيكشف بسعة

خياراً افضل ليكون مدخلا للقاموس لا تتكرر التركيبه اللغويه OU فقط وانما كامل الكليمتين country  your

وفي الواقع فهما تتكرران معا كعباره واحدة country your

وكذلك فان العبارة can do for

تتكرر تتبعها YOUR مرة و YOU مرة اخرى مشكلة بذلك نمطا متكررا هو CAN DO FOR YOU

مقدار التشذيب :

الى اي حد يمكن اعتبار هذا النظام جيدا ؟

تعتمد نسبة تقليل الملف على عدة عوامل منها نوع الملف وحجمة ومنهج الضغط  في معظم لغات العالم تظهر بعض الاحرف والكلمات معا في انماط معينة وتنضغط ملفات النصوص بشكل ممتاز بسبب هذه النسبة العاليه من التكرار , وتعتبر نسبة 50% او اكثر نموذجية بالنسبة للملفات النصية جيده الحجم وتحتوي معظم لغات البرمجة الكثير من التكرار لانها تستخدم مجموعة صغيره نسبيا من الاوامر التي غالبا ما تعمل معا بشكل انماط بالمقابل لا يمكن ضغط الملفات التي تحتوي الكثير من المعلومات الفريدة الغير متكرره مثل ملفات الجرافيك او MP3 باستخدام هذا النظام لانها لا تتكرر العديد من الانماط 

في حال احتوى الملف على العديد من الانماط المتكرره فان نسبة التخفيض تزداد طردا مع كبر حجمه يمكن رؤيه ذلك ينخفظ 

الخسارة وعدمها :

يطلق على هذا النوع من الضغط الذي يجري استعراضه هنا الضغط بدون خسارة وذلك لانه يسمح باعداة انشاء الملف الاصلي تماما كما كان , ان مبدا الضغط بدون خساره مبني على فكرة تقسيم الملف الى اجزاء اصغر بغرض نقلها او تخزينها ومن ثم اعادة تجميعها على الطرف الاخر مما يسمح باعادة استخدامها من جديد يعمل الضغط  بخسارة بطريقة مختلفة تماما تقوم هذه البرامج بحذف الاجزاء الغير ضروريه من المعلومات مما يجعل الملف اصغر 

يستخدم اسلوب الضغط هذا كثيرا للتقليل من حجم الصور BITMAP والتي تنحو لتكون ضخمة بعض الشيء ولمعرفة اليه حدوث ذلك لا بد من معرفة الكيفية التي يضغط بها الحاسب صورة ما لا يستطيع برنامج الضغط بدون خساره فعل الكثير مع هذا النوع من الملفات 

وبطريقة مبسطة يمكننا تلخيص ما سبق:

1
في الصورة المتواجدة لدينا بيانات قمنا بتمثيلها على النحو التالي من اعلى لاسفل 3 وحدات حمراء 2 خضراء و 1 زرقاء
بمجموع 6 وحدات .
إذا فإن البيانات المكررة المتواجدة في الشكل هي الوحدات باللون الاحمر والاخضر فقط لهذا إذا ماردنا إعادة ضغط هذه
البيانات وتمثيلها ستصبح البيانات على الشكل.
فكما لاحظت استطعنا ضغط 3 وحدات حمراء و 2 وحدات خضراء فيما الوحدة الزرقاء بقيت على حالتها الاصلية وإذا ما
اردنا ان نجمع عدد الوحدات سنجد نفس النتيجة 6 وحدات لكن تم تمثيلها بشكل مختلف ، لتكون بذلك هذه هي فكرة
Lossless
مثال عملي:
قم بإنشاء مجلد جديد ضع ملفا مثال حجمه حواي 4 ميغا وليكن ملف وورد او pdf او ملف فيديو….الخ
ثم قم بنسخ الملف ولصقه في نفس المكان عدة مرات بحيث ٌصبح لديك حوالي 22 نسخة منه
الان قم بضغط المجلد الحاوي على هذه الملفات باستخدام zip 7 او  WinRAR بشرط تطبيق خاصية الارشيف
الصلب create Solid archive و ستحصل على ملف بحجم اصغر من حجم ملف واحد!!!!!!!!!.
فلو مثال كان ملفك الاصلي 5 ميغا ونسخته 122 مرة فستحصل على 522 ميغا من الملفات لكن بعد ضغطها سيتحول
الملف الى 5 ميغا او اقل و الكلام صحيح في حال كانت الملفات متشابهة و ليست نفس النسخة ، فكلما زاد التشابه في
الملفات كلما صغر حجم الملف المضغوط.

 

مثال آخر :
لنفرض انك قمت بحفظ صفحات من موقع اجابات. و لنفرض انك قمت بحفظ 122 صفحة ثم قمت بضغطها فسٌكون حجم
الملف صغيرا جدا بسبب وجود الكثير من النصوص والملفات المشتركة في كل صفحة جرب و ستفهم 
ملخص الموضوع:
كلما زاد التشابه في الملفات كلما صغر حجم الملف الناتج و كلما زاد الاختلاف كلما زاد الحجم
للطريقة المعقدة
ويصعب على برامج الضغط غير المنقوص مثل WinRAR أن تضغط الملفات الصوتية والفيديو نظراً
لترتيب البيانات بداخل هذه الملفات، وكذلك لان الملف الناتج لن يكون حجمه أصغر بكثير من الحجم الاصلي، لذا نلجأ
لطرق أخرى لضغط الفيديو والصوتيات، مثل تحويل ملفات wav الصوت الخام إلى mp3 أو ملفات RealPlayer
الصوتية ذات الحجم الصغير، رغم أننا نفقد جزء كبير من جودة الصوت. ومثل استخدام صيغة MPEG بالنسبة للفيديو
لضغط الفيديو الخام .AVI

طريقة Loosy
. وهذا النوع
بالنسبة للضغط المنقوص، لا تحصل على نفس الملف بعد عملية الضغط، بل يكون أقل جودة ولكن أقل حجما ً
من الضغط هو المستخدم لضغط الصور والملفات الصوتية والفيديو.
على عكس الطرٌقة الاولى في إعادة تمثل البيانات فإن اسلوب loosy يقوم بحذف البيانات من الملف من اجل تقليل حجمه
وهذا بالفعل ما تلاحظه عندما تقوم بضغط صورة معينة ببعض البرامج حيث ان جودة الصورة تكون ضعيفة جدا وذلك
بحذف بعض البيانات المكملة كيف ؟
مثال لدينا الصورة اسفل كما ستلاحظ فإن جودة الصورة تتلاشى تدريجيا من اليسار الى اليمين وهذا راجع الى
استعمال اسلوب loosy الاخير الذي قام بحذف بعض الالوان ذات الدقة
العالية لتقليل حجمها وهذا ما يفسر تلاشي جودة الصورة في كل مرة يتم ضغط الملفات فيها .
غير ذلك نفس العملية غالبا ما تعتمد عليها بعض برامج الملفات الصوتية المضغوطة والتي تعمل على ضغط ملف صوتي 
من 1 ميغا الى 512 كيلوبايت عن طريق حذف بعض الموجات الصوتية الغير مسموعة بالنسبة للانسان
أي هناك بعض الاصوات الموجودة في مقطع الصوت او الفيديو لا يسمعها الانسان أي ان ترددها اقل من التردد الطبيعي 
للانسان ويقوم بتمييز هذه الاصوات برامج ضغط الملفات كذالك هناك اصوات تكون متداخلة ولكن عند الاستماع اليها هناك
اصوات تطغي على اصوات اخرى لذلك يقوم برنامج الضغط كذلك بحذفها لتقليل حجم الملف

فوائد برامج ضغط الملفات:
– ضغط الملفات لتصغير حجمها أو لارسالها دفعة واحدة دون الحاجة إلى إرسال كل ملف منفصل .
– إنشاء الملفات المضغوطة الذاتية الاستخراج .
– إصلاح الملفات المضغوطة التالفة .
– إمكانٌة فتح ملفات تصاوير أقراص الـ CD مثل ISO و BIN و CDI وNRG
– المحافظة على الملفات من الديدان .
بمعنى…
هناك فرق بين الفيروسات (Viruses) والديدان (Worms) فالاثنان عبارة عن برنامجين كأي برنامج على جهاز
الكمبيوتر والفرق وهو أن الاولى حين تصيب ملفات جهاز كمبيوتر بطريقة اعتيادية فهي تقوم بتنفيذ المطلوب منها أثناء
البرمجة وفقط سواء كانت برمجت على مسح محتويات بارتيشن معين أو عمل فورمات له أو للهارديسك كله أو ….
إلخ ، أما الاخرى فإضافة إلى ما تفعله الاولى فتكمن خطورتها في إمكانيتها في الانتشار على الهارديسك أو أي جهاز
آخر متصل بالكمبيوتر مثل الفلاش أو الفلوبي ديسك أو جهاز آخر متصل عبر شبكة محلية أو …….الخ )باستثناء
الاسطوانات( وهى تفعل ذلك بدون الحاجة إلى تشغيل الملف المصاب بها .. ولهذا فهي أخطر أنواع الفيروسات ضررا
بملفات المستخدم ..ولعل أغلب أنواع الديدان بمجرد انتقالها إلى أي هارديسك فإنها تنتشر في كافة مجلداتهوفي

أقسامه و تصيب أكثر أنواع الملفات شيوعا exe والذى يمثل غالبا سورسات البرامج (Program sources) ً
وهنا فينصح بضغط أي ملفات هامة لها هذا النوع من الملفات للحفاظ عليها من الفيروسات والديدان حيث يصعب إن لم
يستحيل اختراق الفيروس لها وهى مضغوطة.

نسب الضغط بالنسبة للبرامج الارشيفية التي تستخدم الضغط غير المنقوص مثل winrar :

بالنسبة لملفات النصية (txt) ، تتراوح نسبة الضغط بين 72% إلى 89% لدى معظم البرامج.
بالنسبة للبرامج(exe) ، تتراوح نسبة الضغط بين 45% إلى 75% حسب البرنامج المستخدم.
بالنسبة لملفات مكتبة الربط الديناميكية (dll) ، النسبة بين 35% إلى 65.%
بالنسبة للصور غير المضغوطة (bmp) ، النسبة 65% إلى 95.%
، النسبة تكون صغيرة جدا  بالنسبة لبعض البرامج. بالنسبة للصور المضغوطة (jpg) من  2% إلى 22%
بالنسبة لملفات وورد(doc) ، النسبة 75% إلى 95.%
ملفات قابلة للضغظ بشكل كبير عن غيرها مثل-:

. كافة انواع الملفات المكتبية OFFICE FILES مثل ملفات WORD و EXCEL و ….. POWERPOINT … الخ

. انواع الصور مثل PSD امتداد برنامج الفوتوشوب او BMP وهذا هو اكثر الانواع ضغطا فقد يتم ضغط صورة حجمها 2 ميجا مثلا الى 50 كيلو بايت في حين يقل ضغط صورة بامتداد JPG او  JPEG او PNG او … الخ 

وهذا لان هذه الانواع اصلا مضغوطه وتعتمد تقنيتها على امكانية عرضها بجودة عاليه مع حالة الضغط 

. ملفات الخطوط FONTS كذلك تضغط بنسبة كبيرة 

. ملفات صفحات الانترنت مثل HTML او MHT

By admin

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *