نموذج LTX-Video, اول نموذج مفتوح المصدر للفيديوهات!

مراجعة أداة LTX-Video: أداة ذكاء اصطناعي مبتكرة لتوليد الفيديوهات

نظرة عامة

أشارككم اليوم تجربتي مع LTX-Video، وهي أداة ذكاء اصطناعي مفتوحة المصدر من Lightricks لتوليد فيديوهات عالية الجودة بسرعة فائقة. بناءً على تقنية Diffusion Transformer (DiT)، تُعد هذه الأداة خيارًا رائعًا للمطورين ومنشئي المحتوى الذين يبحثون عن إنشاء فيديوهات واقعية بسهولة وكفاءة. في هذا المنشور، سأستعرض مميزات الأداة، طرق استخدامها، وانطباعي عنها، مع روابط للمصادر لتعم الفائدة! :rocket:


ما هي LTX-Video؟

LTX-Video هي أداة ذكاء اصطناعي صُممت لتوليد فيديوهات بدقة تصل إلى 1216×704 بمعدل 30 إطارًا في الثانية، وهي أسرع من وقت مشاهدة الفيديو نفسه! تُعد الأداة الأولى من نوعها التي تستخدم تقنية DiT، وتم تدريبها على مجموعة بيانات فيديو ضخمة، مما يجعل المخرجات واقعية ومتنوعة. انطلقت في حوالي مايو 2025، وتتوفر عبر الإنترنت أو محليًا عبر مستودع GitHub.

المميزات

تتميز LTX-Video بمجموعة من الخصائص التي تجعلها أداة قوية:

  • دعم دقة وإطارات مرنة: تدعم دقة قابلة للقسمة على 32 وعدد إطارات متعدد 8+1 (مثل 257)، مع أداء مثالي تحت 720×1280.
  • نماذج متقدمة:
    • 13B v0.9.7: توليد فيديوهات HD في 10 ثوانٍ (معاينة منخفضة الدقة في 3 ثوانٍ على H100)، بدون إرشاد مكاني-زمني أو خالٍ من المصنف.
    • 2B v0.9.6: استدلال أسرع 15 مرة، يعمل في الوقت الفعلي على H100.
  • تحسين النصوص تلقائيًا: تعزز النصوص القصيرة تلقائيًا لتحسين جودة الفيديو.
  • دعم المجتمع: تحسينات مثل LTX-VideoQ8 (تسريع 3 أضعاف على RTX 4060 بـ 8GB VRAM) وTeaCache (تسريع الاستدلال حتى مرتين).
  • تعدد الاستخدامات: تدعم تحويل النص إلى فيديو، الصورة إلى فيديو، تمديد الفيديو، والتحويل من فيديو إلى فيديو.

طريقة الاستخدام

يمكن استخدام LTX-Video بطريقتين:

  1. عبر الإنترنت: من خلال واجهات مثل:
  2. محليًا:
    • استنسخ المستودع: git clone https://github.com/Lightricks/LTX-Video
    • قم بإعداد بيئة Python 3.10.5 مع PyTorch >=2.1.2 وCUDA 12.2.
    • ثبّت الاعتماديات: python -m pip install -e .[inference-script]
    • استخدم أوامر مثل:
      • نص إلى فيديو: python inference.py --prompt "وصف الفيديو" --height 720 --width 1280 --num_frames 257 --seed 42 --pipeline_config configs/ltxv-13b-0.9.7-distilled.yaml
      • صورة إلى فيديو: أضف --conditioning_media_paths مسار_الصورة.
      • تمديد فيديو: استخدم فيديو إدخال بإطارات متعددة 8+1.

تدعم الأداة أيضًا ComfyUI عبر دليل ComfyUI-LTXVideo وDiffusers عبر وثائق Diffusers.

الاستخدامات العملية

  • إنشاء محتوى إبداعي: مثالي لإنتاج فيديوهات ترويجية أو تعليمية.
  • توفير الوقت: تسرع عملية إنشاء الفيديوهات مقارنة بالطرق التقليدية.
  • تطبيقات تقنية: مفيدة للمطورين في بناء تطبيقات تعتمد على الفيديو.
  • تحسينات مجتمعية: مشاريع مثل LTX-VideoQ8 تجعلها متاحة لأجهزة بمواصفات متوسطة.

انطباعي عن الأداة

بعد تجربتي لـ LTX-Video، أرى أنها أداة ثورية لتوليد الفيديوهات بسرعة وجودة عالية. واجهتها سهلة الاستخدام عبر الإنترنت، بينما تمنح الاستضافة المحلية مرونة كبيرة للمطورين. تحسينات المجتمع مثل LTX-VideoQ8 جعلتها أكثر سهولة على أجهزة محدودة الموارد. ومع ذلك، قد تحتاج إعداد البيئة المحلية إلى خبرة تقنية، خاصة للمبتدئين. بشكل عام، إنها أداة تستحق التجربة لأي شخص يعمل في مجال المحتوى أو التطوير! :glowing_star:

نصائح للاستخدام

  • استخدم مقياس إرشاد 3-3.5 و20-40 خطوة استدلال لتحقيق توازن بين السرعة والجودة.
  • اكتب نصوصًا وصفية (أقل من 200 كلمة) تشمل تفاصيل الحركة، الإضاءة، وزوايا الكاميرا.
  • جرب تحسينات المجتمع مثل LTX-VideoQ8 لأداء أسرع على أجهزة متوسطة.

المصادر


التاريخ: 25 يونيو 2025
تم التحرير من طرف Grok مع تدقيق من طرفي

3 إعجابات

أخي رجائا استخدم مصطلحات ادق
الخبر كبير فعلا, ووصفة كاداة وعدم ذكر انه يعتبر من اقوى نماذج تصدير الفيديو في العنوان والمقال غريب.

3 إعجابات