إكتشف أقوى أداة لتحويل الكلام إلى كتابة بالذكاء الإصطناعي

- May 12, 2023

Whisper هو نظام مفتوح المصدرتابع لشركة Openai خاص بالتعرف التلقائي على الكلام (ASR) أو ما يعرف بالتفريغ الصوتي و هي عملية تحويل الكلام أو الملفات الصوتية إلى كتابة .

يعتمد البرنامج على 680.000 ساعة من البيانات متعددة اللغات ومتعددة المهام والتي يتم الإشراف عليها و جمعها من الويب , وهذا ما يؤدي إلى تحسين متانة اللهجات والقدرة على تجاوز ضوضاء الخلفية للملف الصوتي و القدرة على التعامل مع اللغة التقنية. علاوة على ذلك ، فإنه يتيح العمل بلغات متعددة ، و يوفر أيضا خاصية الترجمة من تلك اللغات إلى الإنجليزية.

يمكن إستخدام نظام Whisper على الحاسوب مباشرة , لكن يمكن أن يكون إستخدامه ثقيلا بسبب إعتماده على الجرافيك كارد . لهذا سنشرح طريقة رائعة لإستخدامه بأفضل و أسرع طريقة دون تحميله على الحاسوب .

1 - تسجيل الدخول إلى حساب جوجل Google .

2 - إفتح صفحة Google drive . رابط الصفحة

3 - أنقر على زر New

4 - أنقر على خيار More ثم Connect more apps .

5 - أكتب كلمة Colaboratory في خانة البحث .

5 - تثبيت Colaboratory :

6 - تثبيت Whisper: من أجل تثبيت البرنامج نفتح أولا colaboratory بالنقر على زر New ثم More ثم Google colaboratory .

أكتب أو ألصق الكود الخاص بتثبيت Whisper إضافة إلى ffmpeg و هي مكتبة معالجة الملفات الصوتية

أنقر على زر تنفيذ الكود لتبدأ عملية التثبيت و انتظر حتى تنتهي العملية .

الكود

!pip install git+https://github.com/openai/whisper.git

!sudo apt update && sudo apt install ffmpeg

7 - كيفية إستخدام Whisper : من أجل إستخدام البرنامج سنبع هذه الخطوات المهمة

ضبط الإعدادات :

أنقر على خانة Runtime ثم أنقر على خيار Change runtime type

في النافذة التي ستظهر قوم بإختيار خاصية GPU ثم أنقر على زر الحفظ

تحميل الملف الصوتي على البرنامج :

أنقر على أيقونة الملفات التي تظهر في الجهة اليسرى و ذلك لكي تظهر نافذة الملفات ثم يجب تحميل الملف الصوتي المراد تحويله إلى نص وهناك طريقتين لفعل ذلك.

1 - الطريقة الأولى : إسحب الملف الصوتي مباشرة إلى نافذة الملفات .

2 - الطريقة الثانية : قوم بوضع مؤشر الفأرة داخل حيز نافذة الملفات و تنقر على الزر الأيمن للفأرة لكي تظهر قائمة الإختيارات ثم أنقر على خانة upload لتحميل الملف الصوتي .

طريقة التحويل :

بعد تحميل الملف الصوتي تأتي مرحلة تحويله إلى نص مكتوب و ذلك بتنفيذ بعض الأوامر و هي أكواد صغيرة خاصة بتشغيل البرنامج .

من أجل عدم إطالة الشرح سنستخدم فقط الأوامرأو الأكواد الأساسية لتنفيذ العملية ثم نشرح دور كل واحد منها و كيفية التعديل عليها للحصول على نتيجة أفضل بكثير .

تنفيذ العملية :

في خانة تنفيذ الأوامر نكتب و نشغل هذه الأوامر التالية :

!whisper "audio file name" --model medium

علامة تعجب متبوعة بكلمة whisper ثم نترك فراغ متبوع بإسم الملف الصوتي محصور بين شرطتين عموديتين ثم نترك فراغ متبوع بشرطتين أفقيتين متبوعة بكلمة model ثم فراغ متبوع بكلمة medium

مثال :

!whisper "Lune1.mp3" --model medium

النتيجة : بعد تنفيذ عملية التحويل نحصل على عدة ملفات بعدة صيغ :

ملفات : json , vtt , tsv , txt , srt

ملاحظة مهمة

ملفات srt و vtt هي ملفات subtitle يمكن دمجها مع الفيديو تستخدم لعرض الكلام أو الترجمة في الفيديو .

ملف txt هو ملف نص مكتوب بشكل عادي بدون تقسيم حسب فواصل زمنية .

كيفية تنزيل الملفات : ضع المؤشر على الملف الذي تريد تحميله ستظهر 3 نقاط في الجانب الأيمن أنقر عليها لتظهر قائمة صغيرة فيها بعض الخيارات أنقر على خيار التحميل .

بحث هذه المدونة الإلكترونية

Noojoomweb | نجوم الويب

إكتشف أقوى أداة لتحويل الكلام إلى كتابة بالذكاء الإصطناعي

2 - إفتح صفحة Google drive . رابط الصفحة

Comments

Post a Comment

Popular posts from this blog

أفضل موقع خرافي لتشكيل النصوص العربية

clipchamp أفضل برنامج تحويل الكتابة إلى الصوت