إكتشف أقوى أداة لتحويل الكلام إلى كتابة بالذكاء الإصطناعي

 


Whisper هو نظام مفتوح المصدرتابع لشركة Openai خاص بالتعرف التلقائي على الكلام (ASR) أو ما يعرف بالتفريغ الصوتي و هي عملية تحويل الكلام أو الملفات الصوتية إلى كتابة .

 يعتمد البرنامج على 680.000 ساعة من البيانات متعددة اللغات ومتعددة المهام  والتي يتم الإشراف عليها  و جمعها من الويب , وهذا ما يؤدي إلى تحسين متانة اللهجات والقدرة على تجاوز ضوضاء الخلفية للملف الصوتي و القدرة على التعامل مع اللغة التقنية. علاوة على ذلك ، فإنه يتيح العمل بلغات متعددة ، و يوفر أيضا خاصية  الترجمة من تلك اللغات إلى الإنجليزية.

يمكن إستخدام نظام  Whisper على الحاسوب مباشرة  , لكن يمكن أن يكون إستخدامه ثقيلا  بسبب إعتماده على الجرافيك كارد . لهذا سنشرح طريقة رائعة لإستخدامه بأفضل و أسرع طريقة دون تحميله على الحاسوب .


1 - تسجيل الدخول إلى حساب جوجل Google .

2 - إفتح صفحة Google drive . رابط الصفحة

3 - أنقر على زر New



4 - أنقر على  خيار More  ثم Connect more apps .



5 - أكتب كلمة Colaboratory في خانة البحث .




 5 - تثبيت  Colaboratory :



6 - تثبيت Whisper: من أجل تثبيت البرنامج نفتح  أولا colaboratory  بالنقر على زر New  ثم More ثم Google colaboratory
أكتب أو ألصق الكود الخاص بتثبيت Whisper  إضافة إلى ffmpeg و هي مكتبة معالجة الملفات الصوتية
أنقر على زر تنفيذ الكود لتبدأ عملية التثبيت و انتظر حتى  تنتهي العملية .

الكود

!pip install git+https://github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmpeg



7 - كيفية إستخدام Whisper : من أجل إستخدام البرنامج سنبع هذه الخطوات المهمة

ضبط الإعدادات :
 أنقر على خانة Runtime ثم أنقر على خيار Change runtime type
في النافذة التي ستظهر قوم بإختيار خاصية GPU ثم أنقر على زر الحفظ 




تحميل الملف الصوتي على البرنامج :
 أنقر على أيقونة الملفات التي تظهر في الجهة اليسرى و ذلك  لكي تظهر نافذة الملفات ثم يجب تحميل  الملف الصوتي 
المراد تحويله إلى نص وهناك طريقتين لفعل ذلك.
1 - الطريقة الأولى : إسحب الملف الصوتي مباشرة إلى نافذة الملفات .
2 - الطريقة الثانية : قوم بوضع مؤشر الفأرة داخل حيز نافذة الملفات و تنقر على الزر الأيمن للفأرة لكي تظهر قائمة الإختيارات ثم أنقر على خانة upload لتحميل الملف الصوتي  .



طريقة التحويل :
بعد تحميل الملف الصوتي  تأتي مرحلة تحويله إلى نص مكتوب و ذلك بتنفيذ بعض الأوامر و هي أكواد صغيرة خاصة بتشغيل البرنامج .
 من أجل عدم إطالة الشرح سنستخدم فقط الأوامرأو الأكواد  الأساسية لتنفيذ العملية ثم  نشرح دور كل واحد منها و كيفية التعديل عليها للحصول على نتيجة أفضل بكثير . 

تنفيذ العملية :
في خانة تنفيذ الأوامر نكتب  و نشغل هذه الأوامر التالية : 
!whisper "audio file name" --model medium


علامة تعجب متبوعة بكلمة whisper ثم نترك فراغ متبوع بإسم الملف الصوتي  محصور بين شرطتين عموديتين ثم نترك فراغ متبوع بشرطتين أفقيتين متبوعة  بكلمة model ثم فراغ متبوع بكلمة medium 

مثال :
!whisper "Lune1.mp3" --model medium



النتيجة : بعد تنفيذ عملية التحويل نحصل على عدة ملفات بعدة صيغ :
ملفات : json , vtt , tsv , txtsrt

 ملاحظة مهمة 

 ملفات  srt   و  vtt  هي ملفات  subtitle  يمكن دمجها مع الفيديو  تستخدم لعرض  الكلام أو الترجمة في الفيديو . 

 ملف   tx هو ملف نص مكتوب بشكل عادي بدون تقسيم حسب فواصل زمنية .




كيفية تنزيل الملفات : ضع المؤشر على الملف الذي تريد تحميله ستظهر 3 نقاط في الجانب الأيمن أنقر عليها لتظهر قائمة صغيرة فيها بعض الخيارات أنقر على خيار التحميل .



Comments

Popular posts from this blog

أفضل موقع خرافي لتشكيل النصوص العربية

clipchamp أفضل برنامج تحويل الكتابة إلى الصوت