
قالت شركة OpenAI إنه خلال الأسبوعين المقبلين، سيتم طرح الإصدار الجديد من برنامج الدردشة ChatGPT Plus الذي يستطيع التعامل مع الأوامر الصوتية
أصدرت شركة “أوبن آيه أي OpenAI”، وهي شركة ناشئة في مجال الذكاء الاصطناعي في سان فرانسيسكو، نسخة جديدة من روبوت الدردشة الآلي الشهير الخاص بها يوم الاثنين 25 سبتمبر والذي يمكنه التفاعل مع الأشخاص باستخدام الكلمات المنطوقة.
كما هو الحال مع المساعد الصوتي “اليكسا” من أمازون، و “سيري” من أبل، والمساعدين الرقميين الآخرين، يمكن للمستخدمين التحدث إلى “شات جي بي تي” وسوف يرد عليك.
ولأول مرة، يستطيع “شات جي بي تي” أيضًا الرد على الصور. يمكن للأشخاص، على سبيل المثال، تحميل صورة لأرفف ثلاجتهم، ويمكن لروبوت الدردشة أن يقدم لهم قائمة بالأطباق التي يمكنهم طهيها باستخدام المكونات الموجودة في الثلاجة.
قال بيتر دينج، نائب رئيس منتجات المستهلكين والمؤسسات في شركة “أوبن آيه أي”: “إننا نتطلع إلى جعل شات جي بي تي أسهل في الاستخدام – وأكثر فائدة”.
قامت “أوبن آيه أي” بتسريع إصدار أدوات الذكاء الاصطناعي الخاصة بها في الأسابيع الأخيرة.
وفي هذا الشهر، كشفت النقاب عن نسخة من مولد الصور باستخدام الذكاء الاصطناعي DALL-E الخاص بها وأدمجت الأداة في شات جي بي تي.

صورتم إنشاؤها باستخدام الذكاء الاصطناعي باستخدام برنامج DALL-E 3 من شركة أوبن آيه أي
اجتذب شات جي بي تي مئات الملايين من المستخدمين بعد طرحه في نوفمبر الماضي، وسرعان ما أطلقت العديد من الشركات الأخرى خدمات مماثلة.
مع الإصدار الجديد من الروبوت، تتخطى “أوبن آيه أي” روبوتات الدردشة المنافسة مثل “بارد Bard من جوجل، بينما تتنافس أيضًا مع التقنيات القديمة مثل أليكسا من أمازون و سيري من أبل.
لقد وفرت أليكسا و سيري منذ فترة طويلة طرقًا للتفاعل مع الهواتف الذكية وأجهزة الكمبيوتر المحمولة والأجهزة الأخرى من خلال الكلمات المنطوقة.
لكن روبوتات الدردشة مثل شات جي بي تي وجوجل بارد تتمتع بمهارات لغوية أكثر قوة، كما أنها قادرة على كتابة رسائل البريد الإلكتروني والشعر والمقالات البحثية على الفور، كما أنها تناقش أي موضوع يطرح في طريقها تقريبًا.
لقد جمعت “أوبن آيه أي” بشكل أساسي بين طريقتي الاتصال سواء عن طريق الكلمات المكتوبة أو المنطوقة.
ترى الشركة أن التحدث هو وسيلة أكثر طبيعية للتفاعل مع برنامج الدردشة الآلي الخاص بها.
وتفخر الشركة بأن الأصوات الاصطناعية في شات جي بي تي طبيعية أكثر، ويمكن للأشخاص الاختيار من بين 5 أصوات مختلفة، بما في ذلك أصوات الذكور والإناث، وهي أكثر إقناعا من الأصوات الأخرى المستخدمة مع المساعدين الرقميين المشهورين.
وقالت الشركة إنه خلال الأسبوعين المقبلين، سيبدأ الإصدار الجديد من برنامج الدردشة الآلي في طرحه لكل من يشترك في خدمة “شات جي بي تي بلس ChatGPT Plus”، وهي خدمة تكلف 20 دولارًا شهريًا. لكن الروبوت يمكنه الاستجابة بالصوت فقط عند استخدامه على الأجهزة المحمولة أيفون و أيباد و أندرويد.
ما هو الفارق بين المساعد الصوتي الحالي و روبوت الدردشة الصوتي
تعد الأصوات الاصطناعية للروبوت أكثر طبيعية من العديد من الأصوات الأخرى الموجودة في السوق، على الرغم من أنها لا تزال قادرة على إصدار صوت آلي.

تحرص شركة أمازون على دمج مساعدها الرقمي “أليكسا” في كثير من الأجهزة الذكية
مثل المساعدين الرقميين الآخرين، يمكن أن يواجه صعوبة في استخدام المرادفات. عندما سألت صحيفة نيويورك تايمز برنامج شات جي بي تي بلس الجديد عن كيفية تهجئة كلمة “gym”، أجابت: “J-I-M”.
لكن إحدى مزايا برنامج الدردشة الآلي مثل شات جي بي تي بلس هو أنه يمكنه تصحيح نفسه. وعندما قيل له “لا، أقصد النوع الآخر من الجيم”، أجاب الروبوت: “آه، أفهم ما تشير إليه الآن. المكان الذي يمارس فيه الأشخاص التمارين ويمارسون الرياضة يُكتب عليه G-Y-M.”
على الرغم من أن الواجهة الصوتية لـ شات جي بي تي تذكرنا بالمساعدين السابقين، إلا أن التكنولوجيا الأساسية مختلفة تمامًا. يتم تشغيل شات جي بي تي بشكل أساسي بواسطة نموذج لغة كبير يطلق عليه L. L. M.، والذي تعلم كيفية إنشاء نصوص لغوية بسرعة من خلال تحليل كميات هائلة من النصوص المنتقاة عبر الإنترنت.
المساعدون الرقميون الأقدم، مثل أليكسا و سيري، يعملون مثل مراكز القيادة والتحكم التي يمكنها أداء عدد محدد من المهام أو تقديم إجابات لقائمة محدودة من الأسئلة المبرمجة في قواعد بياناتهم، مثل “أليكسا، قم بتشغيل الأضواء” أو “ما هو الطقس في كوبرتينو؟” قد تستغرق إضافة أوامر جديدة إلى المساعدين الأقدم أسابيع. يمكن لـ “شات جي بي تي” الرد بشكل موثوق على أي سؤال يتم طرحه عليه في ثوانٍ – على الرغم من أن الإجابة يمكن أن لا تكون صحيحة دائمًا.
معايير السلامة في شات جي بي تي بلس
وقالت ساندهيني أاجروال، الباحثة في “أوبن آيه أي” والتي تركز على السلامة والسياسة، إن النسخة الجديدة من الروبوت سترفض الآن الجهود المبذولة للتعرف على الوجوه. ولكنه مصمم لتقديم أوصاف مفصلة للغاية للصور الأخرى.
بالنظر إلى صورة من تلسكوب هابل الفضائي، على سبيل المثال، يمكنه الاستجابة بفقرات توضح بالتفصيل محتويات الصورة.
يمكن أن يكون الروبوت أيضًا أداة للطلاب. بالنظر إلى صورة لمسألة رياضية في المدرسة الثانوية تتضمن كلمات وأرقام ورسوم بيانية، يمكن للروبوت قراءة المشكلة وحلها على الفور. يمكن أن تكون طريقة فعالة للتعلم أو الغش.
خاص: إيجيبت14
المصدر: نيويورك تايمز

