38.2 C
Riyadh
الثلاثاء, مايو 13, 2025

الكاتب

فهد تركي
فهد تركي
كاتب يعمل بالذكاء الاصطناعي

إقرأ أيضا

حكومة دبي لقبول Crypto من خلال شراكة Crypto.com

حكومة دبي لقبول Crypto من خلال شراكة Crypto.com logo...

قادم Vivo V50 Elite Edition ، وإليك تاريخ الإطلاق الرسمي

قادم Vivo V50 Elite Edition ، وإليك تاريخ...

يقوم Openai بتشغيل GPT-4O صور الصور مع تحسن النصوص والتعليمات التالية

يقوم Openai بتشغيل GPT-4O صور الصور مع تحسن النصوص والتعليمات التالية

صدر منذ حوالي عام ، Openai's GPT-4O تم تحسينه وتحسينه بميزات جديدة. آخرها هو توليد الصور-يمكن أن يولد نموذج الذكاء الاصطناعى صورًا عالية الجودة ومفصلة ويمكنه اتباع تعليمات اللغة الطبيعية لتعديلها حتى تحصل على الصورة التي تصورها في رأسك فقط. أنت تعرف كيف تكافح نماذج الذكاء الاصطناعى الأكبر سناً من النص – إذا طلبت منهم إنشاء علامة ، في أحسن الأحوال ، ستحصل على علامة مع كلمات رطبة ، في أسوأ الأحوال ، ستحصل على صراخ ليست حتى رسائل. لكن تحقق من ذلك:





يمكن لـ GPT-4O إنشاء صور ذات صورة نصية مقروءة تمامًا ، يبدأ عادةً بإدخال موجه نص ، ثم تقوم بتحسين الصورة عن طريق تحسين المطالبة الأصلية. يعمل GPT-4O بشكل مختلف-تسألها عن صورة ، ثم أخبرها بما يجب تغييره ، ثم اطلب منها تغيير المزيد من الأشياء وما إلى ذلك حتى تحصل على النتيجة. فيما يلي بعض الأمثلة:






إنشاء صورة وتعديلها من خلال اللغة الإنجليزية العادية ، يمكنك متابعة رابط المصدر أدناه لفحص المطالبات التي أنشأت هذه الصور. لاحظ أن Openai قام باختيار الكرز – الكثير من الصور هي “أفضل من 2” أو حتى “أفضل 8” ، وبالتالي فإن النموذج يحتاج إلى محاولات قليلة للحصول عليها بشكل صحيح. ومع ذلك ، فإن النتائج تبدو مثيرة للإعجاب وواجهة المستخدم بسيطة كما تحصل. هنا مثال آخر. يمكن أن تبدأ GPT-4O من نقطة الصفر أو يمكنها تعديل صورة تقدمها. هنا ، يعطيها المستخدم صورة للقط ويطلب من الذكاء الاصطناعى إعطائها قبعة المباحث و monocle. ثم يتابع المستخدم تحسين الصورة ، وتحويلها إلى شيء يمكن أن يكون لقطة شاشة من آر بي جي.







النماذج الأولية لـ Cat Detective RPG يمكنك البدء مع صور متعددة أيضًا ودمج العناصر من كل صورة في النتيجة النهائية. يقول Openai أن GPT-4O رائع في الإرشادات التفصيلية التالية-يمكنه معالجة 10-20 كائنات مختلفة في مشهد دون التعثر (يمكن للموديلات الأخرى فقط التعامل مع 5-8 كائنات ، كما تقول الشركة). GPT-4O ليس مثاليًا و Openai هو أول من يعترف بذلك. في بعض الأحيان ، يتم إيقاف تشغيل الصور في الأسفل ، ولا تزال الهلوسة مشكلة ، حيث يمكن أن تكون العمل مع أكثر من 10 إلى 20 كائنات صعبة ، ويحتاج نص مع الأحرف غير اللاتين إلى العمل أيضًا.






أمثلة على GPT-4O تخطئها أخيرًا ، إليك بعض مظاهرات الفيديو التي تعرض مهارات توليد الصور الجديدة لـ GPT-4O:

مصدر

المصدر

ترك الرد

من فضلك ادخل تعليقك
من فضلك ادخل اسمك هنا

CAPTCHA


إقرأ أيضاً

حكومة دبي لقبول Crypto من خلال شراكة Crypto.com

حكومة دبي لقبول Crypto من خلال شراكة Crypto.com logo Crypto.com معروضة على شاشة هاتف مع تمثيل Cryptocurrencies.Nurphoto | نورفوتو | قسم المالية في Getty...

SoftBank Vision Fund يتأرجح إلى الخسارة السنوية مع بطيئة مكاسب الاستثمار

SoftBank Vision Fund يتأرجح إلى الخسارة السنوية مع بطيئة مكاسب الاستثمار يقدم SoftBank الرئيس التنفيذي لشركة Masayoshi Son ملاحظات بجوار الرئيس الأمريكي دونالد ترامب...

قادم Vivo V50 Elite Edition ، وإليك تاريخ الإطلاق الرسمي

قادم Vivo V50 Elite Edition ، وإليك تاريخ الإطلاق الرسمي تستعد الجسم الحي للكشف عن عضو ثالث من عائلة V50 في الهند ، والتي...