استفاده از هوش مصنوعی برای تولید متن Alt
ﺯﻣﺎﻥ ﻣﻄﺎﻟﻌﻪ: 4 دقیقه

استفاده از هوش مصنوعی برای تولید متن Alt

نوشتن متن برای جایگزینی تصاویر یا همان Alternative Image Text کار حوصله سر بری‌ست. البته شاید برای چند تصویر کلی کار چندان چالش برانگیزی نباشد اما زمانی که کار به صدها و یا هزاران تصویر می‌رسد واقعا سخت و فراموش کردنی است. اما خب شاید بپرسید چرا به چنین متنی نیاز داریم. خب اگر کمی حرفه‌ای‌تر به این موضوع فکر کنیم متوجه خواهیم شد که ایجاد متن جایگزین می‌تواند به دسترسی‌پذیری یا همان Accessibility وبسایت‌مان کمک بسیار زیادی بکند. از طرفی دیگر برای کسانی که موضوع سئو یا بهینه‌سازی موتورهای جستجوگر مهم است، متن Alt از اهمیت بالایی برخوردار است.

حال چاره کار چیست؟

چند روز پیش تصویری را در اینستاگرام منتشر کردم و زمانی که خواستم آن را با لپ‌تاپ مشاهده کنم اینترنت قطع شد و بجای تصویر یک سری متن در رابطه با تصویری که منتشر کردم نمایش داده شد. متنی که من آن‌ها را ننوشته‌ بودم. به همین خاطر چند تا سرچ ساده انجام دادم و متوجه شدم که این متن‌ها را اینستاگرام بصورت خودکار و با کمک گرفتن از هوش مصنوعی تولید می‌کند. برای‌م جذاب بود و به همین دلیل پیگیر شدم که ببینم چگونه می‌توانم خودم این متن را بصورت خودکار تولید کردم و در حین چرخ‌زنی در گوگل با این قطعه کد از آقای Harish Cloudinary مواجه شدم.

برای درک اینکه این قطعه کد به چه صورتی کار می‌کند ابتدای کار بگذارید بصورت بسیار ساده با موضوع Computer Vision آشنا کنم.

بینایی کامپیوتری یا Computer Vision

یک مثال ساده از بینایی کامپیوتر

بینایی کامپیوتری یکی از زیرشاخه‌های علم هوش مصنوعی‌ست که به شما کمک می‌کند تا بتوانید با استفاده از المان‌های بصری مانند تصاویر و ویدیوها، محتوایی را شناسایی کنید. برای مثال اگر با برنامه‌های تشخیص چهره کار کرده باشید دقیقا از سیستم بینایی کامپیوتر استفاده کرده‌اید.

حالا سوالی که پیش می‌آید این است که چگونه چنین سیستمی را در پروژه خودمان پیاده‌سازی بکنیم. این سوال سختی‌ست چرا که بنده نیز در زمینه تخصصی هوش مصنوعی فعالیت مستقیم ندارم و در نتیجه نمی‌توانم از ابتدای کار یک سیستم تشخیص چهره مستقل ایجاد کنم. به همین دلیل است که باید از APIهایی که شرکت‌هایی چون مایکروسافت، آمازون و گوگل در اختیارمان قرار داده استفاده کنید. در قطعه کد بالا از سرویس بینایی بصری آمازون استفاده شده است.

خب بیایید فرایند پیاده‌سازی این سرویس با استفاده از API مایکروسافت را یاد بگیریم:

  1. ابتدای کار نیاز است که به صفحه Microsoft Azure Computer Vision مراجعه کرده و ثبت نام کنید. کاملا رایگان خواهد بود.
  2. بعد از آن وارد قسمت داشبورد یا پیشخوان شده و از قسمت جستجو عبارت Computer Vision را جستجو کنید.

بعد از انتخاب گزینه موجود در تصویر بالا کمی صبر کنید بعد از آن متوجه خواهید شد یک API برای شما تولید شده است.

حال شما باید با استفاده از یک زبان برنامه‌نویسی از این API به روش معقول استفاده کنید. در مثال زیر می‌توانید استفاده از این API را در جاوااسکریپت مشاهده کنید:

var request = new XMLHttpRequest();
request.open('POST', 'https://[LOCATION]/vision/v1.0/describe?maxCandidates=1&language=en', true);
request.setRequestHeader('Content-Type', 'application/json');
request.setRequestHeader('Ocp-Apim-Subscription-Key', '[SUBSCRIPTION_KEY]');
request.send(JSON.stringify({ "url": "[IMAGE_URL]" }));
request. = function () {
    var resp = request.responseText;
    if (request.status >= 200 && request.status < 400) {
        // Success!
        console.log('Success!');
    } else {
        // We reached our target server, but it returned an error
        console.error('Error!');
    }

    console.log(JSON.parse(resp));
};

request. = function (e) {
    console.log(e);
};
  1. این قطعه کد از وبسایت css-tricks.com گرفته شده ولی برای درک بهتر این قطعه کد می‌توانید به مستندات موجود در وبسایت خود مایکروسافت مراجعه کنید.
  2. در قطعه کد بالا چند قسمت وجود دارد که به صورت واضح نوشته نشده. برای مثال در خط دوم عبارت LOCATION آمده که این مقدار براساس حساب‌های کاربری متفاوت است. برای مشاهده مورد خودتان وارد قسمت Overview شده و در قطعه کد بالا آن مقدار را جایگذاری کنید. Subscription Key در خط چهارم کلید اشتراک شما‌ست که در وبسایت با نام Key1 و Key2 قرار دارد. Image URL نیز آدرس تصویری است که قصد دارید به بینایی بصری ارسال کنید.

به همین سادگی شما می‌توانید یک سرویس بینایی بصری برای تولید متون Alt را در وبسایت‌تان ایجاد کنید.

پرامپت نوشتن Alt برای تصاویر از ChatGPT

شما با استفاده از چت‌جی‌پی‌تی نیز امکان ایجاد متن جایگزین یا Alt را برای تصاویر دارید. برای اینکار کافی‌ست وارد حساب کاربری خود در openai شده و تصویر مورد نظر را آپلود کنید:

بعد از انجام چنین کاری حال می‌توانید پرامپت مورد نظر را وارد کنید. یک مثال از این پرامپت در زیر آورده شده است:

Describe what you can see in the image, and generate the description so it is suitable to be used for alt-text

البته به فارسی نیز می‌توانید بنویسید چرا که نسخه ۴ چت‌جی‌پی‌تی به خوبی با زبان‌های مختلف تعامل برقرار می‌کند. 

 

چه امتیازی برای این مقاله میدهید؟

خیلی بد
بد
متوسط
خوب
عالی
5 از 5 رای

/@arastoo
ارسطو عباسی
کارشناس تولید و بهینه‌سازی محتوا

کارشناس ارشد تولید و بهینه‌سازی محتوا و تکنیکال رایتینگ - https://arastoo.net

دیدگاه و پرسش

برای ارسال دیدگاه لازم است وارد شده یا ثبت‌نام کنید ورود یا ثبت‌نام

در حال دریافت نظرات از سرور، لطفا منتظر بمانید

در حال دریافت نظرات از سرور، لطفا منتظر بمانید