هوش مصنوعی Gemini چیست؟ (قسمت اول)
هوش مصنوعی Gemini جدیدترین نوآوری در دنیای AI است که توسط شرکت گوگل معرفی شده است. در این مقاله میخواهیم یک بررسی همه جانبه و دقیق از ویژگیهای این محصول گوگل داشته باشیم. سوالاتی نظیر: آیا Gemini خلاقانه است؟ مزیت رقابتی این هوش مصنوعی با دیگر رقبا مثل ChatGPT چیست؟ چالشها و حاشیههای این محصول تاکنون چه بوده است؟ در این مقاله پاسخ داده میشوند.
همچنین اگر مثل ما درباره دنیای هوش مصنوعی کنجکاو هستید پیشنهاد میکنیم مطالب قبلی بلاگ ما را بخوانید و منتظر مقالات جدید باشید، سفر ما و هوش مصنوعی هنوز به انتها نرسیده است…
رقابت رو به رشد در دنیای هوش مصنوعی
دنیای هوش مصنوعی به سرعت در حال تکامل است و اعداد و ارقام تصویر واضحی را به ما نشان میدهند.
امروزه 35 درصد کسبوکارها از هوش مصنوعی استفاده میکنند، از جمله 68 درصد در زمینه بهداشت و مراقبتهای پزشکی، 63 درصد درفناوری اطلاعات و مخابرات، و 72 درصد از خرده فروشیهای آنلاین. در یک نظرسنجی معتبر 84 درصد از سازمانهای تجارت جهانی پاسخ دادهاند که هوش مصنوعی به رشد آنها کمک میکند و در رقابت تجاری به آنها برتری میدهند. پیشبینی میشود تا سال 2025 ارزش بازار هوش مصنوعی به 305 میلیارد دلار برسد وتا سال 2030 738 میلیارد دلارارزش این بازار خواهد بود.
نمیتوان انکار کرد که فناوری هوش مصنوعی به سرعت در حال رشد است. رقابت بین شرکتهای فناوری، به ویژه آنهایی که در حال حاضر به شدت در تحقیق و توسعه هوش مصنوعی سرمایهگذاری میکنند، جریان دارد. این چه عواقبی دارد؟
خوب، هرچه رقابت شدیدتر باشد، امکان بروز خلاقیت، کیفیت بهتر و هزینه پایینتر، بیشتر میشود.
درست به همین دلیل بود که وقتی شرکت OpenAI هوش مصنوعی خود، ChatGPT را در اواخر 2022 منتشر کرد، سر و صدای زیادی در دنیای فناوری بهپا شد. کارشناسان هوش مصنوعی نگران بودند که OpenAI یک انحصار نامشروع را در این بازار به راه بیاندازد. در هر صورت تنها ظرف 2 ماه، ChatGPT بیش از 100 میلیون کاربر جذب کرد.
این چیزی بیسابقه در تاریخ اینترنت بود! به عنوان مثال اینستاگرام برای رسیدن به نقطه مشابه نیاز به دو سال زمان داشت.
از آنجایی که ورژن جدید این محصول، ChatGPT-4 با هیچ رقیبی بالقوهای روبرو نیست، نگرانی درباره اینکه OpenAI به انحصار در این بازار برسد افزایش یافت. نگرانیها وقتی بیشتر شد که OpenAI تصمیم گرفت قیمت ChatGPT-4 تقریباً 50 برابر شود!
درست در زمانی که بنظر میرسید OpenAI کنترل همه چیز را به دست گرفته است، گوگل با ابزاری هیجان انگیز به نام Gemini AI وارد صحنه شد.
هوش مصنوعی Gemini چیست و چقدر نوآورانه است؟
در اوایل دسامبر 2023، گوگل Gemini AI را به بازار معرفی کرد. یک مجموعه جدید و یکپارچه از مدلهای بزرگ (LLM) که برای مدیریت انواع مختلف دادهها به صورت همزمان طراحی شده بود. این هوش مصنوعی همهکاره میتواند متن، تصاویر، کد و صدا را از طریق یک رابط کاربری، پردازش کند.
در واقع Gemini یک جایگزین برای محصول قبلی گوگل در همین زمینه یعنی، Bard بود. گوگل در فوریه 2024 اعلام کرد “بارد” اکنون “جیمنی” نام خواهد داشت و قابلیتهای بیشتری را به آن اضافه کرد. چر؟ خب وقتی که گوگل بارد را معرفی کرد، نقصهای قابل توجهی داشت. از آن زمان، گوگل دو ارتقا بزرگ را روی آن انجام داد و پیشرفتهای مهمی را توسط گوگل بارد اعمال کرد. بنابراین تصمیم به تغییر نام آن را میتوان تلاشی برای عبور از شهرت قبلی و ورود به عصر جدید از یک فناوری دانست، همچنین گوگل جیمنی بیشتر از بارد بر گفتگو و چت کردن متمرکز است و شاید بتوان این مورد را دلیل دیگری برای تغییر نام فناوری هوش مصنوعی گوگل، لحاظ کرد.
هوش مصنوعی Gemini اکنون در سه مدل در دسترس است:
- نانو: مدلی که برای دستگاههای تلفن همراه طراحی شده است و قابلیتهای بینظیر هوش مصنوعی را به صورت سبکتر برای استفاده در موبایلها، فراهم میکند. هدف مدل نانو این است که به عنوان یک هوش مصنوعی جمع و جور و درعین حال قوی برای کاربران ایفای نقش کند. در حقیقت این مدل راهحلهای مبتنی بر هوش مصنوعی را در دستگاههای موبایلی، تقویت میکند.
کاربران موبایل میتوانند با نصب برنامه جیمنی روی اندروید یا برنامه Google در دستگاههای IOS، از آن به صورت رایگان استفاده کنند. البته کاربران وب هم میتوانند از طریق مرورگر به نسخه رایگان جیمنی دسترسی داشته باشند.
- پرو: این مدل برای انجام طیف گستردهای از وظایف طراحی شده است و امکانات بسیار پیشرفتهای را در اختیار کاربران میگذارد. این نسخه قابلیت ادغام با Vertex AI و AI Studio را دارد. با داشتن این نسخه میتوانید به وضوح تواناییهای هوش مصنوعی گوگل را در انجام وظایف پیچیده محک بزنید. این نسخه برای استفاده تجاری نیز مناسب است.
- اولترا: این نسخه پیشرفتهترین مدل جیمنی برای کارهای بسیار پیچیده مثل: کدنویسی، همکاری در پروژههای خلاقانه، استدلال منطقی و… است. اعتقاد عمومی بر این است که این مدل جواهر اصلی سری جیمنی است. قدرتمندترین و البته تواناترین نسخه میباشد. استفاده از آن پولی است، اشتراک با هزینه 19.99 دلار در ماه! و البته با اولین اشتراک دو ماه به صورت رایگان در دسترس خواهد بود. مقداری گران است اما به نظر میرسد کاربران از پولی که برای آن هزینه کردهاند، راضی هستند.
مزیت رقابتی هوش مصنوعی جیمنی چیست؟
هوش مصنوعی جیمنی نقاط تمایز یا به اصطلاح مزایای رقابتی خوبی دارد. این مزایا به صورت موردی عبارتند از:
- قابلیت Multimodality یا توانایی پردازش چند بعدی
این نقطه قوت اصلی جیمنی است. میتواند انواع مختلف اطلاعات مانند متن، کد، صدا، تصاویر و ویدیو را درک کند. این بدان معنی است مثلاً میتواند متن را غلط گیری کند، میتواند تصاویر را تجزیه و تحلیل کند، فیلمهای بلند را خلاصه کند، یا حتی یک قطعه موسیقی را بر اساس پرامپتی که برای آن مینویسید، بسازد! جیمنی قادر است هرچیز جدیدی را بر اساس پرامپتی که برای آن بنویسید، در هر قالبی، درست کند.
- قابلیت Flexibility یا توانایی انعطافپذیری
نقطه قوت دیگر هوش مصنوعی Gemini این است که روی طیف وسیعی از دستگاهها، از موبایلهای هوشمند گرفته تا دیتاسنترها و ابرکامپیوترها، به راحتی کار کند. این همان مزیتی است که این هوش مصنوعی را همهکاره میکند و دامنه کاربردهایش را بسیار گسترش میدهد.
- قابلیتهای Reasoning یا استدلال منطقی
جیمنی در این حوزه میتواند به سادگی دادههایی را که حفظ کرده است، تکرار کند. این هوش مصنوعی میتواند واقعاً به طور انتقادی فکر و تجزیه و تحلیل کند و از قابلیت استدلال منطقی برای کارهایی مثل حل مسئله، تصمیمگیری مستقل، و پاسخ به سوالات پیچیده، بهره میبرد. قابلیت استدلال جیمنی به قدری قوی است که میتواند بر سر مسائل حوزه علوم انسانی واقعاً ایراد نظر کند و حتی با شما مخالفت کند!
حواشی و جنجالها درمورد هوش مصنوعی Gemini چیست؟
بحث و جدل پیرامون هوش مصنوعی جیمنی از مقایسه آن با ChatGPT-4 در معیار MMLU (Massive Multitask Language Understanding) ناشی میشود. برخی از کارشناسان در این زمینه معیارهای بنچمارک گوگل را زیر سوال بردهاند. برخی معتقدند جیمنی ممکن است در انجام برخی وظایف برتری چندانی نسبت به ChatGPT-4 نداشته باشد، این موضوع بحثهای گستردهای را درباره اطمینانپذیری هوش مصنوعی، به راه انداخته است. بسیاری از فعالین این حوزه معتقدند باید معیارهای ارزیابی استانداردی را برای تست هوش مصنوعیها، تدوین کرد.
همچنین، شک و تردید بسیاری در مورد ویدیوی تبلیغاتی گوگل از جیمنی وجود دارد. منتقدین میگویند ممکن است تواناییهای چند بعدی و استدلالی جیمنی در آن ویدیو اغراق شده باشد. همه هیاهو درباره ویدیوی شش دقیقهای است که گوگل درباره جیمنی منتشر کرده. در این ویدیو گوگل مدعی شده جیمنی نشانههای بصری را تشخیص میدهد و مکالمه و پاسخ به کاربر را بسیار سریعتر و در حقیقت به صورت زنده، پردازش میکند. البته اشخاصی از مسئولین گوگل اعتراف کردهاند که این ویدیو بیشتر جنبه تبلیغاتی داشته و برخی ویژگیها اغراق آمیز بودهاند.
این حواشی، نگرانیهایی را درباره جنبه اخلاقی هوش مصنوعی و مسئولیت شرکتها در به تصویر کشیدن قابلیتهای محصولشان به صورت دقیق را، به وجود آورد. خب حالا باید به این سوال پرداخت که، هوش مصنوعی جیمنی واقعاً چه کاری میتواند انجام دهد؟
ادامه این مقاله را در بخش دوم بخوانید.
دیدگاهتان را بنویسید