سریال و انمیشن

پروژه آسترا گوگل (Project Astra) چیست؟ نگاهی به رقیب GPT-4o

پروژه آسترا گوگل (Project Astra) چیست؟ نگاهی به رقیب GPT-4o

پروژه آسترا یکی از بلند پروازی‌های گوگل است که می‌توان به نوعی آن را پاسخی به تمامی ویژگی‌هایی دانست که این روز‌ها چت جی پی تی ارائه کرده است. در این مقاله قرار است در مورد اینکه پروژه آسترا گوگل چیست و چه امکاناتی ارائه می‌دهد، به صورت کامل با هم صحبت کنیم.

هوش مصنوعی در چند سال گذشته پیشرفت‌های قابل قبول و خوبی داشته است و توانست خود را از پروژه‌های صرفا تحقیقاتی به چت بات‌ها و گجت‌های مختلف برساند و اکنون هم که در حال شبیه سازیهای رویایی در فیلم‌های مختلف است. در این مقاله با بررسی پروژه آسترا (Project Astra) که به تازگی توسط گوگل معرفی شده است و فیلم‌های آزمایش آن به شدت حیرت انگیز بوده است، می‌خواهیم در مورد همین هوش مصنوعی صحبت کنیم که یک گام از سایر دستیار‌ها فراتر رفته و می‌تواند به صورت بصری محیط اطراف خود را شناسایی کرده و بر اساس آن به کاربران خود خدمت رسانی کند. در ادامه این مطلب از پلازا، در مورد اینکه پروژه آسترا گوگل چیست صحبت خواهیم کرد.

فهرست مطالب

پروژه آسترا چیست؟

پروژه آسترا نام جدیدی است که این روزها در اینترنت شنیده می‌شود و اشاره به پروژه جدید گوگل برای تکمیل دستیار هوش مصنوعی خود یعنی هوش مصنوعی Gemini دارد. در واقع پروژه آسترا پاسخی به مدل زبانی جدید اوپن ای آی، یعنی GPT-4o است.

در واقع پروژه آسترا یک دستیار هوش مصنوعی را ارائه می‌دهد که می‌تواند به صورت محاوره ای با کاربران خود چت کرده، متن، صدا، تصویر و ویدئو را به عنوان ورودی بگیرد و علاوه بر این موارد که در چت جی پی تی هم فعال است، می‌تواند از سخت افزار گوشی که روی آن فعال است، مانند دوربین، جی پی اس و سایر امکانات نیز استفاده کند. به این صورت که این گوشی در لحظه مشاهدات خود را از دوربین گرفته و آنها را تحلیل کرده و اطلاعات را در اختیار کاربر می‌گذارد. همینطور موتور جستجوی قدرتمند گوگل نیز برای پیدا کردن جواب درست در تمامی موارد در اختیار این هو ش مصنوعی قرار خواهد داشت که می‌تواند با آن اطلاعات بروز را در اختیار شما قرار دهد.

پروژه آسترا چیست

به طور مثال اگر شما گوشی خود را مقابل ویترین یک مغازه بگیرید و از هوش مصنوعی پروژه آسترا بخواهید که به شما بگوید این مغازه کدام یک از اجناس خود را ارزانتر و کدام را گرانتر می‌فروشد، این کار را در لحظه و به صورت بلادرنگ برای شما انجام خواهد داد. در این حالت این هوش مصنوعی محصولات را پیدا کرده، قیمت آنها را بررسی می‌کند و با کمک موتور‌های جستجو قیمت‌های سایر فروشندگان را پیدا کرده  و نتیجه اینکه کدام گرانتر و کدام ارزان تر است را به شما خواهد داد.

نکته مهم در مورد پروژه آسترا گوگل این است که آسترا یک برنامه جدا نبوده و نمی‌توان برنامه ای را با این عنوان پیدا کرد، بلکه اسم رمزی برای توسعه برنامه جمینای گوگل است. در واقع تمامی تغییرات و دستاورد‌هایی که گوگل در پروژه آسترا بدست آورده است، با کمک دستیار جمینای به کاربران عرضه خواهد شد و مروی این بستر در دسترس عموم قرار می‌گیرد. در صورتی که سری به مقاله هوش مصنوعی گوگل جمینای بزنید، می توانید روش کار با این دستیار هوش مصنوعی حرفه ای را در اختیار داشته باشید. در ادامه در مورد مدل زبانی استفاده شده در پروژه آسترا و ویژگی‌های آن بیشتر صحبت خواهیم کرد.

مکانیزم کاری پروژه آسترا گوگل چیست؟

همانطور که در بخش‌های قبلی نیز اشاره کردیم، پروژه آسترا گوگل بر اساس مدل زبانی Gemini کار می‌کند و در واقع از همین برنامه و بستر استفاده می‌کند. در واقع ما در حال صحبت در مورد هسته اصلی این هوش مصنوعی هستیم. مدل زبانی Gemini در واقع یک هسته هوش مصنوعی پیشرفته است که جانشین هوش مصنوعی‌های LaMDA و PaLM گوگل شده است. این هوش مصنوعی توسط سازمان DeepMind توسعه داده شده است.

در مورد DeepMind، که در خیلی مراجع آن را به صورت Google DeepMind معرفی می‌کنند، باید گفت که این سازمان در واقع بخش توسعه هوش مصنوعی گوگل است. DeepMind در ابتدا یک شرکت استارتاپی بود که در سال ۲۰۱۰ توسط متخصصان هوش مصنوعی و شبکه‌های عصبی دانشگاه لندن پایه گذاری شد و توانست پروژه‌های موفقی را در مدت کوتاهی به ثمر برساند. همین موضوع باعث شد که غول‌های تکنولوژی به سراغ آن آمده و از میان پیشنهادات رنگارنگی که از طرف سازمان‌های بزرگ به آن شده بود و اسامی مانند فیسبوک و گوگل هم در میان آنها دیده می‌شد، این سازمان به گوگل فروخته شد. از سال ۲۰۱۳ که این اتفاق افتاد، دیپ مایند در حال توسعه هوش مصنوعی‌ها و روبات‌های گوگل می‌باشد.

مکانیزم کاری پروژه آسترا گوگل چیست

مدل زبانی که دیپ مایند برای پروژه آسترا ارائه داده است، یعنی همان Gemini، برای اولین بار در سال ۲۰۲۳ ارائه شد و می‌توان گفت حاوی جدیدترین دستاورد‌های گوگل است که از نظر نتایج آزمایش‌ها رقابت سخت و تنگاتنگی با مدل زبانی GPT-4 از اوپن ای آی داشت و چیزی از آن کم نداشت. این مدل زبانی با سرویس‌های متعددی به نام‌های جمینای پرو، جمینای اولترا و جمینای نانو در اختیار کاربران قرار گرفته بود و مدل محبوبی است که گوگل قبلا آن را به صورت تجاری عرضه کرده و به نظر نمی‌رسد قرار باشد این برند بزرگ را برای به ثمر رساندن پروژه آسترا، لنگ بگذارد.

این مدل زبانی می‌تواند عملکرد قوی در تحلیل‌های بلادرنگ از تصاویری که می‌بیند، داشته و این موضوع یکی از اصلی ترین نقاط قوت پروژه آسترا به شمار می‌رود. در واقع روش کاری آن به این صورت است که می‌تواند آنچه که از دوربین‌های دیوایسی که روی آن فعال است، می‌بیند را تحلیل کرده و به سوالات پیرامون آن پاسخ دهد. برای این منظور این هوش مصنوعی چهار گام اصلی را در می‌دارد:

  • رکورد کردن ویدیو‌های کوتاه به صورت پشت سر هم؛
  • رکورد کردن صحبت‌هایی که از طریق میکروفون به گوش آن می‌رسد؛
  • ایجاد یک تایم لاین از ویدئو‌ها و صدا ها؛
  • ایجاد درک دوجانبه از صدا‌ها و تصاویری که می‌بیند به صورت همزمان و ارائه پاسخ؛

نکته جالب اینجاست که همه این فعالیت‌ها باید به صورت Realtime و در لحظه انجام شود و پروژه آسترا می‌تواند این کار را برای ما انجام دهد. البته نیازی نیست که صرفا از محیط اطراف از آن سوال شود و شما می‌توانید هر گفت و گویی با آن داشته باشید. اما ویژگی ورودی گرفتن از طریق دوربین و بررسی آن، موضوعی است که تا کنون در هوش مصنوعی دیگری مشاهده نشده است. در ادامه در بیشتر در مورد اینکه مدل زبانی جمینای قرار است چه ویژگی‌هایی را در پروژه آسترا پیاده سازی کند صحبت خواهیم کرد.

روش کاری در آسترا

قابلیت‌های پروژه آسترا

تا به اینجا در مورد اینکه پروژه آسترا چیست و مکانیزم اصلی کاری آن کدام است با هم صحبت کردیم و در این میان کم و بیش با کارهایی که این هوش مصنوعی خارق العاده قرار است برای ما انجام دهد، آشنا شدیم. اما اینکه پروژه آسترا دقیقا چه قابلیت‌ها و توانایی‌هایی دارد از موضوعاتی هستند که هنوز در مورد آنها صحبت نشده است. در این بخش از مقاله می‌خواهیم به صورت دقیق به بررسی این موضوع بپردازیم و ببینم توانایی‌های آن در چه حدی خواهد بود.

در حال حاضر بهترین مرجعی که برای این کار داریم، ویدئو‌های منتشر شده از طرف خود گوگل است که آنها را در سایت رسمی دیپ مایند منتشر کرده است. این ویدئو‌ها مربوط به تست کار کردن با نسخه‌های آزمایشی پروژه آسترا می‌باشد که در آن قابلیت‌های شگفت انگیزی توسط یکی از تستر‌ها در فضای اداری دیپ مایند در لندن آزمایش می‌شود. هرچند این ویژگی‌ها به صورت عملی در حال تست بوده و می‌توان آنها را دید، اما برای عملیاتی شدن آنها هنوز راه زیادی در پیش بوده و تا زمانی که هر کس بتواند این قابلیت‌ها را روی گوشی خود داشته باشد، مطمئنا مدت زیادی طول خواهد کشید. مهمترین مواردی که در بین این ویژگی‌ها دیده می‌شوند از این قرارند:

درک محتوا و کانتکست مورد بحث از روی تصاویر

شاید مهمترین ویژگی که می‌توان برای پروژه آسترا نام برد همین باشد. قابلیتی که نمی‌توان آن را در خیلی از رقبا دیگر دید. در اینجا وقتی شما در حال صحبت با دستیار هوش مصنوعی خود هستید، می‌توانید با راهنمایی‌های خیلی ساده مانند کشیدن چند شکل ساده و یا نمایش جزئیات خیلی عادی، کاری کنید که این هوش مصنوعی منظور شما را کاملا درک کرده و در مورد آن موضوع با شما صحبت کند.

در ویدئو‌های منتشر شده از این قابلیت با نمایش یک کاریکاتور از یک مرد با موهای وزوزی، و همینطور یک آدمک که در زیر درختی ایستاده است، این هوش مصنوعی می‌تواند تشخیص دهد که در حال صحبت در مورد انیشتین و نیوتون هستیم و فیزیک موضوع مورد بحث در این مکالمه است. همینطور همین موارد با نمایش تصاویری از داستان‌های شکسپیر، آن هم به صورت دست نویس روی یک تخته وایت برد، برای پروژه آسترا قابل درک می‌باشد.

درک محتوا و کانتکست مورد بحث از روی تصاویر

دریافت ورودی‌های پیچیده

یکی از مهمترین قابلیت‌هایی که پروژه آسترا ارائه می‌کند و انقدر به ما نزدیک بوده و درست در جلوی چشمان ما قرار دارد، دریافت ورودی‌هایی پیچیده است. این ویژگی، که در حال حاضر به این شکل تنها در پروژه آسترا و هوش مصنوعی جمینای پیدا می‌شود، به کاربر اجازه می‌دهد با ارائه ویدئو، متن، فایل صوتی، تصویر و یا موارد مختلفی از آنها به صورت ترکیبی، با این هوش مصنوعی ارتباط بگیرد. در این مورد باید گفت پروژه آسترا و جمینای در نوع خود بی نظیر عمل کرده و هیچ کدام از رقبا وارد این زمینه نشده اند.

تشخیص مکان‌ها از روی تصویر

موضوع دیگری که میتوان از آن در این هوش مصنوعی استفاده کرد، تشخیص و درک مکان‌ها است. البته باید گفت خیلی از انواع هوش مصنوعی هستند که با نشان دادن برج ایفل به آنها بگویند که این تصویر مربوط به کجا است. اما این هوش مصنوعی می‌تواند خیلی ریز تر از این حرف‌ها آدرس محلی که در آن هستید را به شما بدهد و در واقع از خود گوگل و تمامی تصاویری که در گوگل مپ قرار دارد برای درک این موضوع کمک می‌گیرد.

ارائه اطلاعات تخصصی

سطح اطلاعاتی بالا، یکی دیگر از نقاط قوت در پروژه آسترا به شمار می‌رود. هر چند هوش مصنوعی گوگل به صورت دقیقی اطلاعاتی که برای یادگیری استفاده کرده را ارائه نداده، اما با توجه به ویدئو‌ها می‌ می‌توان گفت از نظر فنی مهندسی، فیزیک، ریاضی و ادبیات، این هوش مصنوعی حسابی روی فرم بوده و اطلاعات خوبی را در خود دارد که می‌تواند برای خیلی از کاربران و استفاده کنندگان از این دستیار هوش مصنوعی مهم و کاربردی باشد. شما به راحتی می‌توانید پاسخ مسائل ریاضی و فیزیک را با گرفتن دوربین گوشی خود و پرسیدن از جمینای، بدست آورید.

همطنرو در صورتی که یک دیوایس را به آن نشان داده و بخواهید اجزای آن را تشریح و کار هر یک را بازگو کند، این هوش مصنوعی می‌تواند این کار را جز به جز برای شما انجام دهد. در یکی از ویدئو‌ها با نمایش یک اسپیکر به این هوش مصنوعی این اتفاق افتاده و این هوش مصنوعی اطلاعات خوبی را در مورد اجزای آن به کاربر ارائه می‌دهد.

ارائه اطلاعات تخصصی

سرعت بالا و ریل تایم بودن

مورد دیگری که می‌توان در تست‌ها و فیلم‌های آزمایش پروژه آسترا مشاهده کرد، ریل تایم بودن و قدرت پاسخ دهی فوق العاده سریع آن است. دیپ مایند اعلام کرده است که قرار است این ویژگی به همین شکل بماند اما مطمئنا وقتی که این سرویس به دست مخاطبان برسد، مسائلی مانند قدرت پردازنده گوشی و سرعت اینترنت می‌تواند در این خصوص تاثیر گذار باشد. اینکه گوگل تا چه اندازه خود را متعهد به بالا نگه داشتن این کیفیت و حفظ سرعت کنونی بداند، موضوعی است که برای روشن شدن آن باید تا انتشار نسخه‌های عملیاتی و نهایی این دستیار هوش مصنوعی صبر کنیم.

امکان استفاده از موتور جستجو گوگل

وقتی در مورد یک هوش مصنوعی قدرتمند که توسط گوگل ارائه شده است حرف می‌زنیم، مطمئنا میتوان حدس زد که قرار است موتور جستجوی حرفه ای گوگل نیز در آن وارد شده و در مورد پیدا کردن اطلاعات به آن کمک کند. البته باید گفت که این موضوع در مورد پروژه آسترا به صورت کنترل شده و محدود می‌باشد. قبلا گوگل در هوش مصنوعی بارد تجربه چندان خوبی را از این موضوع نگرفته بود و خیلی از کاربران احساس می‌کردند که پاسخ‌های این هوش مصنوعی زیادی به نتایج جستجو نزدیک بوده و خود این هوش مصنوعی هیچ کاری انجام نمی‌دهد، باید منتظر ماند و دید این مشکلات در پروژه آسترا تا چه اندازه برطرف خواهد شد.

هوش مصنوعی آسترا روی چه دیوایس‌هایی کار می‌کند؟

یکی دیگر از مسائل مهم و درخور توجه که می‌توان در مورد آن صحبت کرد، بستر فعالیت هوش مصنوعی آسترا خواهد بود. در این مورد باید گفت که تمامی ویدئوهای تست‌هایی که در سایت دیپ مایند به نمایش درآمده است، روی گوشی‌های گوگل پیکسل انجام گرفته است. ولی به نظر می‌رسد که این دستیار بتواند روی سیستم‌های دیگر هم کار کند. در واقع باید گفت بر اساس اعلام خود گوگل، این هوش مصنوعی می‌تواند به خوبی و با تمام ویژگی‌ها، روی گوشی‌هایی که تراشه آنها دارای واحد NPU برای پردازش‌های عصبی باشند، فعالیت کند.

البته باید گفت اکثر این گوشی‌ها، مدل‌های میان رده‌های گران و پرچمداران بوده و بازه چندان گسترده‌ای را تشکیل نمی‌دهند. همینطور پروژه آسترا می‌تواند روی عینک‌های هوشمند نیز فعال باشد و کار کند. البته گوگل در مورد اینکه آیا این عینک‌های هوشمند حتما باید از نوع عینک‌های گوگل باشد یا با سایر عینک‌ها نیز می‌توان کار کرد، حرفی به میان نیاورده است. ظاهرا برای داشتن اطلاعات دقیق در مورد اینکه روی چه دیوایس‌هایی می‌ می‌توان از این ویژگی استفاده کرد، لازم است تا تجاری شدن کامل این پروژه صبر کنیم.

هوش مصنوعی آسترا روی چه دیوایس‌هایی کار می‌کند!؟

بررسی رقبای پروژه آسترا

یکی از ترند‌های جالب این روزهای دنیای تکنولوژی کل کل‌های بین شرکت‌های ارائه دهنده هوش مصنوعی است که در واقع می‌توان گفت پروژه آسترا گوگل نیز نتیجه یکی از همین داستان‌ها است. در ماه می‌ ۲۰۲۴ شرکت اوپن ای آی، که که همگی آن را به عنوان یکی از پیشروترین شرکت‌های هوش مصنوعی می‌شناسند و برنامه ChatGPT آن یکی از بهترین‌های این حوزه است، ورژن جدیدی از هوش مصنوعی را معرفی کرد و آن را به صورت رایگان در سایت خود مورد آزمایش قرار داد و به کاربران امکان استفاده محدود از آن را داد.

این هوش مصنوعی سرعت بسیار عالی و قدرت خوبی برای محاوره و گفت و گوی روان و غیر ماشینی با کاربران داشت. اوپن ای آی اعلام کرد که این هوش مصنوعی در نوع خود بی نظیر بوده و به نوعی آن را با هوش مصنوعی سامانتا در فیلم Her مقایسه کرد. گوگل که ظاهرا از این موضوع خوشش نیامده بود هر چه در توان داشت را جمع کرد و کارهای آتی خود را تحت اسم پروژه آسترا  مجتمع کرده و معرفی کرد. در پاسخ به این عنوان، گوگل این هوش مصنوعی را مانند جارویس آیرون من معرفی کرد که به مراتب قابلیت‌های بالاتری را به نمایش گذاشته بود و جنبه ای ابر قهرمانی داشت.

البته نمی‌توان گفت که در آینده کدام یک از این دو هوش مصنوعی برتری نهایی را دارند و دنیای هوش مصنوعی پر از غافلگیری‌های ریز و درشت است و باز هم ممکن است ورق به نفع هر کدام از این دو شرکت بزرگ برگشته و حتی طرف سومی وارد ماجرا شود که گوی سبقت را از هر دوی آنها برباید.

نتیجه گیری

در این مقاله در مورد اینکه پروژه آسترا گوگل چیست و چطور کار می‌کند با هم صحبت کردیم و توانایی‌های آن را دیدیم. در این مورد باید گفت آسترا نامی است که گوگل برای پروژه هوش مصنوعی جدید خود که روی دستیار جمینای پیاده سازی شده، انتخاب کرده است. این هوش مصنوعی می‌تواند ورودی‌های خود را با کمک دوربین گوشی و عینک هوشمند دریافت کده و تحلیل‌های بلادرنگی را روی آنها انجام داده و پاسخ را با لحن محاوره ای و طبیعی در قالب متن و صوت به کاربران ارائه دهد. در صورتی که در مورد پروژه آسترا سوال و یا نظری داشتید، خوشحال می‌شویم آن را با ما و سایر کاربران در میان بگذارید.

منتخب کاربران

منبع : پلاژا

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا