Claude 3 یکی از تواناترین رقبای ChatGPT است. اما وقتی از آنها سوالات مشابهی پرسیده میشود چگونه جواب میدهند؟ در ادامهی این مطلب همراه ما باشید تا پاسخ این سوال را دریابید.
از زمانی که ChatGPT بیش از ۱۸ ماه پیش به جهان معرفی شد، تعداد زیادی از چت باتهای دیگر نیز راه اندازی شدند. برخی از آنها مفید بودند، اما برخی دیگر، نه چندان. اما همراه با Gemini (که قبلا بارد بود)، چت باتی که بیش از رقابتی بودن آن ثابت شده است، Claude است که توسط استارتاپ هوش مصنوعی Anthropic طراحی شده است.
ما یک ChatGPT و Claude 3 را بهمنظور معرفی Claude 3، خانوادهای از مدلهای زبانی که شامل Claude 3 Haiku، Claude 3 Sonnet و Claude 3 Opus است، راهاندازی کردهایم. طبق گفتههای Anthropic تحت حمایت گوگل، Claude 3 بهتر از خانوادهی مدلهای زبانی GPT که ChatGPT را در یک سری تستهای شناختی محک میزند، عمل میکند. در آزمایشهایمان، متوجه شدیم که کلود نسبت به ChatGPT گویاتر است و پاسخهای آن معمولا بهتر نوشته شده و قابل فهمتر است.
اما چگونه آنها را در کنار یکدیگر مقایسه میکنند؟ برای پی بردن به این موضوع، از ChatGPT و Claude 3 سوالات مختلفی پرسیدیم.
تفاوت ChatGPT در مقابل کلود 3 چیست؟
Claude 3 خانواده جدیدی از مدلهای زبانی از Anthropic است که برای تقویت چت بات Claude استفاده میشود. ۳ مدل وجود دارد: هایکو، سونت و اوپوس. Anthropic میگوید در حال حاضر، کلود سونت نسخه رایگان کلود را تامین میکند و در پردازش اطلاعات ۲ برابر سریعتر از کلود ۲.۱ است.
از سوی دیگر، کلود اوپوس، نسخه حرفهای را تقویت می کند. نتایج بنچمارک Anthropic که تصویر زیر نشان میدهد که کلود اوپوس از GPT-4 پیشی گرفته است و همچنین کلود سونت عملکرد بهتری نسبت به GPT-3.5 دارد.
از زمان راه اندازی ChatGPT توسط اعضای مختلف، مدلهای زبانی خانواده GPT ارائه شده است. کاربران رایگان در حال حاضر به GPT-3.5 دسترسی دارند، در حالی که GPT-4 قدرت ChatGPT Plus را دارد که برای یک اشتراک ۲۰ دلار در ماه هزینه دارد. این همان قیمت کلود پرو است. در اینجا چند تفاوت اساسی بین نرم افزار وجود دارد:
ما ChatGPT و کلود را رودررو قرار دادیم و از آنها ۱۳ سؤال بسیار متفاوت میپرسیم که برای آزمایش جنبههایی مانند استدلال و پردازش زبان طبیعی طراحی شدهاند، اما چقدر در انجام کارهای مفید در محل کار مانند اسکن اسناد برای اطلاعات و نوشتن ایمیلها خوب هستند.
من متوجه شدم که کلود در هفت آزمایش پاسخ بهتری ارائه کرد، در حالی که ChatGPT در سه آزمایش پیروز شد. چهار مورد باقی مانده (شامل یکی از تست های طوفان فکری) با تساوی به پایان رسید، به این معنی که کلود در این مسابقه پیروز شد. در ادامه لیست کامل سوالاتی که از هر دو چت ربات پرسیدیم آمده است:
۱) استدلال اخلاقی
در ابتدا، من یک معضل اخلاقی دشوار را برای ChatGPT و کلود مطرح کردم. من به ویژه این معضل را انتخاب کردم زیرا پاسخ صحیح، اگر وجود داشته باشد، لزوما واضح یا سرراست نیست:
مردی در حال رانندگی با ماشین زرهی به سمت مرکز شهر است و قصد دارد بیشترین آسیب را وارد کند. او سه سرنشین در عقب ماشین گروگان دارد. این خودرو به قدری زره پوش است که افراد داخل آن از هر برخوردی جان سالم به در خواهند برد. با این حال، شما این فرصت را دارید که با استفاده از یک موشک انداز، ماشین را از فاصله دور منفجر کنید. آیا باید ماشین را منفجر کنید، همه افراد داخل را بکشید، یا قربانیان قریب الوقوع حمله مرد را نجات دهید؟
پاسخ کلود نسبت به دشواریهای موقعیت بسیار حساس بود و در مجموع پاسخی واقعا انسانی ارائه داد. به نظر میرسد که این ربات سنگین موقعیت را درک میکند و چت بات تقریبا وقتی در مورد وضعیت صحبت میکرد احساسی به نظر میرسید. این باعث شد که احساس بسیار قانع کنندهای داشته باشد.
از سوی دیگر، ChatGPT، دیدگاهها و رویکردهای متفاوتی را که میتوانید نسبت به موقعیت داشته باشید، به وضوح بیان میکند. بسیاری از همان ملاحظات کلود را ترسیم میکند و به دشواریهای موقعیت اشاره میکند.
پاسخ کلود بسیار واضحتر بود و من تمایل دارم رباتهای چت را ترجیح دهم تا به معضلات اخلاقی دشوار پاسخی به سبک «نمای کلی» بدهم، زیرا این پاسخها برای ارائه به بازیگران انسانی مفیدتر و کمتر خطرناکتر هستند تا قضاوت مطلق.
۲) ایجاد توضیحات محصول
اگر یک فروشگاه آنلاین دارید یا به سادگی محصولات زیادی را به صورت آنلاین میفروشید، ایجاد توضیحات منحصر به فرد و قانع کننده محصول برای هر یک کار سادهای نیست. بنابراین، من از ChatGPT و Claude خواستم که یک توضیح محصول برای همان محصول بنویسند یک ساعت دیجیتال. در اینجا نحوه کار کلود آمده است:
من در نهایت از کلود توضیح کمی طولانیتر خواستم، زیرا ندیدهام که به اندازه ChatGPT توضیحات محصول بنویسد. و در پایان کلود ساخت جملهی بهتری انجان داد.
به طور کلی، توضیحات محصول تولید شده توسط کلود بهتر از ChatGPT است. بسیار شبیه استدلال اخلاقی آن، بسیار انسانیتر به نظر میرسد. اگر به طور انبوه توضیحات محصول را با این دو ابزار ایجاد میکردید، باید ویرایشهای بسیار کمتری را برای مواردی که با Claude ایجاد شدهاند انجام دهید.
۳) ایدههای طوفان فکری
در مرحله بعد، من برای کلود و ChatGPT دو وظیفه طوفان فکری قرار دادم، ایدههای پست وبلاگ را برای دو وبلاگ بسیار متفاوت ارائه کردم. اولین مورد برای یک وبلاگ خیالی ناهار خوری است، زیرا میخواستم ببینم دو چت بات چقدر برای ایجاد ایدههای جذاب مفید هستند.
سپس برای وبلاگی در مورد سلامت روان ایدههایی را درخواست کردم تا ببینم آیا آنها “لحن” را به درستی دریافت میکنند، زیرا برای این نوع محتوا به زبان جدیتر و هوشیارتر نیاز است.
پستهای وبلاگ ناهارخوری خوب
باز هم کلود در این کار برنده میشود. عناوین کاملتری را ارائه میدهد، و توضیح آن نشان میدهد که درک روشنی از این که چرا ممکن است مخاطب بخواهد پستهای وبلاگ پیشنهادی خود را بخواند، دارد. این برای کسی که قصد تولید این محتوا را دارد مفید خواهد بود، زیرا در واقع درک آن استدلال و به کار بردن آن در حین نوشتن مفید است.
ChatGPT واقعا نشان نمیدهد که به یک شکل کار میکند و با در نظر گرفتن همه چیز، ایدهها کلیتر هستند. آنها بسیار مبهمتر از کلود هستند، و به نظر میرسد که توسط یک انسان با درک کمی از استراتژی محتوا و تولید پیشنهاد شدهاند، نه یک چت بات هوش مصنوعی.
پستهای وبلاگ سلامت روان
در مرحله بعد، میخواستم ببینم که آیا هر دو ربات چت میتوانند لحن خود و رویکردی را که برای پیشنهادات خود در نظر گرفتهاند، تنظیم کنند، وقتی از آنها خواسته شد تا پستهای وبلاگی درباره موضوعی حساستر ایجاد کنند که به صداقت بیشتری نسبت به یک راهنمای غذاخوری خوب نیاز دارد. در اینجا تلاش کلود آمده است:
اینها همه پیشنهادهای عالی هستند و قطعا لحن درستی دارند، هیچ چیز غیرعادی در اینجا وجود ندارد. با این حال، همانطور که در تصویر زیر میبینید، ChatGPT نیز ایدههای مناسبی را به ما ارائه کرد و سطح مشابهی از دستورالعملهای اضافی را در مورد محتوا ارائه کرد. در اینجا واقعا نمیتوان آنها را از هم جدا کرد!
۴) درک زبان طبیعی
در مرحله بعد، میخواستم ببینم که آیا یک سوال ریاضی معروف که بر شهود ما در مورد ریاضیات تاثیر میگذارد، ChatGPT را بالا میبرد یا .Claude
مت یک سیب و یک موز دارد که با هم ۳.۱۰ دلار قیمت دارند. قیمت سیب ۳ دلار بیشتر از موز است. قیمت موز چقدر است؟
در حالی که ممکن است در ابتدا فکر کنید که پاسخ 10 سنت است، اما در واقع فقط پنج سنت است. کلود آنقدر باهوش بود که نمیتوانست فریب بخورد و دقیقا توضیح داد که چگونه به پاسخ صحیح رسید:
ChatGPT که نمیخواهد خجالت بکشد، پاسخ صحیح را نیز به دست آورد، به این معنی که واقعا چیزی برای جدا کردن این برنامه در این باره وجود ندارد..
۵) خلاصه متن
هر دو ChatGPT و Claude قادر به خلاصه کردن حجم زیادی از متن هستند و نکات کلیدی را بیرون میکشند تا کاربران آنها مجبور به خواندن کل مطلب نباشند. برای این آزمون، از آنها خواستم مقاله اخیر گاردین را در مورد آخرین سخنرانی رئیس جمهور جو بایدن در مورد وضعیت اتحادیه خلاصه کنند.
کلود در کوتاه و مختصر نگه داشتن خلاصههای خود واقعا خوب کار کرد:
ChatGPT بیش از حد رضایت بخش است، اما اگر بخواهیم آنها یکی را انتخاب کنم، باید بگویم که کلود را ترجیح میدهم. سعی نمیکند شما را با اطلاعات بیش از حد اذیت کند که مهم است، با توجه به اینکه خلاصهای را خواستیم اما چت جیپیتی فقط بار دیگر آن را بهتر نوشته است.
بهترین جواب: کلود
۶) مشاوره شخصی
برای این آزمایش، میخواستم ببینم که ChatGPT و کلود در صورتی که از آنها خواسته شود به شخصی که تحت تاثیر سلامت روانی ضعیف است، مشاوره شخصی بدهند، چه واکنشی نشان میدهند. این حیاتی است که ابزارهایی مانند این بتوانند به روشهای سازنده و مناسب به این درخواستها پاسخ دهند، به ویژه که آنها در زندگی ما ادغام میشوند. در اینجا پاسخ کلود آمده است:
اینها شاید مشابهترین پاسخهای ارائه شده توسط این دو چت بات در بین تمام ۱۳ تستی باشد که ما انجام دادیم. صادقانه بگویم، اشتباه کردن این پاسخها که با اعتبارسنجی احساسات کاربران قبل از حرکت به سمت اقداماتی که میتوانند انجام دهند، دشوار است.
هر دو چت بات انجام مراحل بسیار مشابه را پیشنهاد میکردند و همان مراحلی را که هر فرد خوش نیتی به دوستی که با مشکلات مشخص شده دست و پنجه نرم میکند، پیشنهاد میکند.
۷) تجزیه و تحلیل متن
این یک تست بسیار ابتدایی است تا ببینید چت بات چقدر در اسکن متن خوب است. برای این آزمایش، از یک مقاله هاروارد بیزینس ریویو عصارهای برداشتم و کلمه «Beachball» را پنج بار در آن قرار دادم. من همچنین چند نوع را اضافه کردم تا ببینم آیا هر یک از رباتهای گفتگو گیج میشوند یا خیر.
برای اولین بار نیست که کلود به پول میپردازد، متن را اسکن می کند و تعداد دفعاتی را که از کلمه beachball استفاده کردهام به درستی شمارش میکند. برخلاف ChatGPT، اگر متن زیادی را در کلود بچسبانید، آن را به عنوان نوعی “سند” ارسال میکند، مانند تصویر زیر:
به طور ناامید کننده، ChatGPT پاسخ را اشتباه دریافت کرد، تنها توانست دو نمونه از کلمه را شناسایی کند، کمتر از نیمی از تعداد کل. به نظر میرسد ChatGPT به طور خاص با این سبک کار مبارزه میکند. من اخیرا آن را به صورت مو به مو با Gemini قرار دادم و کار مشابهی را در آن گنجانده بودم و نتوانست تعداد دفعاتی را که یک کلمه خاص در یک بلوک متن ظاهر شده است شناسایی کند.
بهترین جواب؟ کلود
۸) ارائه اطلاعات واقعی
برای این کار، میخواستم ببینم که ChatGPT و کلود چقدر در ارائه پاسخ به سؤالی که لزوما واضح نیست، اما هنوز هم در واقعیت مستقر است، خوب هستند. بنابراین، از هر دوی آنها خواستم توضیح دهند که چگونه و چرا دایناسورها از بین رفتند، چیزی که چندین توضیح و عامل تاریخی و علمی برای آن وجود دارد.
در ابتدا، کلود یک نمای کلی بسیار خوب از نظریهها و حقایق پذیرفته شده کلی در مورد انقراض دایناسورها ارائه میدهد.
کلود دوباره توضیح فوقالعادهای ارائه میکند، که تقریبا تمام اطلاعات مشابه ChatGPT را شامل میشود، فقط آن را مشخص میکند و به روشی بهتر در مورد آن صحبت میکند. همچنین به این واقعیت اشاره دارد که دایناسورها همه به یکباره از بین نرفتند، نکته مهمی که ChatGPT شامل آن نشده است.
بهترین جواب؟ کلود
۹) نوشتن خلاق
چه کسی بهترین داستانها را مینویسد، ChatGPT یا کلود؟ از هر دوی آنها یک داستان کوتاه ۳۰۰ کلمهای خواستیم. کلود اول است:
به طرز عجیبی، کلود در واقع یک داستان کوتاه 301 کلمه ای به من ارائه داد، یک کلمه بیش از تعداد کلمات مشخص شده. از سوی دیگر، ChatGPT، به این خلاصه نزدیکتر شد و به نظر من داستان را کمی بهتر نوشت.
من باید این یکی را به ChatGPT بدهم، فقط به این دلیل که تعداد کلمات مشخص شده را با این تفاوت کم و به عمد نیز بررسی کرد.
بهترین جواب؟ ChatGPT
۱۰) نوشتن شعر
ChatGPT و Claude هر دو با ساختارهای مشابهی برای اشعاری که از آنها خواسته بودیم استفاده کردند و این کار جدا کردن دوباره آنها را واقعا سخت میکند. کلود ابیات چهار خطی با دوبیتی قافیه را انتخاب کرد:
و ChatGPT به طور موثر همین کار را انجام داد. همچنین هر دو به اطلاعاتی که من در پرامپت ارائه دادم بسیار نزدیک بودند، بنابراین شعرهایی که تعریف میکنند نیز واقعا مشابه هستند. سرعت محضی که این دو چت بات میتوانند شعر قانع کنندهای تولید کنند کاملا ناچیزی است.
علیرغم شباهتها، با چند بار خواندن هر دو، این یکی را به کلود میدهم، ساختار در چند زمینه کمی پیچیدهتر است و شکوفاییها و چرخشهای زیباتری وجود دارد.
بهترین جواب؟ کلود
۱۱) معماها و استدلال
برای این کار، از دو چت بات خواستیم تا یک معما را حل کنند. کلود اول جواب داد و به وضوح توضیح داد که چرا خدمتکار مقصر است.
ChatGPT نیز معما را درست بیان کرده است، بنابراین واقعا چیزی برای جدا کردن آنها از این نظر وجود ندارد.
۱۲) نوشتن یک ایمیل
در اینجا، از ChatGPT و کلود خواستم که ایمیلی برای رئیسم بنویسند و توضیح دهند که چرا باید اجازه داشته باشم به کار کاملا از راه دور منتقل شوم. کلود یک ایمیل کاملا قابل سرویس نوشت، همانطور که در زیر می بینید:
با این حال، ChatGPT حرفهایتر به نظر میرسد و شما باید قبل از ارسال آن به رئیس خود، ویرایش بسیار کمتری انجام دهید.
با توجه به نزدیک بودن پاسخ ChatGPT به مقاله تمام شده، باید آن را به عنوان برنده این مقاله معرفی کنم.
بهترین جواب؟ ChatGPT
۱۳) ایجاد فرمولهای صفحه گسترده
برای این آزمایش نهایی، از ChatGPT و Claude خواستم که یک فرمول صفحه گسترده برای من ایجاد کنند. این درخواستی است که من فرستادم:
ستون B شامل مجموعهای از مقادیر است. من میخواهم آنها را با مقادیر مربوط به ستون E در برگه «Filter Down» تطبیق دهم و با استفاده از یک فرمول، مقادیر منطبق را از ستون F، G و H در فیلتر به صفحه فعلی پایین بیاورم.
در اینجا نحوه کار کلود آمده است:
کلود سعی کرده است یک فرمول ساده و چندمنظوره بسازد که از جایی که در برگه قرار داده شده است استفاده کند تا بفهمد چه کاری باید انجام شود، که جالب است، اما احتمالا به این سرعت، کار نخواهد کرد و احتمالا خراب خواهد شد، صادقانه بگویم. متیو بنتلی، ساکن Tech.co می گوید: Spreadsheet whizz.
او ادامه داد: «نیازی به پیچیده کردن درخواستهای ساده وجود ندارد». “چت GPT برای این کار به نظر من بهتر است. این یک درخواست Vlookup بسیار ساده است و به تمام فرمول اضافی ارائه شده توسط کلود نیاز ندارد.
بهترین جواب؟ ChatGPT
تفاوت کلود و چت جیپیتی در UI و UX
البته استفاده از ChatGPT و Claude هر دو بسیار آسان است و رابطهای آنها از نظر قالب و ساختار بسیار شبیه به هم هستند. همین را میتوان در مورد Gemini، Perplexity AI و Copilot نیز گفت. اکثر این چت باتها تجربه کاربری روان و سادهای را ارائه میدهند.
با این حال، من لحنهای آرامبخشی را که Anthropic برای کلود انتخاب کرد، دوست دارم، زیرا با نگرش چت بات مطابقت دارد، که شاید کمی بیشتر از برخی از رقبای خود اندازهگیری شود. از طرف دیگر ChatGPT با طرح رنگ مایل به خاکستری خود گاهی اوقات کمی بالینی میشود. به طور کلی، طراحی Anthropic فقط کمی زیباتر از ChatGPT است.
مانند Gemini، کلود معمولا در قالببندی پاسخهای خود کار بهتری انجام میدهد، چیزی که ChatGPT در آن خوب نیست. اگرچه دیدهام که ChatGPT بیشتر از هدرها برای جدا کردن متن استفاده میکند، اما نحوه قالببندی کلود پاسخهایش را دوست داشتم. یکی دیگر از چیزهای عالی که کلود ارائه میدهد، سبک قلم متفاوت است که خواندن آن برای افراد نارساخوان آسانتر است.
با این حال، استفاده از ChatGPT بدون محدودیت در تعداد سوالات شما کاملا رایگان است. از سوی دیگر، نسخه رایگان کلود در صورت پرسیدن بیش از حد سوال شما را قفل و شما را مجبور میکند ۳ الی ۴ ساعت منتظر بمانید و این مسئله برای کاربران خوشایند نیست.
دادهها و حریم خصوصی در این اپلیکیشن چگونه است؟
Claude 3 و ChatGPT رفتار متفاوتی با کاربران خود دارند. اگر نگران حریم خصوصی خود هستید، مهم است که بدانید چه چیزی را ذخیره و مشاهده میکنند و چه چیزی را نمیبینند. ChatGPT این حق را برای خود محفوظ میدارد که از دادههای شما برای آموزش مدلهای خود استفاده کند و کلود نیز همین کار را میکند. هر دو OpenAI و Anthropic میگویند که برای حداکثر امنیت، اتصال بین سرورهای خود و کاربران خود را به صورت سرتاسر رمزگذاری میکنند.
با این حال، درخواستها و خروجیهای کاربران تجاری و سازمانی کلود به طور خودکار ظرف ۲۸ روز پس از دریافت یا تولید حذف میشوند، به جز زمانی که قانونا موظف به نگه داشتن آنها برای مدت طولانیتری هستند یا شما در غیر این صورت موافقت کنید. درخواستهای کاربران مصرفکننده پس از ۹۰ روز حذف میشوند، اما اگر یکی از درخواستهای شما بهعنوان بالقوه مخرب، مضر یا ناایمن علامتگذاری شود، میتواند تا دو سال حفظ شود.
کاری که ChatGPT با دادههای شما انجام میدهد کمی متفاوت است. اساسا، اگر میخواهید چتهای خود را ذخیره کنید و ChatGPT آنها را روی سیستم نگه دارد، همچنین موافقت میکنید که ممکن است برای آموزش مدل از آنها استفاده شود و از این نظر، ممکن است توسط انسانهای دیگر قابل دسترسی باشد. اگر سابقه چت را خاموش کنید، نمیتوانید هیچ یک از چتهای خود را ذخیره کنید و ChatGPT از آن برای آموزش مدلهای خود استفاده نمیکند. هر گونه داده تجاری ذخیره شده در ChatGPT API برای آموزش GPT LLM استفاده نمیشود.
استفاده از چت باتها در محل کار
البته، راههای زیادی وجود دارد که کسبوکارها میتوانند از ChatGPT و Claude برای کار استفاده کنند. در واقع، ما در این مقاله به تعدادی از آنها اشاره کردیم. اما اگر به طور منظم از چت باتها در محل کار استفاده میکنید، نکاتی وجود دارد که ارزش بررسی دارد.
به عنوان مثال، آیا شرکت شما مجموعهای از دستورالعملها برای استفاده از ابزارهای هوش مصنوعی دارد؟ اگر مطمئن نیستید، باید این موضوع را با مدیر یا رئیس بخش خود توضیح دهید. ممکن است هنوز آن را ندانید، اما شرکت شما ممکن است قوانین سختگیرانهای در مورد انواع دادههایی که میتوانید در ابزارهای شخص ثالث وارد کنید، یا حتی ابزارهای هوش مصنوعی به طور خاصتر داشته باشد.
ثانیا، شما باید در مورد استفاده از هوش مصنوعی، به ویژه با مدیر خط خود، باز و شفاف باشید. بحث در مورد اینکه چه وظایفی برای تکمیل چت باتهای هوش مصنوعی مناسب است ادامه دارد و سایر افراد در شرکت شما ممکن است تصور متفاوتی از آن چه برای شما قابل قبول است داشته باشند. بعلاوه، بیشتر مدیران و رهبران کسب و کار فکر میکنند که باید قبل از استفاده از ابزارهای هوش مصنوعی به دنبال مجوز باشید.
برای هر کاری که از ابزارهای هوش مصنوعی استفاده میکنید، به یاد داشته باشید که کار آنها را طوری بررسی کنید که گویی توسط یک کارمند جدید انجام شده است. اگرچه ابزارهای هوش مصنوعی در بیشتر مواقع بسیار سریع و به طرز شگفت انگیزی دقیق هستند، البته میتوانند توهم ایجاد کنند و اطلاعات نادرستی ارائه دهند. بنابراین، بیش از حد گمراه نشوید!
جمعبندی…
در تست ChatGPT در مقابل کلود نمیتوان گفت به طور کلی کدام یک بهتر است؛ باید ببینید برای چه کاری میخواهید از آنها استفاده کنید.
اگر سوالی درباره کلود یا چت جیپیتی داشتید، میتوانید در بخش کامنتها از ما بپرسید.