این گزارش که توسط شرکت رتبهبندی خبری نیوزگارد در ایالات متحده منتشر شده، حاکی از آن است که چتباتها در سال ۲۰۲۵ برخلاف سال گذشته، دیگر از پاسخ دادن به سؤالاتی که اطلاعات کافی در مورد آنها ندارند، خودداری نمیکنند و این امر منجر به افزایش چشمگیر دروغپردازیها شده است.
پیآی از اینفلیکشن ایآی، با ۵۷٪ پاسخهای غلط در صدر این فهرست قرار دارد. پرپلکسیتی ایآی، با ۴۷٪ پاسخ نادرست، در جایگاه دوم است. این رقم نسبت به سال ۲۰۲۴ که هیچ پاسخ غلطی از آن مشاهده نشده بود، افزایش چشمگیری داشته است.
چتجیپیتی از اوپنایآی و لاما از متا، هر دو با ۴۰٪ پاسخ نادرست، در رتبههای بعدی قرار دارند وکوپایلوت از مایکروسافت و له چت از میستریال با نرخ خطای متوسط ۳۵٪ در هر پاسخ ردههای بعدی را پر کردهاند.
این گزارش نشان میدهد که کلود از آنتروپیک و جمینای از گوگل بهترین عملکرد را در زمینه دقت داشتهاند و به ترتیب با نرخ خطای ۱۰٪ و ۱۷٪، کمترین میزان دروغپردازی را در میان چتباتهای مورد بررسی ارائه کردهاند.
این گزارش در تضاد با ادعاهای اخیر شرکتهای فناوری مبنی بر بهبود دقت و کاهش «جعل اطلاعات» در مدلهای جدیدشان است.