لولو لمون همبعضی لگینگاش خیلی بده و همینجور see through ه
لولو لمون همبعضی لگینگاش خیلی بده و همینجور see through ه
Introducing 🐻 BEARCUBS 🐻, a “small but mighty” dataset of 111 QA pairs designed to assess computer-using web agents in multimodal interactions on the live web!
✅ Humans achieve 85% accuracy
❌ OpenAI Operator: 24%
❌ Anthropic Computer Use: 14%
❌ Convergence AI Proxy: 13%
چقدر توییتر حال به هم زنه اصلا دو دقیقه نمیشه تحملش کرد یکم رفتم ببینم چه خبره چی میشه که دیدم همش پروپاگاندای ماسک 🤢
Looking for an emergency reviewer for a CHI Late Breaking Work submission (8 pages) on Black people's experience with LLMs. Please DM if you have capacity to review! Deadline is on the 14th.