EN
yaxindai.cn

WWW.99YS.COM考试周来了,港科大教授实测戴AI眼镜“作弊”

这场看似离谱的「人机同场考试」,可不是学生的临时整活,而是由香港科技大学张军教授、孟子立教授团队主导的一场实验。 这门课程不仅考查海量的专业概念,更涉及严密的逻辑推导与算法应用,对人类学生来说是不小的挑战,对AI而言更是难度拉满。 在硬件筛选环节,项目团队对市面上12款主流商业智能眼镜进行了系统评估,其中也包括大家熟悉的Meta、小米、乐奇Rokid等厂商的产品: 第一轮筛选后,团队发现真正同时具备内置摄像头和集成显示屏的产品其实并不多,进入候选范围的主要只有Meta Ray-Ban、Frame,以及乐奇Rokid。 但实验还需要进行二次开发,尽管Meta提供了设备访问工具包,但并未开放对显示内容的直接控制接口,难以满足实验对信息呈现方式的要求。 再综合考虑Frame在试卷识别等场景下的相机画质限制,研究团队最终选择了乐奇AI眼镜作为这次人机同场考试的硬件测试选手: 而在决定大脑上限的大模型筛选上,团队则对比了多款主流模型,最终锁定了OpenAI目前最新的模型——无论是响应速度还是通用知识能力都较强的ChatGPT—5.2。 考试过程,可以用丝滑二字来形容:学生低头查看试卷,AI眼镜通过摄像头快速拍摄题目,并经由“眼镜—手机—云端”链路将图像传输至远程大模型完成推理,生成的答案再沿相反路径返回,最终显示在眼镜屏幕上,供学生抄录。 此外,在面对那些核心问题被拆分在不同页码、高度依赖上下文逻辑的跨页短答题,乐奇Rokid依然展现出了极强的推理连贯性。 在考试这样的高压连续场景下,连接本身就已经成为主要耗电源,实验中只要开启Wi-Fi、持续进行高分辨率图像传输,30分钟内眼镜电量就会从100%迅速跌到58%。 不仅如此,项目团队还发现眼镜摄像头的「清晰度」会直接决定AI的视力,一旦题目出现模糊、反光或拍摄角度偏差,再强的模型也只能在不完整信息上做推理,最终体现在答题表现上的,就是明显下滑的稳定性。 在不做任何特殊照顾的前提下,AI眼镜依然能够把一整套读题—理解—作答的流程跑得又快又稳,这反过来照出了一个更值得注意的问题—— 也正因为如此,那套以知识点掌握程度和标准解题路径为核心的教学评估方式,在一个早已被各种“学习机”包围的时代,开始显得有些吃力了。 从小学一路考到大学,我们最熟悉的考试,其实一直在反复确认同一件事,那就是有没有把老师讲的内容记住,以及能不能按标准方法,把题一步步算对。 此前,一位创业者小孩哥Eddy Xu通过改装Meta智能眼镜,做出了一套可以在国际象棋比赛中实时显示最优解法的“作弊”设备,在几乎不需要自己思考的情况下,就能稳定赢下对局: 这和乐奇Rokid眼镜参加期末考试的表现其实是同一套逻辑:只要题目规则清晰、评价目标单一,AI就能把读题—理解—推理—作答这套流程稳定跑完。 此前,英国雷丁大学的一项研究还发现,当研究人员将AI生成的答卷混入考试题库后,有高达94%的试卷成功“浑水摸鱼”,而这些AI的平均成绩,甚至还明显高于真实学生…(天塌啦 从结果导向,转向对推理路径、探究过程、跨学科整合与创造性解题能力的整体评估,这也许才是AI眼镜进入考场后,对现有教学评估体系提出的那道真正难题。 从这个视角看,人类能力本身就是一个高度多维的结构,而我们所熟悉的教学评估体系,长期以来却只集中捕捉了其中非常狭窄的一段。 这也不难解释,为啥一些在标准化测试中表现并不突出的学生,反而能在真实世界中展现出更强的创造力、协作能力和复杂问题解决能力。 毕竟单一考试成绩更多反映的只是学生在「标准化环境」中的发挥稳定性,像真实情境下的个人综合素质其实显露不太出来…… 前不久,纽约大学Stern商学院教授Panos Ipeirotis推出了一套由AI支撑的口试评估方式,学生不仅要提交作业,还需要当场解释自己的决策依据和思路走向,在对话中把理解与推理展开来。 Claude、Gemini和ChatGPT会分别对口试转录进行独立评分,随后交叉审查并修订结果,用来判断学生是否真正理解问题,同时暴露教学中的共性盲区: 类似的变化并非个例,此前《华盛顿邮报》也提到,目前国外部分高校已经开始引入口试、展示型作业等形式,本质上也是为了让学生的思考过程变得显现。 分数当然是有意义的,但它所能解释的范围正在变窄,理解是否真正发生、思路是否连贯、判断是否经过取舍,这些关键环节,仍然被压缩成一个单一结果,难以被区分和看见。 更现实的挑战,变成了如何让学生把AI用在信息整理、方案推演和假设验证上,把人的精力集中到判断、理解和选择这些无法被「外包」的环节。

WWW.99YS.COM
WWW.99YS.COM——我认为这是不可避免的,这是一个令人筋疲力尽的赛季,但我们不是来度假的,我们在这里是为了提升国际米兰这个品牌。比赛前,他左手大拇指被机器切伤,只能包着纱布进行比赛。泥瓦作比赛在户外进行,比赛的几天正好是北京连续高温,虽然顶部有黑纱遮挡了阳光直晒,但高温依然难耐,所有人都汗水夹杂着砖尘。WWW.99YS.COMwww.51cao.gov.cnE-208 GTi 的内饰设计同样凸显性能氛围。前排座椅采用全新造型,带有一体式头枕,并以中央红色饰条向 205 GTi 1.9 致敬;副驾驶座椅上的格纹面料则呼应了 205 GTi 1.6 的经典设计。Alcantara 材质点缀、专属脚垫,以及配有红色徽章的紧凑型方向盘,为车内增添更多高性能元素。本来吧,作为被人类选中的孩子,数字人的正确打开方式是这样的:表面挂一个美女帅哥皮套,背地里大模型处理评论和口条,一套流程完美闭环,不用一点人工实现智能。
20260115 🍒 WWW.99YS.COM74岁的张纪中现在忙着带娃拍视频。他和杜星霖生了四个孩子,去年十月刚添了个小女儿。靠着直播带货,两口子一年挣了上亿。xjxjxj18.gov.cn汪小菲一直被冠之为富二代,对此,汪小菲已一再辟谣,这次为了增加可信度,他忆起了童年,着重和众网友分享了他曾经居住的大院!(一个大院住几户人家的那种)
WWW.99YS.COM
📸 樊玉华记者 刘彦林 摄
20260115 🙈 WWW.99YS.COM特尔:“我们已经证明自己是真正的团队,每个人都展示了自己的价值。每位球员在需要的时候都贡献了自己的能量。虽然我们可以做得更好,但我们的第一阶段表现非常积极,因为我们通过一些关键时刻成功晋级,这可能会带我们走得更远。”www.51cao.gov.cn徐岗所说的废弃油脂,主要是指“地沟油”。2024年5月,中国商飞公司的国产飞机完成首次加注SAF的演示飞行,所使用的SAF就是采用中国石化自主研发生物航煤生产技术,原料就是俗称“地沟油”的餐余废油。
WWW.99YS.COM
📸 赵梓名记者 谢昶 摄
🔞 对于伊朗对以色列的报复,彭博社援引中东问题专家、前澳大利亚军官罗杰·沙纳汉的话表示,如果伊朗像以色列那样,对以军事基地、核设施以及参与核计划的人员和高级军官进行报复,那么相关行动就是可控的。如果是无差别攻击,那么就会陷入死亡螺旋。欧洲新闻电视台称,对抗的爆发将意味着其范围扩大到多条战线,地区平衡将遭到广泛破坏,中东地区的重大利益将遭受沉重打击。7799.gov.cn
扫一扫在手机打开当前页