transluce

answer Answers

ProphetesAI is thinking...

MindMap

Loading...

Sources

1
transluce
† transˈluce, v. Obs. rare. [ad. L. translūc-ēre to shine through, f. trans- + lūcēre to shine: cf. traluce v.] trans. To shine through.1609 J. Davies Holy Roode (Grosart) 26/1 Let Ioy transluce thy Beauties blandishment. Oxford English Dictionary
prophetes.ai 0.0 3.0 0.0
2
traluce
† traˈluce, v. Obs. [ad. L. trālūc-ēre to shine across or through. Cf. It. tralucere (Florio).] trans. To shine through; = transluce.1591 Sylvester Du Bartas i. ii. 380 The turning Planets influence doth passe..through the glistring Tent Of the tralucing Fiery Element. Oxford English Dictionary
prophetes.ai 0.0 1.5 0.0
3
translucent
translucent, a. (trɑːnsˈl(j)uːsənt, træns-, -nz-) [f. L. translūcēnt-em, pres. pple. of translūcēre to shine through: see transluce, and cf. tralucent.] † 1. That shines through; emitting penetrating rays. b. In quot. a 1652, thoroughly illuminated or luminous. Obs. rare.1596 C. Fitzgeffrey Sir F. D... Oxford English Dictionary
prophetes.ai 0.0 0.90000004 0.0
4
o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因
Transluce认为其中一些因素是大多数模型 (LM) 所共有的,还有一些是O系列模型特有的新因素。并假设这些新因素放大了通常可以通过标准Post-training缓解(但无法完全消除)的问题。 Transluce建议,测试能够访问和无法访问先前思维链的两种模型,可以为减少未来模型迭代中的这些捏造倾向提供宝贵的见解。 量子位
m.163.com 0.0 0.6 0.0
5
OpenAI最强AI模型竟成“大忽悠”,o3/o4-mini被曝聪明过头、结果幻觉频发?
Transluce 的研究人员 Neil Chowdhury 推测,这或许要从 o 系列模型的“设计哲学”说起。 “我们的假设是,用于 o 系列模型的强化学习方式,可能会放大一些通常可以通过标准的训练后流程缓解(但无法完全消除)的问题。” 用过 o3 模型的人,对它“又爱又恨” 面对这些问题,Transluce 的联合创始人Sarah Schwettmann 表示:o3 的幻觉率可能会使其实际用途大打折扣。 诚然,这几天使用过 o3 模型的用户,不少都对它“又爱又恨”的。 36kr.com
36kr.com 0.0 0.6 0.0
6
OpenAI 新推理模型被曝产生更多幻觉,性能提升却伴随更多错误
第三方机构 Transluce 的测试也印证了这一问题。这家非营利 AI 研究实验室发现,o3 在回答问题时经常会凭空捏造出某些“过程操作”。 例如,Transluce 曾观察到,o3 声称自己在一台 2021 款 MacBook Pro 上“在 ChatGPT 之外”运行了代码,并将结果复制进了答案中。实际上,虽然 o3 拥有一部分工具访问权限,但并不具备执行这种操作的能力。 IT之家
m.163.com 0.0 0.3 0.0
7
OpenAI爆出硬伤,强化学习是祸首,o3越强越「疯」,幻觉率狂飙
提前拿到o3内测资格后,非营利AI研究机构Transluce的测试,进一步印证了这一问题。 他们发现,o3在回答问题时,更倾向于「虚构」其推理过程中的某些行为。 比如,o3声称它在一台2021年款的MacBook Pro上运行代码,甚至声称是在ChatGPT之外复制的代码。 36kr.com
36kr.com 0.0 0.3 0.0
8
o3全网震撼实测:AGI真来了?最强氛围编程秒杀人类,却被曝捏造事实
Transluce研究实验室测试了o3的预发布版本,也发现了它的重大缺陷——经常捏造事实! 它不仅经常捏造从未采取过的行动,甚至还在被质疑时会精心辩解。 它经常捏造从未采取过的行动,然后在被质疑时精心为这些行动辩解。 而且Transluce发现,这种行为并不局限于o3。总体来说,o系列模型的幻觉频率要高于GPT系列模型。 Transluce的研究者猜测,或许是基于结果的RL最大化产生正确答案的机会,会激励模型去盲目猜测。 36kr.com
36kr.com 0.0 0.3 0.0
9
o3全网震撼实测:AGI真来了?最强氛围编程秒杀人类,却被曝捏造事实
Transluce研究实验室测试了o3的预发布版本,也发现了它的重大缺陷——经常捏造事实! 它不仅经常捏造从未采取过的行动,甚至还在被质疑时会精心辩解。 而且Transluce发现,这种行为并不局限于o3。总体来说,o系列模型的幻觉频率要高于GPT系列模型。 Transluce的研究者猜测,或许是基于结果的RL最大化产生正确答案的机会,会激励模型去盲目猜测。 新智元
m.163.com 0.0 0.3 0.0