News

GPT-5上线引发全网吐槽。8月14日,ChatGPT负责人Nick ...
I think you are mistaken in claiming that (p+q)!‖u⊗̃v‖² = p!q!‖u‖²‖v‖².
在号称人类最后的考试榜单HLE(Humanity's Last Exam)中,通义DeepResearch更是拿下了32.9%的最高分,超越DeepSeek-V3.1(29.8%)和OpenAI DeepResearch(26.6%),霸榜全球第一!
并且老黄使用的AI工具也多种多样,聊天机器人当中ChatGPT、Grok、Gemini他都用,此外还有AI搜索工具Perplexity,而且还会根据具体使用场景来选择用哪个。
苹果公司近日发布两项系统更新,用于修复ImageIO框架中一个可能已被用于定向攻击的零日漏洞(zero-day vulnerability)。编号为CVE-2025-43300的漏洞在iOS 16.7.12和iPadOS 16.7.12版本中得到修复 ...
Groq的芯片不是通常用于驱动AI系统的GPU(图形处理单元),他们自创了全球首个LPU(语言处理单元)方案,并将其硬件称为“推理引擎”——这是一种专为快速高效运行AI模型而优化的特殊计算机。
许多AI用户已对生成结果保持适度的怀疑,但一些专家指出,过度的怀疑正演变成一种趋势:用户不断反复调整输出,几乎陷入无休止的“打磨”中。 这种新出现的现象被称为“doomscrolling (过度提示)”,与“doomscrolling ...
9 月 17 日消息,一项分析显示,生成式人工智能(AI)工具及其驱动的深度研究智能体与搜索引擎,常常会给出未经证实且带有偏见的回答,而这些回答与其引用的信息来源并不相符。该分析发现,AI ...
Windows平台知名开源截图工具Greenshot近日曝出高危安全漏洞。该漏洞(CVE待分配)允许本地攻击者在Greenshot进程内执行任意代码,可能绕过安全防护措施实施进一步攻击。目前概念验证(PoC)利用代码已公开,证实该漏洞影响2025年8 ...
Daniel Lovera (@dlovera) 则提出了更进一步的质疑,认为短上下文请求在长上下文服务器上表现变差,说明 Anthropic 实际上是在根据需求间接降低模型质量。
实验表明,Parallel-R1 不仅在多个数学基准上带来高达 8.4% 的平均准确率提升,更通过一种 “中程训练脚手架” 的策略,在 AIME25 测试中实现了 42.9% 的性能飞跃。
在知识和推理都被“锁死”的情况下,模型规模越大的,长时程执行能力就越强,坚持的时间就越长。研究者猜测,可能是大模型内部的神经回路更复杂,有更多的“冗余备份”,不容易因为一个小地方出错就全盘崩溃。