site:www.51cto.com - Search News

News

GPT-5上线引发全网吐槽。8月14日，ChatGPT负责人Nick ...

I think you are mistaken in claiming that (p+q)!‖u⊗̃v‖² = p!q!‖u‖²‖v‖².

在号称人类最后的考试榜单HLE（Humanity's Last Exam）中，通义DeepResearch更是拿下了32.9%的最高分，超越DeepSeek-V3.1（29.8%）和OpenAI DeepResearch（26.6%），霸榜全球第一！

并且老黄使用的AI工具也多种多样，聊天机器人当中ChatGPT、Grok、Gemini他都用，此外还有AI搜索工具Perplexity，而且还会根据具体使用场景来选择用哪个。

苹果公司近日发布两项系统更新，用于修复ImageIO框架中一个可能已被用于定向攻击的零日漏洞（zero-day vulnerability）。编号为CVE-2025-43300的漏洞在iOS 16.7.12和iPadOS 16.7.12版本中得到修复 ...

Groq的芯片不是通常用于驱动AI系统的GPU（图形处理单元），他们自创了全球首个LPU（语言处理单元）方案，并将其硬件称为“推理引擎”——这是一种专为快速高效运行AI模型而优化的特殊计算机。

许多AI用户已对生成结果保持适度的怀疑，但一些专家指出，过度的怀疑正演变成一种趋势：用户不断反复调整输出，几乎陷入无休止的“打磨”中。这种新出现的现象被称为“doomscrolling (过度提示)”，与“doomscrolling ...

9 月 17 日消息，一项分析显示，生成式人工智能（AI）工具及其驱动的深度研究智能体与搜索引擎，常常会给出未经证实且带有偏见的回答，而这些回答与其引用的信息来源并不相符。该分析发现，AI ...

Windows平台知名开源截图工具Greenshot近日曝出高危安全漏洞。该漏洞（CVE待分配）允许本地攻击者在Greenshot进程内执行任意代码，可能绕过安全防护措施实施进一步攻击。目前概念验证（PoC）利用代码已公开，证实该漏洞影响2025年8 ...

Daniel Lovera (@dlovera) 则提出了更进一步的质疑，认为短上下文请求在长上下文服务器上表现变差，说明 Anthropic 实际上是在根据需求间接降低模型质量。

实验表明，Parallel-R1 不仅在多个数学基准上带来高达 8.4% 的平均准确率提升，更通过一种 “中程训练脚手架” 的策略，在 AIME25 测试中实现了 42.9% 的性能飞跃。

在知识和推理都被“锁死”的情况下，模型规模越大的，长时程执行能力就越强，坚持的时间就越长。研究者猜测，可能是大模型内部的神经回路更复杂，有更多的“冗余备份”，不容易因为一个小地方出错就全盘崩溃。

Some results have been hidden because they may be inaccessible to you