奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

OpenAI神秘新模型,真的藏不住了!

先是有匿名聊天机器人现身lmsys竞技场,声称自己是GPT-4系列模型一部分,吊足了大家的胃口。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

随后奥特曼又发了一个浮想联翩的推文,正是他花园里的草莓照片,并配文:i love summer in the garden。

上个月OpenAI正好被曝正在开发新一代基础模型草莓,前身据说是之前神秘兮兮的Q*。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

不知是有意还是无意,但感觉就是有意,网友们就当奥特曼变相承认了。(Doge)

这就是对草莓计划的引用!发布时间就是在夏天。(美国的秋天从9月22日开始)

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

就在刚刚,ChatGPT官方推文开始走起了

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

的队形,更显得有理有据了。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

新模型现身竞技场,网友第一波实测

最早在昨天下午,有网友发现lmsys竞技场上多了个匿名新模型anonymous-chatbot。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

之前很多包括OpenAI在内很多科技公司都会发布前会进行一波测试。再加上它自称是GPT-4模型系列一部分。

所以不少人怀疑OpenAI新模型要来了,也许就是草莓计划或者Q*。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

网友进行了第一波实测。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

像「9.11和9.9哪个大」这个难题也没有挑战成功。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

而让它倒着写单词,同样也没回答出来。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

诶不过,说草莓这个单词有多少个r倒是答对了。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

还有河流难题,也直接轻松解决,而不像之前其他大模型回答得过于复杂。

如果一个人和一只狗要过河,但有个船只能承载一个人和一只动物,请问怎么过去?

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

最早在今年5月,OpenAI就被爆出正在开发草莓项目。

据今年7月路透社消息称,多个内部人士透露,这个项目会让公司的AI系统不仅能生成查询的答案,而且能够提前规划,自主可靠地浏览互联网,从而执行OpenAI 所称的深度研究(deep research)。

比如通过CUA(一种计算机代理)的帮助来自动浏览网页,该代理可以根据发现内容采取行动。

这也是迄今一众AI模型尚未解决的问题和难点。

草莓计划前身是Q*

在众多猜测中,草莓项目的前身极有可能是Q*。

去年11月,Q*首次被曝出,被认为过于强大,可能是通往AGI或超级智能的关键一步。

它被指具有这些特性,比如在数学和推理能力方面有很大的提升,突破了人类数据的限制,可以自己生产巨量训练数据,有自主学习和自我改进的能力等等。

在草莓项目正式被曝光的前几天,OpenAI科学家Noam Brown发了一条推特,感慨OpenAI总是会坚定地在重大研究方向上持续押注。

而这位科学家去年才跳槽到OpenAI,主要负责研究模型推理能力,之前一直被认为在研究Q*。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

最新曝光显示,草莓使用的推理方法和2022年斯坦福发表的一种方法相似。

当时他们提出了一个自学推理(Self-Taught Reasoner,简称STaR)的方法。今年,斯坦福团队又基于STaR,提出了一种名为Quiet-STaR的推理方式,也就是Q*了

知情人士表示,OpenAI希望通过该项目大幅提升AI模型的推理能力,草莓已经在非常大的数据集上完成预训练,并使用了一种专门的处理方法,比如post-training等。

另外,内部之前也有过一次神秘模型的测试,当时数学测试成绩超过90%,不过也没法确认是否是Q*。

对此,OpenAI并没有直接回应。声明中表示:

We want our AI models to see and understand the world more like we do. Continuous research into new AI capabilities is a common practice in the industry, with a shared belief that these systems will improve in reasoning over time.

(我们希望我们的AI模型能像我们一样看待和理解世界。对新的人工智能能力的持续研究是该行业的常见做法,人们普遍认为这些系统随着时间的推移在推理方面会有所改进。)

不过确实要说的是,距离OpenAI发布上一个重要基础模型,也就是GPT-4,已经过去了近17个月的时间。差不多一年半了,也该来新一代模型了。

结果奥特曼现在又发一些云里雾里的推文。网友大开脑洞:

如图所示这张图有五个草莓,但第五个还没有熟。而草莓成熟的时间在4-6周内,说明GPT-5也将在那时候发布。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

好好好,我信了。

参考链接:[1]https://x.com/apples_jimmy/status/1821047312673890694[2]https://x.com/flowersslop/status/1821054928275533900[3]https://x.com/sama/status/1821207141635780938

以上就是关于【奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了】的相关消息了,希望对大家有所帮助!

主题测试文章,只做测试使用。发布者:联合网,转转请注明出处:https://www.anesthesia.org.cn/2024/08/08/8947.html

(0)
联合网的头像联合网
上一篇 2024年8月8日 下午3:15
下一篇 2024年8月8日 下午3:16

相关推荐

  • IGN日本为《黑神话》打出7分:战斗方面没有亮点、操作感也不好

    8月23日消息,昨晚,IGN日本公布对《黑神话:悟空》的评测,评测者为其打出7分,认为作为一款动作RPG,它有很多无法掩盖的缺陷,但也有让人无法轻易抛弃的魅力。 《黑神话:悟空》战斗方面没有亮点系统,战斗手法缺乏变化,而且操作感也不太好。 不过,创造破绽而不是利用破绽和抓住机会竭尽全力的战斗理念是好的,也多亏了量和质并存的BOSS敌人们,能够勉强弥补系统方面…

    2024年8月23日
    1300
  • 官方通报杭州一外卖员路边猝死:死者55岁,排除刑案可能

    针对近日网民关注的本辖区雅乐国际花园附近非机动车道上一男子晕倒经抢救无效宣布死亡事件,经查,死者袁某某(男,55岁),系外卖配送员,公安部门已排除刑事案件可能。经街道、有关部门协调,相关外卖平台、保险公司与家属协商,目前事件相关方已达成一致,善后工作正在有序开展中。 对袁某某的不幸离世,我们表示深深痛心和惋惜,也对家属表示深切的慰问。广大网友和媒体朋友对外卖…

    2024年9月9日
    1900
  • 8月14日见!真我官宣:320W超光速秒充来了!

    8月12日消息,就在刚刚,真我realme官宣,将在8月14日带来超光速秒充,不是传闻的300W,而是320W。 按照消息人士的说法,上述方案中真我采用了高效的能量管理策略和优化的电池结构设计,确保了充电过程中的安全性和稳定性。 上周,网络上流出了真我300W快充技术测试的视频,视频中的测试机15秒充电6%,30秒充电充15%,尽管电池容量和完整充电时间尚未…

    2024年8月12日
    2900
  • 突然被传从小米离职!MIUI负责人搞定一切:公开亮相辟谣

    8月8日消息,作为小米集团手机部副总裁、MIUI(澎湃OS)负责人,其一举一动也是备受网友的关注。 上周,有网友发现,金凡微博上发布的历史内容突然被清空,没有任何解释,个人主页显示为暂无内容。 随后各种猜测频出,有的认为是金凡从小米离职,还有的表示小米要对澎湃OS的管理层动刀,金凡的职位要变动等等。 现在,金凡公开露面亲自辟谣了上述传闻,其在2024快应用开…

    2024年8月8日
    2700
  • 被爆欠薪的猪八戒网发声明:经营正常,个别业务调整,创始人高报酬不实

    大家好,今天小编来为大家解答【被爆欠薪的猪八戒网发声明:经营正常,个别业务调整,创始人高报酬不实】这个问题,很多人还不知道,现在让我们一起来看看吧! 陷入欠薪舆论漩涡的猪八戒网于9月10日深夜发布辟谣声明。   猪八戒网表示,关于网上流传猪八戒网经营情况不实报道的说明——公司整体运营正常,个别业务经营单元和组织正在做业务优化和调整,公司对企业服务平台赛道的未…

    2024年9月12日
    900

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信