【1分钟速看版】

🤯1.荣耀申请荣耀魔方大模型商标,MagicOS 或将融合端侧 AI 大模型

🌌2.零一万物Yi-34B-Chat微调模型上线,登陆多个权威榜单

🐧3.通义千问登顶OpenCompass开源基模评测榜

✍️4.高德地图车道级导航已支持国内 99% 以上城市和乡镇道路,基于北斗和 AI 模型

🎬5.夸张!EMNLP投稿近5000篇,奖项出炉:北大、腾讯摘最佳长论文

🧑‍🏫6.像调鸡尾酒一样调制多技能大模型,智源等机构发布LM-Cocktail模型治理策略

✨7.微软与美国最大工会组织建立合作关系,挖掘 AI 对工人的正面作用

🤯8.OpenAI 宣布近期修复 GPT-4“变懒”问题,将在离线评估及 A / B 测试后更新模型

⚡️9.马斯克的 AI 聊天机器人 Grok 出现“幻觉”,误认为自己是 OpenAI 的产品

‍🧑‍🏫10.微软必应生成图片默认存储 50 天,后续要延长至 90 天

🔬11.Runway官宣下场通用世界模型!解决视频AI最大难题,竟靠AI模拟世界?

‍🎬12.Meta 公布 PathFinder ,基于树搜索的推理路径生成方法

国内资讯

1. 荣耀申请荣耀魔方大模型商标,MagicOS 或将融合端侧 AI 大模型

据天眼查APP显示,近日,荣耀终端有限公司申请注册“荣耀魔方大模型”商标,国际分类为网站服务,当前商标状态为等待实质审查。

此前,该公司曾申请两枚“MAGIC 大模型”商标。而不久之前,荣耀CEO赵明发文称,荣耀即将推出自研端侧AI大模型和全新云服务。

2. 零一万物Yi-34B-Chat微调模型上线,登陆多个权威榜单

继 11 月初零一万物发布 Yi-34B 基座模型后,Yi-34B-Chat 微调模型在 11 月 24 日开源上线 ,短时间登陆了全球多个英文、中文大模型权威榜单,再度获得了全球开发者的关注。

其中,在斯坦福大学提出的大语言模型评测基准 AlpacaEval 上,Yi-34B-Chat 以 94.08% 的胜率,超越 LLaMA2 Chat 70B、Claude 2、ChatGPT,在 Alpaca 经认证的模型类别中,成为业内仅次于 GPT-4 英语能力的大语言模型,并且是经由 Alpaca 官方认证为数不多的开源模型。

3. 通义千问登顶OpenCompass开源基模评测榜

中国权威的大模型评测平台OpenCompass日前更新了榜单,阿里云通义千问72B模型登上开源基座大模型榜首。

OpenCompass是上海人工智能实验室开源的大模型评测平台,涵盖学科、语言、知识、理解、推理等五大评测维度,可全面评估大模型能力。在最新的OpenCompass开源基座大模型榜单上,通义千问72B模型以67.1的综合得分夺冠。此前,通义千问还曾力压Llama2登顶全球最具权威性的HuggingFace开源大模型排行榜。

4. 高德地图车道级导航已支持国内 99% 以上城市和乡镇道路,基于北斗和 AI 模型

高德地图近日宣布旗下基于北斗卫星导航系统、深度学习模型、惯性导航、泛在信号等前沿技术研发的车道级导航服务,截至目前已支持在国内 99% 以上的城市和乡镇道路使用。这也是截至目前,全球范围内覆盖规模最大的车道级导航服务。

据介绍,该功能搭载高德自研深度学习模型,可以实现全路网融合的 3D 自动化建模,批量化、规模化地实现楼宇道路、自然环境、城市地标等元素在高德地图中的全自动化三维映射。如今随着车道级导航基本完成了全国道路的覆盖,高德应用 AI 自动化建模技术,构建完成全球规模最大数字化地图。

5. 夸张!EMNLP投稿近5000篇,奖项出炉:北大、腾讯摘最佳长论文

EMNLP 是自然语言处理领域的顶级会议之一,EMNLP 2023 于 12 月 6 日 - 10 日在新加坡举行。

因为今年 ChatGPT 的爆火带动大模型、NLP 概念,EMNLP 2023 的投稿论文数量也达到近 5000 篇,甚至略高于 ACL 2023。

EMNLP 2023 颁发了最佳长论文、最佳短论文、最佳主题论文、最佳 Demo 论文和最佳行业论文各一篇,以及多篇不同赛道的杰出论文。

同时,官方公布了 EMNLP 2024 将于 2024 年 11 月 12-16 日、佛罗里达州迈阿密市举办。

6. 像调鸡尾酒一样调制多技能大模型,智源等机构发布LM-Cocktail模型治理策略

随着大模型技术的发展与落地,「模型治理」已经成为了目前受到重点关注的命题。只不过,在实践中,研究者往往感受到多重挑战。

一方面,为了高其在目标任务的性能表现,研究者会收集和构建目标任务数据集并对大语言模型(LLM)进行微调,但这种方式通常会导致除目标任务以外的一般任务的性能明显下降,损害 LLM 原本具备的通用能力。

另一方面,开源社区的模型逐渐增多,大模型开发者也可能在多次训练中累计了越来越多的模型,每个模型都具有各自的优势,如何选择合适的模型执行任务或进一步微调反而成为一个问题。

近日,智源研究院信息检索与知识计算组发布 LM-Cocktail 模型治理策略,旨在为大模型开发者提供一个低成本持续提升模型性能的方式:通过少量样例计算融合权重,借助模型融合技术融合微调模型和原模型的优势,实现「模型资源」的高效利用。

海外资讯

7. 微软与美国最大工会组织建立合作关系,挖掘 AI 对工人的正面作用

据微软官方消息,微软和美国劳工联合会和工业组织大会宣布达成合作伙伴关系,以开展公开对话,讨论人工智能(AI)如何预测工人的需求,并将工人的声音纳入其开发和实施过程中。

据悉,这是劳工组织与科技公司之间首次以人工智能为主题的合作,将实现三个目标: (1) 与工会领袖和工人分享有关人工智能技术趋势的深度信息;(2) 将工人的观点和专业知识纳入人工智能技术的开发;(3) 帮助制定支持一线工人技术技能和需求的公共政策。

微软表示,将会从2024年冬季开始推出学习课程,提供有关 AI 工作原理和发展方向的信息,概述其机遇并分析潜在挑战。劳工领袖和工人可以在线访问这些按需提供的数字资源。此外,从 2024 年到 2026 年,他们还将举办针对特定职业和角色的深度挖掘和体验式研讨会。

8. OpenAI 宣布近期修复 GPT-4“变懒”问题,将在离线评估及 A / B 测试后更新模型

OpenAI 近日表示,将会在近期针对模型“变懒”的问题进行修复,不过需要等到完成线上测试和离线评估之后才可以更新。

OpenAI 表示,他们将在彻底的离线评估和线上 A / B 测试后尽快更新 GPT-4 模型,同时也鼓励用户积极对模型表现进行回馈。

此前曾有用户表示,ChatGPT出现变懒的问题,在用户提问之后,机器人并不会回答完整的问题,而只是给出部分回答,之后再引导用户自己写出剩余的答案。

9. 马斯克的 AI 聊天机器人 Grok 出现“幻觉”,误认为自己是 OpenAI 的产品

近日,埃隆・马斯克旗下 AI 公司 xAI 推出了全新的人工智能聊天机器人 Grok,并面向美国地区的 Premium+ X 用户开放。据官方介绍,Grok 采用了名为 Grok-1 的模型,与目前 OpenAI 旗下 ChatGPT 所使用的 GPT-4 模型完全不同。值得一提的是,Grok 还整合了 X 平台的实时数据,能够根据 X 平台的最新动态提供实时回应,这也是其与其他竞争对手的显著差异之一。

然而,就像所有 AI 聊天机器人一样,Grok 也存在“幻觉”问题,即生成包含虚假或误导信息的回应。这种现象在所有大型语言模型(LLM)中都普遍存在,包括 ChatGPT。

近日,一个 Grok 尴尬的“幻觉”在社交媒体上引起热议。有用户在使用 Grok 时收到回应称:“我无法完成您的请求,因为它违反了 OpenAI 的用例政策。”

10. 微软必应生成图片默认存储 50 天,后续要延长至 90 天

微软广告和网络服务首席执行官 Mikhail Parakhin 近日回答网友提问时,表示 Bing Image Creator 所生成的图片默认保存 50 天时间,后续努力扩展到 90 天时间。不过由于存储成本,尚不支持永久保存。

11. Runway官宣下场通用世界模型!解决视频AI最大难题,竟靠AI模拟世界?

最近AI视频赛道的Pika 1.0大火,两位华人创始人团队半年做出的产品几乎碾压了Runway接近两年的发展成果。

面对Pika的步步紧逼,本以为Runway会发力,想办法至少在公关上扳回一城,结果Runway的应对策略是宣布:

我不和你们卷,我的目标是星辰大海。

Runway官方今天突然官宣,我们要做通用世界模型(General World Model),用Gen AI来模拟整个世界!

12. Meta 公布 PathFinder ,基于树搜索的推理路径生成方法

据 Arxiv 页面显示,Meta 今日发表论文,介绍了一种基于树搜索的推理路径生成方法PathFinder 。

Meta 表示,PathFinder 通过动态解码的集成增强了多样化的分支和多跳推理,并通过不同的采样方法和参数实现。PathFinder 使用约束推理,集成了新颖的质量约束、修剪和探索方法,以提高生成的效率和质量。

PathFinder 还包括评分和排名功能,以改善候选人的选择。实验显示,这种方法在三项复杂算术和常识推理任务上的性能比竞争基准平均高出 6%。

References

[1]https://news.zol.com.cn/846/8463074.html

[2]https://www.51cto.com/article/776188.html

[3]https://opencompass.org.cn/

[4]https://m.163.com/dy/article/ILOJFIGT0534A4SC.html?clickfrom=subscribe&spss=adap_pc

[5]https://www.51cto.com/article/776187.html

[6]https://arxiv.org/abs/2311.13534

[7]https://news.microsoft.com/2023/12/11/afl-cio-and-microsoft-announce-new-tech-labor-partnership-on-ai-and-the-future-of-the-workforce/

[8]https://www.51cto.com/article/776250.html

[9]https://www.ithome.com/0/738/631.htm

[10]https://www.ithome.com/0/738/658.htm

[11]https://www.51cto.com/article/776331.html

[12]https://arxiv.org/pdf/2312.05180.pdf