查看原文
其他

开源日报 | Qwen在GitHub显示404;KK预测AI三大趋势;IBM败走中国;OpenBMC成服务器固件发展“事实标准”

欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。
每日一更,风雨无阻。

OpenSource Daily # 2024.9.5

省流概览

-  阿里通义千问全系列大模型被 GitHub 下架,所有仓库页面「404」

-  零一万物开源 Yi-Coder 系列编程助手模型

-  微软在 Windows 11 集成中国开源大模型架构 RWKV

-  IBM败走中国

-  智谱AI,又融资了

-  凯文·凯利(KK)预测人工智能三大趋势

-  OpenBMC成服务器固件发展的“事实标准”

-  “稚晖君” 停更这一年:想赢下人形机器人,要像运营大公司那样去创业

-  壁仞科技实现中国首个三种异构芯片混训技术

今日要闻

阿里通义千问全系列大模型被 GitHub 下架,所有仓库页面「404」

9 月 5 日早上,有开发者在社交平台上称在 GitHub 上打开阿里云 Qwen 页面后显示 404。

阿里高级算法专家林俊旸在社交媒体上表示:“GitHub 因未知原因标记了我们的组织,我们正在尝试与他们联系以寻求解决方案。”

直到当天下午,阿里通义千问全系列大模型的开源代码仓库恢复正常访问。


零一万物开源 Yi-Coder 系列编程助手模型

零一万物正式开源了 Yi-Coder 系列编程模型。Yi-Coder 系列模型专为编码任务而生,提供 1.5B 和 9B 两种参数。其中,Yi-Coder-9B 的表现号称 “优于其他 10B 参数以下的模型”,如 CodeQwen1.5 7B 和 CodeGeex4 9B,甚至能够 “与 DeepSeek-Coder 33B 相媲美”。

Yi-Coder 能够处理最长 128K tokens 的上下文内容,适用于复杂项目级代码的理解和生成。Yi-Coder 还支持 52 种主要编程语言。

微软在 Windows 11 集成中国开源大模型架构 RWKV、装机量近 5 亿

2024 年 9 月 ,RWKV 社区成员发现:Office 系统在自动更新后(版本 2407 及以后)已自带 RWKV 运行库。

在 Windows 系统的  C:\Program Files\Microsoft Office\root\vfs\ProgramFilesCommonX64\Microsoft Shared\OFFICE16 目录,可以找到一系列 rwkv dll(动态链接库) 文件。

由于正版 Windows 大多预装了 Office 365,因此,全球大多数 Windows 10 和 11 机器现已搭载 RWKV,包括线下商店中售卖的 Windows 机器。这意味着 RWKV 的装机量可达几亿台。
RWKV 是真正的开源架构(目前在 Linux Foundation 旗下),遵循 Apache 2.0 协议,可用于商业,欢迎大家在各个项目使用。
RWKV 的最新架构为 RWKV-6,且 RWKV-7 即将公布。


著名未来学家凯文・凯利(KK)预测人工智能三大趋势

2024 Inclusion・外滩大会今天在上海黄浦世博园区开幕。

著名未来学家、《连线》杂志创始主编、《5000 天后的世界》作者凯文・凯利(Kevin Kelly,“KK”)在开幕主论坛上的演讲中指出,当人工智能深刻影响经济和文化,必将涌现三大趋势:全球主义、创新加速和 AI 驱动生成。


今日观察

社交观察


大鱼吃小鱼!AI 芯片初创公司,前景不妙

从谷歌的 TPU、苹果的 M1 和 M2、微软 Maia 100 和 Cobalt 100、Meta 的 MTIA、亚马逊的 Trainium 和 Inferentia、特斯拉的 Dojo,到英特尔的 FPGA 系列、AMD 的 MI300 系列…… 巨头们一次次冲击着英伟达的帝国围墙。
而在 AI 竞速的大时代里,涌现了一大批初创 GPU、AI 芯片公司,这些从业者和科技厂商们无不在找寻突破口。全球初创企业如今正试图证明它们可以在某些应用领域提供比行业巨头英伟达更好的芯片解决方案。虽然英伟达的 GPU 继续主导人工智能(AI)领域,但 AI 初创企业认为,GPU 的高能耗和庞大的设计留下了市场空隙,供新兴企业填补,希望分享 AI 技术繁荣带来的利益。
- 半导体产业纵横

RWKV.cpp 是底层 C++ 实现通过传统 C 接口暴露带 Python 调用入口的 loader

所以 RWKV 是基于 RNN 但达到 Transformer 性能的模型架构,而这个 RWKV.cpp 是底层 C++ 实现通过传统 C 接口暴露带 Python 调用入口的 loader。特点就是可以在 CPU 上通过 SSE 啊 NEON 啊这些指令集跑得飞快,当然也兼容 GPU,所以低耗高效。好的好的,C++ 项目我喜欢,不管三七二十一先 fork 一个先

- 微博 wingc

第一个 100% 开源的 MoE 大模型,7B 的参数,1B 的推理成本

训练代码、中间 checkpoint、训练日志和训练数据都已经开源。

尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。

对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使用稀疏激活混合专家 (MoE)。MoE 在每一层都有几个专家,每次只激活其中的一个子集(参见图 2)。这使得 MoE 比具有相似参数量的密集模型更有效,因为密集模型为每个输入激活所有参数。

- 微博 机器之心

LakeSoul 提供了原生的 Python 接口

LakeSoul 提供了原生的 Python 接口,可以很方便地将数据湖的数据跟模型训练进行挂钩;LakeSoul 也支持向量检索,对外会提供一个融合检索服务层,支持向量检索、sql 检索、文件检索于一体的多模态融合检索,能极致赋能大模型在行业应用的落地。

- 微博 朱亚东-数元灵

媒体观察
IBM 败走中国

在过去二十年间,IBM 犯了一系列战略错误,包括在云计算领域的布局起步较晚,错过利用开源生态系统构建其产品和服务的机遇;传统业务市场被云计算和现代化服务替代者抢占;备受期待的人工智能平台 Watson 商业化应用不达预期。

2012 年开始,IBM 全年营收开始逐年下降,2013 年营收跌破千亿。到 2023 年,IBM 营收仅有 618 亿美元。

业绩下滑原因系传统硬件业务销售下滑,云计算和软件业务逐渐成为 IBM 的核心收入来源,新兴业务虽然增长迅速,但未能完全弥补传统业务下滑的影响。

而在中国,IBM 要面临更为复杂的境况。

美国对中国的技术出口限制、对中国企业的制裁,导致外企在中美之间的研发合作、技术转移和跨境数据流动变得比以往更加困难。在移动互联网兴起的十年前,人们认为世界会越来越 “平”,随着信息高速流通,国家之间的鸿沟将被逐渐弥合。但十年后的今天,全球化开始退潮,“地球村” 的畅想已成明日黄花。

- 界面新闻

智谱 AI,又融资了

今日,伴随中关村科学城公司通过公众号宣布以投前 200 亿元估值,领投智谱新一轮融资,方才尘埃落定。

对于投后估值以及更多融资信息,智谱官方未给予置评。而这也是智谱,连续两年,年内被曝完成 3 轮融资。去年至今,该公司已完成 6 轮融资。

值得一提的是,智谱先后获得阿里、腾讯、美团、小米等诸多互联网大厂押注,以及红杉、高瓴、君联、顺为等知名机构的投资,在 AI 大模型公司中,可谓一枝独秀。

成立至今,智谱一直是市场上炙手可热的存在。早在 2019 年 8 月,成立仅 2 个月,华控基金、中科创星等就已火速入股。2021-2021 年,该公司则先后在 9 月份获得 A、B 轮融资。

- 猎云网

阿里云、字节、浪潮信息、英特尔、电标院:OpenBMC 成服务器固件发展的 “事实标准”

传统 BMC 虽然可以实现部分管理,但是在快速迭代的当今尤其是在 AI 技术的驱动下,存在开发周期长、交付困难、应用单一等难题,并且由于其代码闭源也会导致隐藏的安全漏洞无法及时识别,限制了用户定制开发。OpenBMC 凭借领先的开源理念、可扩展的软件架构,被大型互联网厂商广泛应用,并带动了产业连上下游共同探索,逐步成为服务器固件发展的 "事实标准"。

在日前召开的 2024 开放计算中国峰会上,来自阿里云、字节跳动、浪潮信息、英特尔以及电子标准院的专家,从自身探索和实践的角度,现身说法各家在 OpenBMC 方面的最新进展及未来规划。

-  美通社

通信效率超 98%!壁仞科技实现中国首个三种异构芯片混训技术

为了解决用户需求和技术挑战,壁仞科技团队攻坚异构 GPU 训练难点,自主研发出原创异构 GPU 协同训练方案 HGCT,通过异构调度、异构通信、异构拆分三层架构,实现了一套统一方案支持多种不同型号、不同厂商的 GPU,业界首次支持 3 种及以上异构 GPU 混合训练同一个大模型。

壁仞科技表示,这一异构 GPU 协同训练方案对于行业端有两个意义:1、该方案最终价值实现了国产 GPU 和英伟达 GPU 的异构共存,突破异构算力孤岛难题,加快国产 GPU 的落地迁移,助力国产大模型落地;2、该方案赋能整个算力产业发展,壁仞 HGCT 方案具备普适性、易用性、兼容性,助力最终客户实现多种异构算力聚合,最大化异构 GPU 集群利用效率。

-  钛媒体

“稚晖君” 停更这一年:想赢下人形机器人,要像运营大公司那样去创业

“在学校里学习更多是自底向上,先打好基础然后做上层应用,出了校园之后更多是自顶向下,以项目导向,缺啥学啥。” 彭志辉说。聊到时间管理方法,他说是 “操作系统中的抢占式调度”,动态调整任务优先级,允许打断,但是任何时间都专注于当前的任务。

他不喜欢 “天才少年” 的称呼,他觉得教科书中那些能改变人类发展进程的科学家才是天才。

相比过去用几个月就能独自完成的小型项目,参与创办一家公司开发成功的产品要难得多。他要从单兵作战走向带团队协作,做出来的东西不能只是酷,还要能赚钱。这是一场新的、更复杂的学习。

- 晚点LatePost



开源之声

用户观点

Vue 3.5 “天元突破红莲螺岩” 正式发布

  • 观点 1:还在用 vue2.x, 也挺好

  • 观点 2:上月入职一公司。我之前学了 vue3,但公司项目是 vue2,写的我真难受,很不习惯

阿里通义千问 (QwenLM) 全系列大模型被 GitHub 下架,访问 repo 显示「404」

  • 观点 1:已经快 5 年不用 github 了,中心化的东西一蹦全瘫痪了

  • 观点 2:应该是美国当局怀疑大模型背后有暗门,当心他们本国用户下载使用后被标记定位或外传数据,他们自己的大模型可是严格管控的。

  • 观点 3:吓得我立刻备份 github 所有私有库


程序员梗图

END


References

https://www.oschina.net/news/310448/qwenlm-github-repo-404

https://www.oschina.net/news/310410/01-ai-yi-coder

https://www.oschina.net/news/310440

https://www.oschina.net/news/310590

https://xueqiu.com/3261990793/303707299

https://weibo.com/ttarticle/p/show?id=2309405075207596671014

https://weibo.com/1658606840/Ovw3582XP

https://weibo.com/7825731473/OvtOXuNy0

https://k.sina.com.cn/article_6192937794_17120bb4202002b75s.html

https://ishare.ifeng.com/c/s/8cd4fMakARr

https://www.prnasia.com/story/459676-1.shtml

https://mp.weixin.qq.com/s/19LhsTqTbrK4mlnnBB6JHA

https://cj.sina.com.cn/articles/view/2853016445/aa0d937d02000ztnm

https://my.oschina.net/u/5783135/blog/15671421

https://mp.weixin.qq.com/s/tL1KN4cMEUcGcMzwDy1KcA

https://mp.weixin.qq.com/s/98boIfNzaXHKZpvBC8Wt_g


最后,欢迎扫码下载「开源中国 APP」
阅读海量技术报告、程序员极客分享

继续滑动看下一个
OSC开源社区
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存