目的

本系列文章主要是用于持续跟踪最新的AI产业情况，让你减少知识焦虑。

看点

原文共计157936 字,简读后为8291字,阅读时间为21分钟,为您提高阅读效率为1881%

荣耀Magic 6 Pro全球发布，AI赋能眼球追踪功能即将上线👀
MusicMagus：利用扩散模型实现零样本文本转音乐编辑🎶
用扩散模型生成网络参数，荣获LeCun认可的尤洋团队新研究💡
国内高校创建类Sora模型VDT，通用视频扩散Transformer荣获ICLR 2024认可👍
谷歌自研应用陆续整合Gemini：笔记应用Keep测试“AI创建清单”功能📝
Sora：OpenAI推出AI，即刻生成夺人眼球的视频👀
国内免费AI绘画神器：字节跳动的Dreamina🎨
扣子（coze.cn）初体验：智能小说创作引擎，让写作这件事变得简单有趣📖
DeepMind首席执行官专访：AI尚未达到拼算力的地步，谷歌的优势在于研发，智能体是下一个爆点💡
谷歌AI视频再创巅峰！全能通用视觉编码器VideoPrism横空出世，性能刷新30项SOTA💯

补齐Transformer规划短板，田渊栋团队的Searchformer火爆登场🔥

要点解析:

Meta FAIR 田渊栋团队提出 Searchformer，它能计算出最优规划并且所用搜索步骤数也能远少于 A∗ 搜索等符号规划算法。
Searchformer 的优势在于，它结合了 Transformer 模型的强大泛化能力和传统符号式规划和搜索技术的优点。
相比于 A∗ 搜索，Searchformer 能够在推箱子任务中解答 93.7% 的测试任务，同时搜索步数平均少 26.8%。

https://www.jiqizhixin.com/articles/2024-02-25-4

荣耀首款AI笔记本电脑 MagicBook Pro 16亮相，Win阵营首发空间音频🎧

要点解析:

2 月 25 日，荣耀 MWC 2024 巴塞罗那全球发布会上，荣耀 MagicBook Pro 16 2024 款笔记本亮相，号称是“荣耀首款 AI PC”。
荣耀 MagicBook Pro 16 2024 款支持本地 AI 智能搜图功能，搭载 3072x1920 分辨率 165Hz 高刷屏，支持 100% DCI-P3 色域；ΔE＜0.5。
该机搭载酷睿 Ultra 7 处理器；RTX 40 独显，号称“通过平台级 AI 使能，实现了跨设备；跨系统，跨应用的智慧互联体验；更有 OS Turbo 加持，续航时长提升”。

https://www.ithome.com/0/751/958.htm

香港也有大模型公司啦，天使轮估值直接突破一亿美金！💰

要点解析:

近日获悉，多模态大模型初创公司Weitu AI公司已完成天使轮融资，天使轮估值一亿美元。公司团队成员由北美名校毕业生和海外大厂从业人员组成，其中包括人工智能多模态领域的研究专家和大模型基础研发能力的技术专家。
Weitu AI创始人王历伟博士表示，多模态大模型研发需要两种能力：基础大模型研发能力和专注的多模态能力。该公司团队具备这两项能力，不仅具有全栈式多模态大模型研发能力，还将瞄准多模态大模型驱动的AI产品研发，为用户带来更加智能、好用的人工智能产品。
Weitu AI成立后正在与互联网科技公司、手机厂商等紧密合作，在B端和C端产品上展开合作，也正在对接新“AI手机”浪潮下的创新交互需求，希望打造更加智能的多模态交互。

https://www.jiqizhixin.com/articles/2024-02-25-7

擎天柱走路越来越像人了！“丐版马斯克”再次获得英伟达贝佐斯等联合投资，高达6.75亿美元💰

要点解析:

人形机器人赛道持续传来重要更新，特斯拉更新擎天柱走路视频，动作流畅，接近人类；Figure AI获得6.75亿美元融资，估值超20亿。
人形机器人初创公司Figure AI获得6.75亿美元融资，该轮融资由贝佐斯、英伟达等知名公司和风投机构共同参与。这体现了投资者对人形机器人行业的信心。
特斯拉擎天柱首席工程师Milan Kovac表示，擎天柱的稳定性、自信程度和行走速度都有所提升，目前正在进行AGI大脑植入，预计将成为下一个特斯拉。

http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+%E6%93%8E%E5%A4%A9%E6%9F%B1%E8%B5%B0%E8%B7%AF%E6%9B%B4%E5%83%8F%E4%BA%BA%E4%BA%86%EF%BC%81%E3%80%8C%E4%B8%90%E7%89%88%E9%A9%AC%E6%96%AF%E5%85%8B%E3%80%8D%E5%8F%88%E8%8E%B7%E8%8B%B1%E4%BC%9F%E8%BE%BE%E8%B4%9D%E4%BD%90%E6%96%AF%E7%AD%89%E5%90%88%E6%8A%956.75%E4%BA%BF%E7%BE%8E%E5%85%83

让你轻松拥有微信和公众号的ChatGPT功能（小白教学版）✨

要点解析:

我们以小白的视角，从安装和配置开始，一步一步教你如何快速让你的微信，公众号具备这些大型语言模型的功能，如ChatGPT、Gemini、星火等。
在搭建服务之前，你需要准备国外服务器、科学上网工具以及大语言模型的API密钥。
配置好服务器后，便可按照说明运行服务程序，并根据不同平台或用途选择对应的参数。服务器搭建成功后，你就可以通过扫描二维码让你的微信或公众号具备这些大语言模型的功能。在config.json文件中，你可以配置所有属性字段，如模型名称、触发前缀、回复前缀等，以满足你的需求。

https://juejin.cn/post/7338797433898500147

巨额减持导致公司股价下跌，致远互联拥抱AI投资者却无动于衷🤷‍♂️

要点解析:

受累股东持续减持,公司股价持续下跌，致远互联股价竟跌去一半。
近年虽营收增加，但净利润却出现增长乏力现象，增长幅度很小，增收不增利。
为寻求新的增长点，致远互联将转向AI领域，尝试将原有的OA系统升级成为COP。

https://www.ofweek.com/ai/2024-02/ART-201713-8460-30626903.html

打破AI幻想：谷歌DeepMind的研究暴露了LLMs中的关键推理缺陷🤯

要点解析:

谷歌 Deepmind 和斯坦福大学的研究发现，在重新排序的前提下，LLM 的性能显着下降，准确度下降超过 30%。
研究表明，LLM 倾向于以线性、前向链式的方式处理信息，当需要进行反复阅读以拼凑出超出其「首选」顺序的信息时，它们会遇到很大困难。
这项研究对 LLM 的训练和建模技术提出了质疑，需要开发更强大的模型，能够在各种前提排列中保持较高的推理准确性。

https://www.marktechpost.com/?p=52994

消息称AMD今年将推出搭载HBM3e的MI300 AI加速器，2025年发布MI400🚀

要点解析:

据@Kepler_L2 的爆料，AMD 将在今年晚些时候推出采用 HBM3e 内存的升级版 MI300 AI 加速器，代号为 MI400。随后于 2025 年推出新一代 Instinct MI400。英伟达目前已经发布了 Hopper GH200 芯片，这也是目前市场上唯一配备 HBM3e 内存的 AI GPU。HBM3e 速度比现有 HBM3 标准提高了 50%，单个系统即可提供 10 TB / s 的带宽，每个芯片可提供 5 TB / s 的带宽，内存容量高达 141 GB。

AMD 首席执行官苏姿丰此前已经证实 Instinct MI400 正在开发中，但很可惜我们目前完全不清楚它的参数和性能，不过有传言称它将以“一系列规格”首次亮相。

英伟达目前已经发布了 Hopper GH200 芯片，这也是目前市场上唯一配备 HBM3e 内存的 AI GPU。HBM3e 速度比现有 HBM3 标准提高了 50%，单个系统即可提供 10 TB / s 的带宽，每个芯片可提供 5 TB / s 的带宽，内存容量高达 141 GB。

https://www.ithome.com/0/751/876.htm

用扩散模型生成网络参数，荣获LeCun认可的尤洋团队新研究💡

要点解析:

该研究提出了一种新的方法来生成神经网络模型参数，利用扩散模型将噪声逐步添加至训练模型参数中，最后通过反向过程移除噪声获得高质量参数。
新方法名为 Neural Network Diffusion，可以通过自动编码器提取参数隐含表征，并利用标准隐扩散模型生成隐含表征，最后通过训练好的解码器获得新参数。
实验结果表明，新方法在多个数据集和架构上都能生成与训练模型媲美或更优的性能，并且生成的模型与训练模型差异较大，说明新方法能够合成新参数而不是记忆训练样本。

https://www.jiqizhixin.com/articles/2024-02-25-6

Sora产品内测入口真的开放了吗？申请有用吗？快来一探究竟🎉

要点解析:

在Sora推出后，许多平台上充斥着各种AI课程，且经常刷到Sora申请试用的短视频，作者老王也尝试申请试用，但是发现实际操作跟想象的不一样。
申请页面根本没有提及和Sora相关的任何事情，且申请也在2023年12月1日就已截止，作者也指出了网上宣传红队申请可以试用Sora的原因，是因为OpenAI以及Sam Altman在X上发表了一下内容，表示将为有限数量的创作者提供访问权限。
作者还感慨在信息爆炸的时代，信息的可靠性以及真实性正在受着很大的挑战，人们识别信息的可靠性成本正在逐步增加，希望能够做好自媒体人的本质工作，把信息的准确性和可靠性传递给大家。

https://juejin.cn/post/7338691767434477603

历时3个月，代码开放下载啦，为所有想入门的AI视觉朋友送福利🌈

要点解析:

本项目从零开始搭建一个 resnet50 的神经网络模型，手写了所有基础的算法和模型的网络结构。该项目帮助读者入门计算机视觉与深度学习，在 Intel CPU 上完成神经网络的优化，提供有效的性能优化策略。
项目的组织结构清晰，包含核心算法原型、实现细节、常见神经网络优化方法的讲解等内容。用户可以通过多种方式学习，包括阅读文章、实操代码、阅读注释。
对于想要学习计算机视觉与人工智能的读者来说，这个项目提供了一个全面的学习资源，涵盖了从传统计算机视觉到基于深度学习的计算机视觉算法的转变过程，以及 resnet50 的原理、结构和优化方法等知识点。

https://juejin.cn/post/7339085624837193738

OpenAI最新模型Sora究竟有多强大？眼见为实的真实世界即将成为历史👀

要点解析:

OpenAI发布了Sora，一个可以基于文本输入生成视频的视频生成模型，可以生成高清和多视角的长达一分钟的连贯视频，包含高度详细的场景、复杂的摄像机运动和充满活力的情感角色，可以理解真实的物理世界与自然语言，从而能够生成更加符合现实的视频。
Sora不仅可以一次性生成完整的视频，还可以扩展已生成的视频，使其更加长久，克服了确保视频主体即便暂时消失也能保持一致性的难题，可以将现有静态图像转化为视频，精确地动画化图像内容，并注意到细小的细节，还能扩展现有视频或补全缺失帧。
Sora为理解和模拟现实世界的模型奠定了基础，是实现人工通用智能(AGI)的重要里程碑，但目前在处理复杂的场景中难以准确模拟复杂场景的物理原理，还可能会混淆提示的空间细节，可能难以精确的描述随着时间推移发生的事件，这些局限性也提醒着我们，尽管AI技术取得了巨大的进步，但在处理像提示词工程这样的问题上，仍然有很长的路需要走！

https://juejin.cn/post/7338973258896293951

亚马逊的AI大刀挥向自己，搜索框流量即将发生巨变😲

要点解析:

亚马逊最近推出了一款名为Rufus的电商工具，基于生成式人工智能技术，可以以“问答”的方式帮助顾客选购商品，具有即时回答买家问题的能力。Rufus的推出可能导致亚马逊的搜索结果流量减少，新的流量入口和新的购物场景诞生。
Rufus通过爬取亚马逊类目节点、过往买家的评论内容、Q&A和网络信息进行回答和推荐，用户可以通过它发现新产品或研究产品。卖家需要针对Rufus进行新的流量布局，例如在商品链接标题、五点描述、A+页面等处增加节日、应用场景等内容。
卖家可以在Rufus的“数据食材”来源处进行布局，例如在Q&A模块中设置买家可能向Rufus提问的问题，在站外布局品牌独立站、社交媒体页面和论坛帖子等，增加被Rufus收录和推荐的可能性。

https://m.cnbeta.com.tw/view/1420583.htm

TensorFlow模型助力web开发：赋能前端新时代💻

要点解析:

通过安装TensorFlow.js转换器,可以将用Keras训练的模型转换成TensorFlow.js模型.这种模型可以在浏览器或Node.js中运行,为Web应用提供强大的机器学习功能.
可以使用JavaScript来加载和操作转换后的模型,并直接在浏览器端进行预测.这使得Web开发者可以轻松地将机器学习模型集成到他们的应用中,实现图像识别、自然语言处理等多种功能.
TensorFlow.js非常适合在Web环境中运行轻量级和高效的模型,例如图像分类模型,自然语言处理模型和推荐系统模型.这些模型可以为用户提供丰富的交互式体验,并增强Web应用的功能.

https://juejin.cn/post/7338778403552460834

谷歌Gemini生图功能紧急叫停，口碑一夜之间崩塌，Yann LeCun表示早已预料到这一天🤔

要点解析:

谷歌 Gemini 在人物图像生成上出现严重问题，产出图像中人物种族不准确，偏向非白人。
谷歌回应 Gemini 生成错误，表示已暂停人物图像生成功能，并将在重新开放前进行改进。
谷歌强调 Gemini 是一种创造力和生产力工具，可能会犯错，幻觉是所有大语言模型面临的挑战。

https://www.jiqizhixin.com/articles/2024-02-25-5

荣耀Magic 6 Pro全球发布，AI赋能眼球追踪功能即将上线👀

要点解析:

荣誉Magic6Pro于2月27日在巴塞罗那举行的移动世界大会上宣布全球发售。
其特点包括AI驱动的眼动追踪功能和“魔幻门户”功能，可以识别消息中的事件或地址并自动链接到相关地图或日历应用程序。
它还配备了5000万像素主摄像头，具有可变光圈，可根据所需景深在f/1.4和f/2.0之间切换。

https://www.theverge.com/2024/2/25/24079890/honor-magic-6-pro-price-release-date-specs-details

DeepMind首席执行官专访：AI尚未达到拼算力的地步，谷歌的优势在于研发，智能体是下一个爆点💡

要点解析:

谷歌DeepMind首席执行官Hassabis表示，AI技术仍有很大改进空间，现在还远没有到只能拼算力的时候。谷歌的优势在于科研能力，未来智能体将改变AI的格局。
Hassabis认为，过去几年里，增加AI模型训练中使用的计算能力和数据量是推动了巨大进步的关键因素。规模很重要，但仅仅通过扩大现有技术的规模，不会获得像规划、工具使用或智能体行为这样的新能力。
Hassabis指出，智能体是下一个热点，谷歌正在投入大量的时间和精力，他们认为这将极大地提升这些系统的能力。然而，他也强调了在将AI模型变得更像智能体之前，在模拟环境中进行测试的重要性。

https://www.ithome.com/0/751/916.htm

人形机器人下个爆点？OpenAI、英伟达、贝索斯向同一家公司注资6.7亿美刀💸

要点解析:

亚马逊创始人贝索斯和其他大型科技公司投资 Figure AI，该公司旨在开发人形机器人。
Figure AI 的产品 Figure 01 是世界上第一个具有商业可行性的自主人形机器人，它可以在12个月内学会了像人一样行走、抓握等动作。
Figure AI 公司目前的估值已达到约 20 亿美元，并得到了 OpenAI 和微软的支持，正计划与宝马合作，将通用化机器人引入汽车制造领域。

https://www.jiqizhixin.com/articles/2024-02-25-3

陶哲轩：AI让业余数学家也能做出贡献，开辟数学新领域🌟

要点解析:

数学家陶哲轩认为，未来人工智能将会对数学领域产生深远的影响，例如数学变得更加协作、跨学科，并且会有更多业余爱好者参与进来。
陶哲轩还希望人工智能可以帮助简化数学证明，让数学变得更加实验性，并期待大模型可以直接生成不等式变体。
计算机辅助证明虽然争议很大，但已经广泛接受。在某个时候，我们看到AI辅助的论文问世，就会出现一场争论。

http://www.qbitai.com/?p=123394

英伟达首次披露：上季度数据中心收入达180亿美元，AI推理占比高达四成💰

要点解析:

本季度,英伟达营收同比增长 265%,达 221 亿美元,利润飙升至九倍,达到 123 亿美元,毛利率提升至 76.7%.
云厂商客户占据英伟达数据中心 50% 营收,而这部分业务是英伟达的增长隐忧,因为,亚马逊 AWS;微软 Azure;谷歌 Google Cloud 等都推出了自己的 AI 芯片,降低了对英伟达的依赖.
英伟达还重点强调了软件收入,第四季度的年化营收达到了 10 亿美元,认为随着时间的推移,这可能会成为一项非常重要的业务.

http://www.geekpark.net/news/331574

谷歌自研应用陆续整合Gemini：笔记应用Keep测试“AI创建清单”功能📝

要点解析:

谷歌旗下笔记应用Keep迎来全新升级，搭载由Gemini驱动的AI功能。
用户利用该功能，可借助提示词快速生成购物清单、待办事项清单以及打包清单。
谷歌鼓励用户对Gemini生成的结果进行评价，从而进一步优化AI功能。

https://www.ithome.com/0/751/943.htm

谷歌AI视频再创巅峰！全能通用视觉编码器VideoPrism横空出世，性能刷新30项SOTA💯

要点解析:

谷歌推出了通用视觉编码器VideoPrism，可以在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成训练，并在33项视频理解基准测试中刷新了30项SOTA。
VideoPrism能够通过单一冻结模型，处理各种视频理解任务，如：分类、本地化、检索、字幕和问答。
VideoPrism在科学领域的CV任务中也表现出色，其性能与专门用于单个任务的特定领域模型相媲美。

http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+%E8%B0%B7%E6%AD%8CAI%E8%A7%86%E9%A2%91%E5%86%8D%E5%87%BA%E7%8E%8B%E7%82%B8%EF%BC%81%E5%85%A8%E8%83%BD%E9%80%9A%E7%94%A8%E8%A7%86%E8%A7%89%E7%BC%96%E7%A0%81%E5%99%A8VideoPrism%EF%BC%8C%E6%80%A7%E8%83%BD%E5%88%B7%E6%96%B030%E9%A1%B9SOTA

Stable Diffusion 3重磅发布，吹爆它的超赞细节、多元素控制和文字生成功能🚀

要点解析:

腾讯混元大模型在10月26日迎来全新升级，正式对外开放「文生图」功能，成功展示其自动生成图像的能力。经对比，升级后的腾讯混元中文能力甚至超过了GPT3.5，代码能力也大幅提升20%，达到业界领先水平。此外，腾讯自研的7B和13B模型首次亮相，同等效果下仅需较少的tokens，训练效率更高。

作为实用级通用大模型，腾讯混元大模型可应用于腾讯会议、腾讯文档、企业微信等多个业务。此外，基于腾讯混元，QQ浏览器还推出了「PDF 阅读助手」，具备智能摘要、智能问答和多轮提问等功能。

腾讯拥有从模型算法到机器学习框架到AI基础设施的全链路自研技术，这对大模型的快速迭代有着很大的帮助。自从首次公开亮相以来，腾讯混元大模型一直在加速升级和提高模型稳定性和可靠性。

https://juejin.cn/post/7338717224436367410

扣子（coze.cn）初体验：智能小说创作引擎，让写作这件事变得简单有趣📖

要点解析:

扣子(coze.cn)是一个用来开发新一代 AI Chat Bot 的应用编辑平台，无论你是否有编程基础,都可以通过这个平台来快速创建各种类型的 Chat Bot,并将其发布到各类社交平台和通讯软件上！文章分享了扣子(coze.cn)AI Chat Bot开发平台创建我的“智能小说创作引擎”初体验,并探讨其背后的技术实现原理及未来应用场景.
扣子(coze.cn)AI Chat Bot开发平台具有多渠道发布;智能引导;灵活定制;创新实现等优势,能帮助用户轻松创建属于自己的AI Bot,并将其发布到多个渠道,展示你的创新和才华.
AI Bot页面设计简洁美观,排版布局符合常用习惯,为用户提供了直观的操作体验.生成的AI Bot页面设计简洁美观,排版布局符合常用习惯,为用户提供了直观的操作体验.优化后的AI Bot界面不仅美观易用,还具备丰富的功能和灵活的定制选项.无论你是开发者还是普通用户,都可以通过这个界面轻松地优化你的AI Bot,实现更好的人机交互体验.

https://juejin.cn/post/7338791751849836570

国内高校创建类Sora模型VDT，通用视频扩散Transformer荣获ICLR 2024认可👍

要点解析:

论文《VDT: 通用视频扩散 Transformer via 掩码建模》提出统一的时空掩码建模机制，使视频扩散模型能够处理多种视频生成任务，包括无条件生成、后续帧预测、插帧、图生视频、视频画面补全等。
VDT 模型采用 Transformer 架构，可以学习到一定的物理规律，如球沿抛物线轨迹运动、球在平面上滚动并与圆柱体碰撞等。
VDT 模型在部分小型学术数据集上的实验结果表明，Transformer 架构在处理视频数据生成方面的有效性和灵活性。

https://www.jiqizhixin.com/articles/2024-02-25

Sora：OpenAI推出AI，即刻生成夺人眼球的视频👀

要点解析:

近日，旧金山初创公司OpenAI推出了一款新的系统Sora，能够生成类似好莱坞电影的视频，引起广泛关注。该系统能够在几分钟内根据文本描述生成视频，如猛犸象在雪地中奔跑、怪物凝视融化的蜡烛等。
OpenAI还表示，Sora目前尚未向公众发布，因为公司仍在了解该系统的潜在风险。不过，OpenAI已将该技术分享给一些学者和其他外部研究人员，以帮助发现该系统的潜在误用方式。
该系统是生成式AI的一个示例，它可以立即创建文本、图像和声音。OpenAI的系统通过分析数字数据（包括视频和描述这些视频内容的字幕）来学习，但OpenAI拒绝透露系统学习了多少视频或这些视频的来源。

https://moderndiplomacy.eu/?p=70952

国内免费AI绘画神器：字节跳动的Dreamina🎨

要点解析:

字节跳动旗下AI绘画工具Dreamina上线，作为国内版Midjourney，具有简单易上手、操作便捷、界面简洁直观的特点，注重用户体验，无需繁杂学习，绘画生成过程只需几秒。
Dreamina能将用户的文字描述转化为实实在在的视觉画面，绘画风格多样，可实现动漫、写实、摄影、插画等。
Dreamina基于字节跳动开发的云雀大模型，融合了深度学习强大算力，可以成为设计师、艺术家和创意工作者的灵感源泉。

https://juejin.cn/post/7339104098897723455

MusicMagus：利用扩散模型实现零样本文本转音乐编辑🎶

要点解析:

MusicMagus是一个文本到音乐的新框架，它可以编辑由文本描述生成的音乐。它使用AudioLDM 2模型，该模型使用变分自动编码器将音乐音频谱图压缩成潜在空间。
通过编辑潜在空间中的音乐特征向量，MusicMagus可以改变音乐的音色、风格、节奏和情感。这可以用来修复或改进原有的音乐作品，也可以用来创作新的音乐。
MusicMagus在几个数据集上的实验中优于其他基线模型，包括POP909和MAESTRO。它在保持音乐语义完整性和结构一致性方面表现出显著优势。

https://www.marktechpost.com/?p=53010

拥有使能控制的锂电池充电放电解决方案🔋

要点解析:

TP4594R是一款集成锂电池充放电管理功能的单芯片电源管理 SOC，可为锂电池提供完整的充放电解决方案。它集成了线性充电管理模块、同步升压放电管理模块、电量检测与 LED 指示模块、保护模块等功能。
TP4594R支持边充边放功能，在充电电源接入和输出端有负载接入的情况下，可同时进行充电和放电。
TP4594R具有多重保护功能，包括输出过流保护、输出短路保护、输出过压保护、过充保护、过放保护和温度保护等。

https://juejin.cn/post/7339016190612127744

使用TensorFlow训练模型：一步一步教你构建智能模型💡

要点解析:

TensorFlow是一个功能强大的开源软件库，用于数值计算，特别适合大规模的机器学习任务。在这里，我们将学习如何使用TensorFlow来训练一个简单的神经网络模型，并使用它进行预测。
首先，我们准备环境，确保已经安装了Python和TensorFlow。然后，加载MNIST数据集，这是一个手写数字识别数据集，包含60,000个训练样本和10,000个测试样本。
接下來，构建一个简单的神经网络模型，包括两个密集连接的层和一个softmax层。然后，编译模型，指定优化器、损失函数和评估指标。训练模型，使用fit方法进行训练，指定训练的周期数。

https://juejin.cn/post/7338721296866295848

用LangChain和Chainlit将外部API无缝整合至聊天机器人程序，轻松实现多功能对话机器人🤖️

要点解析:

本文演示了如何将聊天机器人应用程序与外部 API 集成.
首先创建一个虚拟冰淇淋店的 API,该 API 包含有关菜单、特别优惠、客户评论和自定义项的信息.使用 Flask 设置 API,并创建不同的端点来检索这些信息.
其次,使用 LangChain 的 APIChain 模块设置一个 API 链,该模块将用户输入格式化为 API 请求,并可以访问外部 API.
最后,在聊天机器人应用程序中集成了 LLMChain 和 APIChain,以便聊天机器人能够查询虚拟冰淇淋店的 API 并向用户提供有关菜单和自定义选项的特定信息.

https://juejin.cn/post/7338835708504588326

理解深度学习：第八章性能评估，揭秘模型优劣的奥秘🏆

要点解析:

本节将讨论如何评估训练好的模型性能。测试误差主要由三种不同的原因造成，它们各自的影响程度依赖于：(i) 任务本身的固有不确定性，(ii) 训练数据的量，以及 (iii) 模型选择。
模型无法泛化时产生的错误可以来源于三个方面：噪声、偏差和方差。
噪声是指在数据生成过程中引入的随机性，导致每个输入 x 可能对应多个有效的输出 y。偏差是指模型由于不够灵活，无法完美拟合真实函数而可能出现的错误。方差源于我们仅有有限的训练样本，不能区分数据中的系统性变化和随机噪声。

https://juejin.cn/post/7338771486399348736

深度学习的绘画之道：图像生成与风格迁移的艺术之旅🎨

要点解析:

深度学习领域近年来的发展极大地推动了生成对抗网络(GAN)领域研究,而GAN也已成为目前生成图像和风格迁移领域的主流模型.
GAN由生成器和判别器两部分组成.生成器学习从噪声中生成逼真的图像,而判别器则根据真实图像和生成图像进行判别.在训练过程中,生成器和判别器不断竞争,直至生成器生成的图像能够欺骗判别器,达到难以区分真实图像与生成图像的程度.
在GAN基础上,风格迁移技术应运而生.风格迁移是指将一张图像的艺术风格应用于另一张图像上.其核心思想是分解图像的内容和风格,并将目标图像的内容与源图像的风格结合,从而生成新的图像.

https://juejin.cn/post/7338771486399676416

手把手教你用Hugging Face微调Gemma模型，解锁AI语言新技能✨

要点解析:

Gemma 模型系列非常适合利用 Colab 提供的免费 GPU 资源进行原型设计和实验.它在 Hugging Face 平台上提供支持,可在 Vertex Model Garden 和 Google Kubernetes Engine 中轻松部署和微调.
我们可以使用 LoRA 技术对 Gemma 模型进行参数高效微调,这是一种流行的方法,可以以低成本实现对大语言模型的微调.
Gemma 模型系列同样非常适合利用 Colab 提供的免费 GPU 资源进行原型设计和实验,在 Hugging Face 平台上提供支持,可在 Vertex Model Garden 和 Google Kubernetes Engine 中轻松部署和微调.

https://juejin.cn/post/7338791751849607194

打入AI底层！新加坡国立大学尤洋团队利用扩散模型构建神经网络参数，荣获LeCun认可👍

要点解析:

新加坡国立大学尤洋教授团队联合UCB;Meta AI实验室等机构最新开源的研究成果提出了一种用于生成神经网络参数的扩散模型p(arameter)-diff。
p-diff通过正向和反向过程来学习参数的分布，再从随机噪声中合成这些潜在表示来构建新模型。
测试结果表明，用p-diff生成的模型表现基本都接近甚至超过了人工训练的原始模型。而且p-diff生成的模型之间的相似度低于各原始模型之间的相似度,以及p-diff与原始模型的相似度。

http://www.qbitai.com/?p=123297

修复成功：解决Character AI请求限额超出的错误，畅享无忧对话体验✨

要点解析:

谷歌AI聊天机器人LaMDA被指控存在种族和性别偏见，谷歌决定对其进行种族和性别偏见审查，以确保其符合该公司政策。
LaMDA是谷歌的人工智能系统，它被设计用于开发新语言模型和对话系统。
该聊天机器人将于2023年对外开放，因此谷歌需要确保其符合该公司政策，以避免任何潜在的法律和声誉上的风险。

https://www.greataiprompts.com/?p=6746

并非ChatGPT，英伟达CEO黄仁勋更青睐Perplexity AI聊天机器人🤔

要点解析:

英伟达 CEO 黄仁勋最近透露了他经常使用的聊天机器人——Perplexity AI，他每天都会使用 Perplexity AI 和 ChatGPT 进行研究。
Perplexity 自称是 “世界上首个对话式答案引擎”，其查询方便快捷，并且能自然地深入挖掘话题。
英伟达在 2024 年 1 月参与了一轮由 IVP 领投的 7360 万美元 B 轮融资，为 Perplexity 提供资金支持，因此黄仁勋对 Perplexity AI 感兴趣，并且公司内部高管也在“尝鲜”该产品。

https://www.ithome.com/0/751/873.htm

谁能代表中国AI？谁是领军者？🤔

要点解析:

中国在人工智能领域不缺乏人才、企业家、创业者，他们代表着中国的AI产业，探索属于中国自己的路径。
李彦宏作为中国企业家，推动新技术的发展和普及，为中国AI微弱的火种。
面对AI技术的发展，中国需要更多的务实的投资人和实事求是的创业者，从产业和技术出发，做长远的、面向未来的投资和技术发展。

https://m.cnbeta.com.tw/view/1420625.htm

coze试玩初体验，亲自打造了一个ggbond机器人，探索人机互动的无限可能🤝

要点解析:

GGBond金句录是收集整理了GGbond经典语录的一本电子书，内容丰富，涵盖了生活感悟、人生哲理、爱情婚姻、励志正能量等多个方面。
GGBond金句录的语言风格幽默风趣，通俗易懂，深受广大读者的喜爱。
GGBond金句录不仅是一本值得反复阅读的经典之作，也是一本可以帮助读者在生活中找到方向和力量的书籍。

https://juejin.cn/post/7338835708503867430

8/8/6/3的曼巴论文，最终被ICLR 2024拒绝，网友表示终于可以安心了😌

要点解析:

近日,热门论文 Mamba 被 ICLR 2024 大会拒稿,引发社区热议.Mamba 是一种选择性状态空间模型,在语言建模方面可以媲美甚至击败 Transformer.但 ICLR 审稿人认为,这篇论文的评估方法存在争议,缺少 LRA(Long Range Arena)的结果,并且使用困惑度作为主要评价指标有失偏颇.
此外,审稿人还对长序列语言模型在短文本序列中的潜在性能差距表示担忧.作者团队及时对论文内容进行了修改和完善,补充了详尽的实验结果和分析,但仍然被拒.
值得一提的是,同样被 ICLR 拒稿的还有热门开源多模态大模型 CogVLM.对于研究者来说,拒稿是一种令人遗憾的结果,但研究的真正价值不会仅由某一个学术会议而界定.

https://www.jiqizhixin.com/articles/2024-02-25-8

简单致敬女子科学团队，聚光灯下展示女子在STEM的独特职业生涯🌈

要点解析:

營養和健康應用程序Simple在國際婦女和女童科學日及國際婦女節之際，宣布了一項計劃，以表彰其科學團隊中才華橫溢的女性領導人。
簡單的“女性塑造科學”活動旨在強調這些女性在公司內部和整個科學界扮演的重要而獨特的角色。這些強大的STEM領導人每天都在塑造Simple對可持續減肥和健康生活的經驗方法，並鼓勵其他女性在科技和人工智能領域追求鮮有人從事的科學事業。
Simple的科學團隊的日常工作包括及時了解最新的飲食指南、行為改變技術和經過驗證的安全減肥方法，並將這些方法應用到Simple的應用程序和用戶體驗中。

https://aithority.com/?p=565521

AAAI 2024杰出论文奖揭晓：西安电子科技大学获奖，为国争光🎉

要点解析:

2024 年 AAAI 会议于 2 月 20-27 日在加拿大温哥华会议中心举行，共有 10504 篇投稿，2527 篇论文入选。
AAAI 2024 公布了杰出论文奖、经典论文奖、AI 人类福祉奖、Robert S. Engelmore 纪念奖、AAAI/EAAI Patrick Henry Winston 杰出教育家奖、AAAI 杰出服务奖等多个重要奖项。
今年的杰出论文奖由来自西安电子科技大学和名古屋大学的作者获得，分别为《Reliable Conflictive Multi-view Learning》和《GxVAEs: Two Joint VAEs Generate Hit Molecules from Gene Expression Profiles》。

https://www.jiqizhixin.com/articles/2024-02-25-2

消息称佳能 EOS R5 MarkⅡ相机将搭载全新的“AI自动对焦功能”📸

要点解析:

佳能在近期即将发布两款新相机：EOS R5 Mark II 和 EOS R1，预计于今年 5 月底之前正式官宣。
EOS R5 Mark II 定位为静态图像和视频功能的顶级型号，8K RAW 录制帧率将提高至 60fps，并采用新的 “AI”自动对焦功能，具体功能尚不清楚。
除此之外，佳能还计划今年发布 RF 28mm F1.4/F1.8、RF 35mm F1.2L USM、RF 70-200mm F2.8L IS USM Z 三款镜头，以及 Cinema EOS C300/C500 的后续机型。

https://www.ithome.com/0/751/915.htm

Files

20240225.md

Latest commit

History

20240225.md

File metadata and controls

目的

看点

补齐Transformer规划短板，田渊栋团队的Searchformer火爆登场🔥

荣耀首款AI笔记本电脑 MagicBook Pro 16亮相，Win阵营首发空间音频🎧

香港也有大模型公司啦，天使轮估值直接突破一亿美金！💰

擎天柱走路越来越像人了！“丐版马斯克”再次获得英伟达贝佐斯等联合投资，高达6.75亿美元💰

让你轻松拥有微信和公众号的ChatGPT功能（小白教学版）✨

巨额减持导致公司股价下跌，致远互联拥抱AI投资者却无动于衷🤷‍♂️

打破AI幻想：谷歌DeepMind的研究暴露了LLMs中的关键推理缺陷🤯

消息称AMD今年将推出搭载HBM3e的MI300 AI加速器，2025年发布MI400🚀

用扩散模型生成网络参数，荣获LeCun认可的尤洋团队新研究💡

Sora产品内测入口真的开放了吗？申请有用吗？快来一探究竟🎉

历时3个月，代码开放下载啦，为所有想入门的AI视觉朋友送福利🌈

OpenAI最新模型Sora究竟有多强大？眼见为实的真实世界即将成为历史👀

亚马逊的AI大刀挥向自己，搜索框流量即将发生巨变😲

TensorFlow模型助力web开发：赋能前端新时代💻

谷歌Gemini生图功能紧急叫停，口碑一夜之间崩塌，Yann LeCun表示早已预料到这一天🤔

荣耀Magic 6 Pro全球发布，AI赋能眼球追踪功能即将上线👀

DeepMind首席执行官专访：AI尚未达到拼算力的地步，谷歌的优势在于研发，智能体是下一个爆点💡

人形机器人下个爆点？OpenAI、英伟达、贝索斯向同一家公司注资6.7亿美刀💸

陶哲轩：AI让业余数学家也能做出贡献，开辟数学新领域🌟

英伟达首次披露：上季度数据中心收入达180亿美元，AI推理占比高达四成💰

谷歌自研应用陆续整合Gemini：笔记应用Keep测试“AI创建清单”功能📝

谷歌AI视频再创巅峰！全能通用视觉编码器VideoPrism横空出世，性能刷新30项SOTA💯

Stable Diffusion 3重磅发布，吹爆它的超赞细节、多元素控制和文字生成功能🚀

扣子（coze.cn）初体验：智能小说创作引擎，让写作这件事变得简单有趣📖

国内高校创建类Sora模型VDT，通用视频扩散Transformer荣获ICLR 2024认可👍

Sora：OpenAI推出AI，即刻生成夺人眼球的视频👀

国内免费AI绘画神器：字节跳动的Dreamina🎨

MusicMagus：利用扩散模型实现零样本文本转音乐编辑🎶

拥有使能控制的锂电池充电放电解决方案🔋

使用TensorFlow训练模型：一步一步教你构建智能模型💡

用LangChain和Chainlit将外部API无缝整合至聊天机器人程序，轻松实现多功能对话机器人🤖️

理解深度学习：第八章性能评估，揭秘模型优劣的奥秘🏆

深度学习的绘画之道：图像生成与风格迁移的艺术之旅🎨

手把手教你用Hugging Face微调Gemma模型，解锁AI语言新技能✨

打入AI底层！新加坡国立大学尤洋团队利用扩散模型构建神经网络参数，荣获LeCun认可👍

修复成功：解决Character AI请求限额超出的错误，畅享无忧对话体验✨

并非ChatGPT，英伟达CEO黄仁勋更青睐Perplexity AI聊天机器人🤔

谁能代表中国AI？谁是领军者？🤔

coze试玩初体验，亲自打造了一个ggbond机器人，探索人机互动的无限可能🤝

8/8/6/3的曼巴论文，最终被ICLR 2024拒绝，网友表示终于可以安心了😌

简单致敬女子科学团队，聚光灯下展示女子在STEM的独特职业生涯🌈

AAAI 2024杰出论文奖揭晓：西安电子科技大学获奖，为国争光🎉

消息称佳能 EOS R5 MarkⅡ相机将搭载全新的“AI自动对焦功能”📸