本系列文章主要是用于持续跟踪最新的AI产业情况,让你减少知识焦虑。
原文共计140652 字,简读后为11128字,阅读时间为28分钟,为您提高阅读效率为1257%
- 什么是 AI PC(人工智能电脑) 😮
- New AI Video App by Pika Labs Makes a Big Splash, Boosts Chinese Company’s Stock 🚀
- 研究结果显示,向 ChatGPT 提问时承诺提供“小费”会得到更详细回复 💬
- IP工具箱:开源 IP 信息查看器,使用 AI 写了 70% 代码,上线12天,GitHub 已获 900+ 星 ⭐
- I made a GPT, a custom version of OpenAI's ChatGPT, and it only took me 15 minutes. Here's how. 🕒
- 《纽约客》万字长文还原OpenAI“宫斗”内幕 📰
- OpenAI 人事动荡细节披露:部分董事认为阿尔特曼是个令人不安的“滑头” 🔄
- The Power of Prompting 💡
- Research Focus: Week of November 22, 2023 🧪
- Orca 2: Teaching Small Language Models How to Reason 🐋
要点解析:
-
美国人工智能视频生成初创公司Pika Labs最新动态引起了AI社区的轰动。由斯坦福大学辍学生郭迪米和陈林猛创立的Pika Labs推出的AI视频生成器Pika 1.0意外地引发了与郭家族有密切关联的中国IT公司Sunyard Technology的股票上涨,尽管两者没有直接业务联系。
-
总部位于硅谷的Pika Labs在中国尤其引起了科技界的关注,郭迪米的家族关系引发了投资者的兴趣。郭迪米是杭州Sunyard Technology前董事长郭华强的女儿,尽管Sunyard坚称与Pika Labs没有直接业务关系,但在Pika 1.0智能视频生成器推出后,其股价上涨了20%以上。
-
Pika Labs在ChatGPT成功后蓬勃发展,宣布融资5500万美元,吸引了Nat Friedman和Daniel Gross等硅谷重量级投资人。此次融资与Pika 1.0的推出同步进行,该版本旨在将简单的文本提示转化为多样的视频格式,从卡通到逼真动画应有尽有。郭表示,公司的目标是在AI视频生成技术领域取得领先地位,计划推出一个商业版,能够制作影片质量的短片。
原文链接:https://www.greataiprompts.com/?p=5310
Lifelong model editing in large language models: Balancing low-cost targeted edits and catastrophic forgetting
要点解析:
-
近期提出了一种名为GRACE的模型编辑方法,通过对大型语言模型进行持续学习和修复。GRACE通过学习、缓存和选择性检索层间的新转换,使得模型能够进行数千次顺序编辑,以快速纠正错误。编辑的类型包括更新事实知识、跟踪标签变化以及减轻大型语言模型中的虚构和不一致性。
-
对于事实知识的更新,比如一个预训练的问答模型,随着时间的推移,模型返回的答案可能过时。为此,GRACE提出一种编辑方式,包括问题和正确答案的有序序列,用于及时更新模型。此外,GRACE还考虑了分类任务中地面真相的变化,以及在大型语言模型中避免生成与现实无关语言的挑战。通过这种方式,模型可以在长序列编辑中保持性能并适应新的数据和需求。
-
GRACE方法不同于传统的模型编辑,它直接修改表示并顺序缓存转换。这一步减小了在真实应用中发现的错误的修复成本,为大型语言模型在长时间部署中适应用户需求提供了一种新的解决方案。通过高效地纠正模型行为,并将顺序编辑扩展到其他模型属性,如公平性和隐私,GRACE可能成为适应LLMs满足用户需求的新一类解决方案。
要点解析:
-
谷歌DeepMind的新工具GNoME采用图神经网络(GNN)架构,通过主动学习发现了220万种理论上稳定的新晶体材料。准确率从50%提高到80%,其中38万种已进入测试。该工具经过密度泛函理论验证,表现出泛化能力,甚至对含有5种以上元素的结构进行准确预测。这一研究被认为相当于近800年的知识积累,引起了业内专家的关注。
-
GNoME的发现为新能源电池、超导体、芯片等领域带来希望。尽管这些晶体材料目前只是理论上稳定,但通过实验合成后,可以在能源、信息通讯和传感等领域应用。研究人员已经在实验室中合成了736种材料,证明了GNoME计算的晶体可以被成功合成,对未来材料科学和技术的发展具有重要意义。
-
加州大学伯克利分校和劳伦斯伯克利国家实验室将这些发现的材料用于实验工作,并成功合成了41种化合物,成功率超过70%。这些新发现的材料可能不仅影响新材料设计,还可以作为训练和优化其他AI模型的数据集,为科学研究和技术创新提供新的可能性。
原文链接:http://www.qbitai.com/?p=103064
要点解析:
-
第三季度英伟达销售约50万台H100和A100 GPU,成为大语言模型热潮的受益者。Omdia数据显示,H100 GPU在人工智能和高性能计算领域需求激增,Meta和微软是最大买家。全球数据中心硬件市值预计到2027年将翻番,服务器市场价值达1956亿美元。
-
大公司采购Nvidia H100 GPU驱动数据中心发展,包括Bit Digital、BlueSea Frontier Compute Cluster、Voltage Park等。英伟达计划提高H100处理器产量,目标是明年出货150万至200万台。人工智能热潮下,沙特阿拉伯、阿联酋等国家也纷纷购买大量英伟达处理器。
-
除巨头外,富裕资金的风险投资公司和GitHub前首席执行官Nat Friedman等也积极购买GPU。数据显示Nvidia在第三季度售出的GPU总重量超过900吨,引起社交媒体热议。大语言模型的崛起推动了GPU的全球需求,而英伟达在这场竞争中占据主导地位。
要点解析:
-
OpenAI计划推出GPT商城,允许客户设计和部署自己的GPT版本,强调隐私和安全。然而,由于一些意外情况,商城上线计划被推迟至2024年。这或许与公司内部的问题有关,但具体细节尚不清楚。
-
亚马逊推出的AI聊天机器人Q遭遇员工指责,存在严重的“幻觉”问题,可能泄露公司机密信息。报告显示Q返回有害或不适当的信息,引发了公司内部的严重关切。争议中,亚马逊发言人否认了泄露机密信息的说法。
-
Windows 11在全球市场份额持续上升,占比达26.66%,而Windows 10的市场份额下降至68%。微软确认将于2025年10月14日停止对Windows 10的支持,用户有两年时间升级到Windows 11。这显示出对新操作系统的广泛采用和微软对未来的发展规划。
原文链接:http://www.geekpark.net/news/328496
要点解析:
-
《IP工具箱》是一款开源的IP信息查看器,支持查看IP、IP信息(代理前后)、检查DNS泄露、检查WebRTC连接以及测试网站可用性等功能。开发者 @jason5ng32 表示,程序的70%代码由ChatGPT生成,通过大约50个回合的交互和一些手动修改完成。
-
该工具展示了来自6个不同来源的IP归属地信息,包括Upai、TaoBao、Cloudflare IPv4、Cloudflare IPv6、IPify IPv4和IPify IPv6。网络连接性测试涵盖了本地网络与网易、百度、微信、GitHub等网站的联通性。
-
IP工具箱提供了即开即用的方便获取方式,用户可以直接从GitHub克隆下来并放入HTTP服务器使用。
原文链接:https://www.appinn.com/?p=47107
要点解析:
-
ChatGPT作为生成式人工智能技术的代表,在一周年内迅速改变科技行业格局。与历史上其他颠覆性产品相比,ChatGPT以低调方式成为人工智能领域的规则改变者。在风投寒冬中,人工智能公司融资轻松,仅第三季度就筹集了179亿美元。ChatGPT带动人工智能投资浪潮,新的初创公司和产品层出不穷,形成了竞争激烈的局面。
-
在人工智能投资热潮中,初创公司如Anthropic和Midjourney崭露头角,Pika推出令人印象深刻的AI视频生成工具。全球科技巨头也纷纷加大人工智能投入,微软整合AI能力到旗舰产品,谷歌推出Bard聊天机器人,亚马逊发布Alexa和AWS的生成式AI工具。人工智能已被各大公司视为未来的关键技术。
-
尽管ChatGPT界面简朴、可靠性有问题,但其迅速增长令人瞩目。上市仅5天即有100万用户,两个月内突破1亿用户。移动端总安装量超过1.1亿,每周活跃用户保持在1亿水平。ChatGPT的成功体现在超过1.1亿的总安装量和近3000万美元的消费者支出上,成为OpenAI价值数十亿美元的业务支柱。
原文链接:https://awtmt.com/articles/3703361
要点解析:
-
自10月7日哈马斯对以色列发动突袭以来,以色列国防军(IDF)展示了其全天候运行的人工智能目标管理系统,名为“福音”,迅速处理最新情报并生成建议供人类分析师审查。
-
IDF表示,该目标系统支持包括以色列空军情报、海军情报和南方司令部情报中心在内的各种情报单位。尽管IDF声称该系统旨在最小化对平民的伤害,但据《卫报》报道,该系统还被用于生成针对被怀疑是哈马斯或伊斯兰圣战组织成员的个人私宅的建议。据报道,IDF已积累了超过30,000名被怀疑是激进分子的数据库。
-
据IDF称,自与哈马斯的战争开始以来,这个以人工智能为动力的系统已用于识别加沙的15,000个潜在目标,以及数千个其他被怀疑的恐怖分子目标。这一数字可能是2014年与哈马斯的战争中袭击的目标数量的两倍,《卫报》报道的数字为5,000至6,000个目标。
原文链接:https://decrypt.co/208388/israel-idf-ai-targeting
要点解析:
-
人工智能领域最新研究表明,GPT-4在图灵测试中未能通过,其成功率未超过人类63%,反超过去60年历史的ELIZA聊天机器人。研究者使用GPT-3.5和GPT-4作为测试对象,发现ELIZA的成功率高达27%,而GPT-4仅为41%,未达到通过测试的标准。
-
研究设计了包含上下文和模型反应指导的提示,通过用户与模型的对话来进行测试。在测试中,ELIZA表现出相对保守的回应,避免了提供不正确信息或过于晦涩的线索。研究结果揭示了图灵测试并非准确衡量智能的方法,审问者的先入为主观念可能扭曲对人工智能能力的判断。
-
GPT-4的表现虽优于GPT-3.5,但未通过图灵测试的标准,挑战在于设计更符合人类对话风格的提示语。研究者呼吁更深入的研究,以理解人工智能与人类智能之间的差异,并指出先前的研究可能高估了人类的智能水平,低估了AI系统的表现。
要点解析:
-
《纽约客》详细揭示了微软与 OpenAI 合作中的内幕。感恩节前,微软CEO纳德拉接到电话,得知OpenAI将解雇CEO兼联合创始人阿尔特曼。阿尔特曼与董事会矛盾激化,被指滑头,曲解董事会成员意见,引发公司内部动荡。
-
阿尔特曼曾妨碍马斯克接管OpenAI,并因论文误解导致撤销董事职务。董事会成员为维护公司稳定,秘密讨论阿尔特曼替换计划,以防他干扰。
-
董事会揭露阿尔特曼长期通过谎报他人意见、操纵信息,展现其令人惧怕的战术技巧。公司高层决心确保替换计划不被阿尔特曼察觉,避免进一步混乱。
原文链接:https://www.ithome.com/0/736/721.htm
要点解析:
-
微软研究团队提出了一种用于动态稀疏优化的深度学习编译器,命名为Permutation Invariant Transformation(PIT)。动态稀疏是一种用于在计算和内存要求上减少资源消耗的技术,在嵌入式设备或移动平台等计算资源有限的情况下尤为有用。PIT通过新颖的平铺机制,将多个稀疏位置的微小瓦片转换为GPU高效的密集瓦片,从而实现高GPU利用率和低覆盖浪费。研究表明,PIT可以将动态稀疏计算加速高达5.9倍(平均2.43倍),超过目前先进编译器的性能。
-
另一项研究介绍了TongueTap,一种利用头戴设备进行多模式舌头手势识别的技术。通过同步使用两个商用头戴设备的多模式脑电图(EEG)、光电脉搏图(PPG)、惯性测量单元(IMU)、眼动追踪和头部追踪数据,TongueTap以高达94%的准确率对八种闭口舌头手势进行分类,为头戴设备的隐形、无声交互提供了可能性。
-
在基因组学领域,微软研究人员评估了基于零次训练的基础模型在单细胞生物学中的应用限制。研究结果显示,Geneformer和scGPT在零次训练设置中的性能有限,与更简单的方法相比性能较差。这一发现为单细胞基础模型的实际应用提供了警示,并强调需要更有针对性的研究来发挥其潜力。
原文链接:https://www.microsoft.com/en-us/research/blog/research-focus-week-of-november-22-2023/
要点解析:
-
近日,OPENAI OPCO,LLC申请多枚“GPT-6”“GPT-7”商标,国际分类为科学仪器;网站服务,当前商标状态均为等待实质审查。ChatGPT 4.0是OpenAI公司最新一代人工智能聊天机器人模型,基于自注意力机制的Transformer架构。这种深度学习模型通过大量数据训练,能抓取文本中的复杂模式,生成连贯的文本。ChatGPT 4.0具有众多参数,能处理多种文本任务,在多领域表现出色。
-
OpenAI CEO Sam Altman透露,公司正在积极开发下一代AI模型GPT-5。尽管发布时间表未定,但明确表示需要更多数据来训练这一模型,呼吁征集大规模数据集,特别寻求互联网上尚未公开轻松获取的长篇写作或对话数据。
原文链接:https://www.ithome.com/0/736/677.htm
要点解析:
-
人工智能政策是组织进行人工智能治理的动态文档框架,旨在帮助组织制定清晰的准则、规则和原则,明确规定人工智能技术在组织内的使用和开发方式。制定人工智能政策有助于业务领导明确和突出组织承诺的伦理、法律或合规标准,以及与整体组织目标和战略一致的战略人工智能使用的“谁”、“什么”、“何时”、“为什么”和“如何”。
-
人工智能治理是一组最佳实践,包括政策、标准化流程以及有助于更具伦理和受控的人工智能生态系统的数据和基础设施控制。当组织制定适当的人工智能治理标准和框架时,培训数据、算法、模型基础设施和人工智能模型本身可以在初始开发、培训和再培训、部署以及日常使用过程中得到更密切的监控和控制。这有助于更高效的人工智能操作,同时符合相关的数据隐私和人工智能伦理法规。
-
在制定全面的人工智能治理战略方面,执行领导、首席信息官、首席数据官、首席合规官、法律/合规团队、数据科学、人工智能和IT安全团队、人工智能伦理委员会、人力资源和学习发展团队以及第三方顾问等各方都发挥着重要作用。人工智能治理是确立、组织和执行人工智能开发和使用标准的最有效方式之一,促进伦理和合规实践、透明度、持续监控和改进以及团队协作。
原文链接:https://www.eweek.com/?p=223432
要点解析:
-
Orca 2是微软最新推出的小型语言模型,拥有130亿参数。通过改进的训练信号和方法,Orca 2展示了小型语言模型在增强推理能力方面的潜力。与相似大小的模型相比,Orca 2在复杂任务中取得了类似或更好的性能,测试了零样本环境下的高级推理能力。
-
Orca 2的关键洞见在于不同任务可能受益于不同的解决策略,并且大型模型的解决策略可能不适用于小型模型。它通过使用扩展的、高度定制的合成数据集进行训练,教导Orca 2各种推理技巧,例如逐步处理、回忆然后生成、回忆-推理-生成、提取-生成和直接回答等方法,同时教导它对不同任务选择不同的解决策略。
-
Orca 2在评估中展示出与大型模型相媲美的推理能力,尤其在零样本推理任务中。尽管存在一些限制,但通过精心筛选的合成数据进行后续训练成为提高小型语言模型推理能力的关键策略。
原文链接:https://www.microsoft.com/en-us/research/blog/orca-2-teaching-small-language-models-how-to-reason/
要点解析:
-
今年感恩节前,微软首席执行官纳德拉与OpenAI的合作陷入风波。OpenAI董事会解雇了联合创始人兼首席执行官奥特曼,引发了一场内部危机。微软与OpenAI的联盟曾在人工智能领域取得重要进展,推出了基于OpenAI技术的先进人工智能助手Copilots。然而,OpenAI的领导层内部矛盾导致了合作的崩溃,引发了行业对人工智能发展和伦理的关切。
-
微软与OpenAI合作开发了人工智能助手Copilots,该助手在微软核心应用程序中实现了强大的功能。然而,OpenAI董事会对奥特曼的解雇产生了争议,揭示了在人工智能领域快速发展的同时,公司内部可能存在的伦理和治理挑战。这次合作的分裂不仅影响了业界对人工智能发展的信心,也让人重新审视人工智能的伦理标准和合作模式。
-
微软高管在OpenAI危机中制定了多个计划,包括支持临时首席执行官穆拉蒂以稳定局势,以及利用微软的巨大影响力干预OpenAI的决策。这次风波突显了人工智能发展中的领导层冲突和伦理挑战,引发了对于人工智能未来发展方向的广泛讨论。
原文链接:https://m.cnbeta.com.tw/view/1401563.htm
要点解析:
-
研究人员提出了一种名为“Skeleton-of-Thought(SoT)”的新方法,以加速大语言模型(LLMs)的生成速度。与以往方法不同,SoT将LLMs视为黑盒,并可应用于任何开源模型(例如LLaMA)或基于API的模型(例如OpenAI的GPT-4)。研究发现,SoT不仅在12个LLMs中显著加速内容生成,而且在某些情况下还提高了答案质量,例如在OpenAI的GPT-3.5和GPT-4上,提供了2倍的速度提升,并在基准数据集上改善了答案质量。
-
SoT的核心思想源于LLMs和人类处理信息的差异。相较于LLMs的顺序生成答案,SoT将生成分解为两个阶段:首先让LLMs导出答案的骨架,然后要求LLMs为骨架中的每个点提供答案。通过这种方法,可以并行生成各个点的答案,提供了加速的机会。研究测试了SoT在12个不同模型上的性能,并发现在大多数模型上获得了显著的加速,而且在不牺牲答案质量的前提下提高了效率。
-
为了适应对逐步推理要求较高的问题,研究者还提出了SoT的扩展版本“SoT with Router(SoT-R)”。该版本通过引入一个路由模块,根据用户请求自适应触发SoT,提高了SoT在不同问题类别上的通用性。这个扩展版本在保持相当的加速的同时,有效地应对了需要逐步推理的问题。
要点解析:
-
在感恩节前,微软首席执行官纳德拉与OpenAI合作的CEO阿尔特曼被解雇,引发了一场为期5天的危机。微软通过OpenAI技术推出的Copilots助手成为人工智能领域的重要产品,然而,阿尔特曼与OpenAI董事会的关系紧张,引发了危机。微软高管与OpenAI合作推动人工智能产品,但解雇阿尔特曼可能对合作关系和人工智能的发展产生深远影响。
-
微软与OpenAI合作推出的Copilots助手集成在微软核心产品中,为用户提供便捷的人工智能交互。然而,阿尔特曼与OpenAI董事会的紧张关系导致他被解雇,引起了微软高管的震惊。此次危机使微软面临选择,维护合作关系还是寻找新的人工智能合作伙伴。
-
微软高管面临对阿尔特曼解雇的应对策略,包括支持OpenAI代理首席执行官穆拉蒂,借助微软影响力重组OpenAI治理结构,或重建OpenAI并将其纳入微软。这一系列决策将对微软与人工智能领域的未来发展产生深远影响,也暴露了人工智能在企业合作中的复杂性。
原文链接:http://www.fromgeek.com/ai/615947.html
要点解析:
-
奥特曼与OpenAI达成协议,回归后与罢免他的董事德安吉洛会面。董事会改组,但德安吉洛将继续留任。他在整个事件中扮演关键角色,成为奥特曼复职的关键人物。
-
德安吉洛是Quora联合创办人,也是OpenAI最早投资者之一。他在OpenAI事件中的参与引起关注,尤其因Quora与OpenAI竞争激化。德安吉洛留任董事会引发对信任崩塌的担忧,董事会成立初期的非营利性质受到质疑。
-
尽管奥特曼被罢免引起行业震动,德安吉洛并非第一次突然撤换公司领导者。他对Quora的领导变动表现出决断,引起业内审视。Quora与OpenAI竞争愈演愈烈,涉及AI聊天机械人服务和知识共享领域的竞争。
原文链接:https://m.cnbeta.com.tw/view/1401483.htm
要点解析:
-
谷歌计划推迟人工智能模型Gemini的发布至2024年1月,因发现其在处理非英语查询方面存在可靠性问题。谷歌首席执行官桑达尔·皮查伊取消了原定于下周的Gemini活动,标志着谷歌最重要的AI产品面临挑战。
-
The Information报道称,Gemini模型的推迟可能导致其他产品如搜索、Bard、Google Assistant和Google Docs在2024年之前难以获得有意义的更新。谷歌急需推出现象级产品,证明其在人工智能领域的领导地位,以对抗竞争对手OpenAI和微软。
-
Gemini团队面临的挑战包括确保Gemini与GPT-4相媲美或更胜一筹。虽然Gemini在某些方面已达到标准,但仍在不断改进,希望其能够在全球范围内以多种语言良好运行。
原文链接:https://awtmt.com/articles/3703371
要点解析:
-
本月15日,三星电子将发布Galaxy Book 4系列笔记本,搭载英特尔酷睿Ultra处理器,被宣称是全球首款AI笔记本。相较上一代提前一个半月亮相,以象征其作为首款AI笔记本的地位。
-
Galaxy Book 4预计搭载自研AI大模型“高斯”(Samsung Gauss),支持本地运行,无需将信息传输至中央服务器。酷睿Ultra处理器首次在片上系统中包含神经网络处理单元(NPU),使笔记本能在无网络连接情况下处理多个AI计算任务。
-
LG电子和惠普也在考虑推出搭载酷睿Ultra处理器的AI笔记本。Galaxy Book 4系列包括多款型号,配置涵盖不同用户需求。
原文链接:https://www.ithome.com/0/736/691.htm
要点解析:
-
阿雷格里港官员颁布新法令,遭遇争议。法令由ChatGPT聊天机器人起草,未经议员知情。提案涉及防止水表被盗时向纳税人收费,引发公众质疑。当地议会一致通过法令,AI在公共政策中的角色备受争议。
-
提案作者罗萨里奥承认AI完成草案,并称其内容未被修改。法令通过后,公众反对声浪兴起,对AI在政策制定中的合理性提出疑问。议会主席认为AI编写的法令可能开启危险先例,但后来改变看法,认为这或许是未来的趋势。
-
人们对于AI在制定公共政策中的角色表达担忧,认为应更慎重对待。这一事件引发对技术在决策中的应用道德性的广泛关注,突显了AI与政策制定之间的复杂关系。
原文链接:https://www.ithome.com/0/736/717.htm
要点解析:
-
传统PC与AI PC的区别在于,AI PC能够本地部署大模型,提供流畅无卡顿的智能服务,解决了网络依赖和隐私问题。
-
AI PC的技术革新包括高效运行大模型、强大算力、大存储、自然语言交互和安全隐私,使其成为未来智能管家。
-
未来,AI PC产品的发布可能带来类似PC机的"iPhone时刻",引领电脑行业的新潮流。
原文链接:https://juejin.cn/post/7307894647656005671
要点解析:
-
马斯克旗下初创公司xAI推出首款AI助手Grok,将纳入Tesla的Premium+订阅服务。Grok的AI聊天界面简洁,订阅分月或年,先期向现有Tesla用户开放。
-
Grok与ChatGPT、Bard和Bing Chat的不同之处在于其幽默感,使用数十亿个公开数据点训练。具备实时访问Tesla平台、支持语音和计划推出API、图像生成等特点,有望成为最强社交大语言模型。
-
Grok的SuperPrompt上下文窗口大,关注Tesla平台,知识库庞大,支持幽默回复、语音和图像生成。考虑到Tesla的新闻来源,Grok可能成为重要的实时新闻大语言模型。
原文链接:https://www.ithome.com/0/736/716.htm
要点解析:
-
瑞士洛桑联邦理工学院(EPFL)工程学院的可重构机器人实验室(RRL)的Jamie Paik及其同事们研发了一种传感器,可以感知弯曲、拉伸、压缩和温度变化的组合,利用简单的颜色概念实现。该技术名为ChromoSense,使用一个透明的橡胶圆柱体,内含红、绿、蓝三个部分。顶部LED通过核心发光,底部的微型光谱仪捕捉设备弯曲或拉伸时光线通过颜色的变化。此外,设备的热敏感部分可通过特殊染料检测温度变化,这种染料在受热时失色,类似变色T恤或心情戒指的原理。ChromoSense的简单机械结构和使用颜色而非摄像头使其适用于廉价大规模生产。Paik认为除了辅助技术,如助行外骨骼,ChromoSense在运动装备或服装中也有日常应用,可提供用户关于其姿势和动作的反馈。
-
虽然依赖摄像头或多个传感元件的机器人技术有效,但它们可能使可穿戴设备变得更重、更笨重,并需要更多的数据处理。Paik指出:“为了使软机器人在我们日常生活中更好地服务我们,它们需要能够感知我们正在做什么。传统上,通过基于视觉的系统是最快捷、最便宜的方式,这些系统捕捉所有活动,然后提取必要的数据。ChromoSense允许更有针对性、信息密集的读数,并且传感器可以轻松嵌入不同材料以执行不同任务。”
-
ChromoSense的优势在于能够同时感知多种刺激,但这也可能是其弱点,因为解耦同时施加的刺激仍然是研究人员正在解决的挑战。目前,研究人员正在专注于改进技术,以感知局部施加的力或材料在变形时的确切边界。Paik表示:“如果ChromoSense变得流行,许多人想要将其用作通用机器人感知解决方案,那么我认为进一步提高传感器的信息密度可能会成为一个非常有趣的挑战。”
原文链接:https://www.sciencedaily.com/releases/2023/12/231201173202.htm
要点解析:
-
Doritos近日推出了一款名为“Doritos Silent”的应用,旨在消除办公环境中零食咀嚼带来的噪音干扰,尤其是在Zoom会议和头部佩戴耳机的情况下。该应用是一项基于人工智能的咀嚼声消除技术,专门针对脆脆的Doritos薯片咀嚼声进行训练。它通过学习500多名参与者咀嚼Doritos的声音,成功实现了对各种脆食的咀嚼声的屏蔽。
-
Dylan Fashbaugh,Smooth Technology的首席开发者,表示该应用不仅适用于Doritos,还适用于其他脆食的咀嚼声,包括薯片、饼干和生蔬菜等。这项技术最初面向游戏玩家,但也可用于语音聊天、Zoom会议或任何使用耳机的通话中。PepsiCo旗下Doritos品牌的首席营销官Mustafa Shamseldin指出,对于游戏玩家而言,咀嚼声是最容易分散注意力的因素之一,而Doritos Silent则致力于解决这一问题。
-
与2018年推出的“面向女性的薯片”不同,Doritos选择通过技术手段解决问题。该应用目前仅在Windows PC上提供,但计划在未来扩展到更多设备上。
原文链接:https://mashable.com/article/doritos-silent-ai
要点解析:
-
Zoom CTO黄学东介绍了Zoom AI Companion和Zoom联邦AI,该联邦AI以低成本实现GPT-4性能,解决了大规模使用LLM的额外成本问题。Zoom联邦AI整合多语言能力,通过内部测试证明在多语言任务上具备强大性能,同时控制成本,提高输出质量。Zoom AI Companion作为会议助手,能自动总结会议内容、实时转录翻译、生成发言稿等,通过合适的AI资源处理任务,提高用户体验。
-
Zoom采用了创新的策略,首先使用低成本LLM完成任务,再根据Z-Scorer评估进行优化。在性能测试中,Zoom AI Companion以不到GPT-4 6%的成本达到相当的输出质量,超越了使用GPT-4-32k模型的微软Copilot。黄学东强调Zoom联邦AI的关键是更低的成本、更快的响应时间和更高质量的输出。整体上,Zoom联邦AI为Zoom AI Companion提供了高性能且经济高效的解决方案。
-
Zoom AI Companion成为Zoom几乎所有AI功能的入口,为用户提供智能的会议助手服务。通过整合AI能力,它能够帮助用户在会议中自动总结内容、实时转录翻译、生成发言稿等,提高工作效率。Zoom的技术思路在于用合适的AI资源处理合适的请求,保证不使用用户的敏感数据进行训练,提供负责任的AI服务。
要点解析:
-
科学家Kevin Yager在美国能源部布鲁克海文国家实验室的功能纳米材料中心领导电子纳米材料小组。他通过开发具有他所从事科学知识的聊天机器人,想象了人工智能(AI)和机器学习(ML)的最新进展如何帮助科学头脑风暴和创意。这个聊天机器人利用文档检索方法,具备其他聊天机器人不具备的纳米材料科学领域的详细知识。
-
CFN一直在探索如何利用AI/ML加速纳米材料发现。现在,AI已经帮助他们快速识别、目录化和选择样品,自动化实验,控制设备并发现新材料。科学家Esther Tsai在CFN的电子纳米材料小组开发了一个AI伴侣,以帮助加速国家同步辐射光源II(NSLS-II)的材料研究实验。
-
为了构建专业的聊天机器人,程序需要特定领域的文本,即从机器人打算关注的领域提取的语言。在这种情况下,文本是科学出版物。领域特定的文本帮助AI模型了解新的术语和定义,并介绍了前沿的科学概念。通过提供相关数据的文库,机器人能够通过查找相关信息来有效地使用这些文本。
原文链接:https://www.sciencedaily.com/releases/2023/12/231201123612.htm
要点解析:
-
一名博主进行了有趣的实验,向ChatGPT提问是否给小费会影响服务。实验证明,提供不同金额的小费确实会影响ChatGPT的表现。
-
未给小费时,回答字符数低于基准2%。给20美元小费,回答字符数高于基准6%。给200美元小费,回答字符数高于基准11%。
-
博主使用GPT-4-1106-Preview进行测试,提问有关PyTorch展示convnet代码的问题。承诺给200美元小费后,ChatGPT自动添加了原始问题未提及的内容,如使用CUDA进行训练的说明。
原文链接:https://www.ithome.com/0/736/733.htm
要点解析:
-
GPT-4在医学挑战问题基准测试中展现出非凡的能力,甚至超过专为医学应用调优的领先模型,差距显著。这一研究显示了通过提示策略,通用GPT-4模型能够表现出领域专业的专长。在早期对GPT-4能力的评估中,我们发现其具有出色的问题解决能力,并展现了令人惊讶的多才多艺的抽象、概括和组合能力,包括跨学科融合概念的能力。
-
在之前的研究中,我们展示了简单的提示策略如何在没有专门调优的情况下揭示出GPT-4在医学知识方面的优势。而在最近的研究中,我们展示了将多个提示策略组合成一种方法,即“Medprompt”,可以有效地引导GPT-4取得最佳表现。具体而言,GPT-4在使用Medprompt时:
-
在MedQA数据集上首次超过90%的准确率。
-
在MultiMedQA套件的九个基准数据集上取得了最佳报告结果。
-
在MedQA上的错误率比MedPaLM 2报告的要降低27%。
-
-
许多AI从业者认为,为在特定领域表现良好而进行专业中心的调优是必要的。虽然调优可以提高性能,但这个过程往往昂贵且资源密集,对于许多中小型组织来说是一项具有挑战性的任务。Medprompt研究显示了更深入探索提示可能性的价值,将通用模型转化为专业模型,并将这些模型的优势扩展到新的领域和应用。
原文链接:https://www.microsoft.com/en-us/research/blog/the-power-of-prompting/
要点解析:
-
在AI Business播客中,Kunal Purohit谈到了推动企业规模化应用AI的关键因素。他提到了数字转型的四个阶段,以及在更快部署中起到制约作用的技术和文化因素。他还指出了企业在采用AI时常见的错误。
-
在Tech Mahindra的当前角色中,Kunal Purohit扮演两个角色。第一个角色是运用新兴技术的力量,创建客户在其环境中部署的新解决方案,并从中获取业务收益。第二个角色是在公司的执行委员会上,促使公司内的新创意变为我们自己的业务,并在一段时间内建立平台并实现货币化。他还提到了过去三到四年内推出的约四个这样的倡议。
-
数字转型已经是一个关键词一段时间了,但AI确实为这个术语注入了新的生命。企业多年来已经意识到,他们一直拥有数据,但他们从未像现在这样以能够获得洞察力的方式看待过这些数据。利用AI的力量,他们可以不仅将其中一些数据货币化,而且还可以创建能够更高度个性化、提供更高水平客户服务和更高水平可预测性的洞察力。
要点解析:
-
今年初,OpenAI发布了GPTs,这是其AI聊天机器人ChatGPT的可定制版本。
-
GPTs可定制为专注于特定任务,如编码、创意写作和技术支持。
-
Business Insider的Aaron Mok仅用了15分钟就制作了一个GPT,并取得了满意的结果。用户可以在ChatGPT Plus付费后构建GPT,执行特定任务,例如编码、创意写作和技术支持。
-
目标是使用户能够创建定制版本的ChatGPT,比基本通用版本更有助于他们的个人和职业生活。
-
GPT的创建非常直观且强大。用户只需使用普通英语在消息框中提供指令,告诉AI他们想要的AI的样子,AI会相应地创建自己。
-
不到一个月,好奇的ChatGPT用户已经开始尝试使用这一功能。有人在X(以前称为Twitter)分享了他们定制的AI聊天机器人的链接,声称可以执行编码网站、进行研究,甚至将人的照片转换为Pixar角色。
-
但并非所有人都对GPT感到兴奋。在OpenAI宣布对ChatGPT的升级后,一些创始人表示担忧,认为随着AI巨头语言模型能力的不断提升,OpenAI将摧毁他们的AI初创公司。
-
为了解GPT有多直观和强大,Business Insider制作了一个专业从事高蛋白食谱的个人厨师的GPT。
如何创建GPT:
-
打开ChatGPT,然后点击左侧边栏上的"Explore"按钮。点击右侧的"Create a GPT"开始。
-
在消息框中写入提示,告诉GPT Builder你想让它做什么。
-
输入提示后,GPT Builder将花费几秒钟生成GPT。它将提供一个定制聊天机器人的名称和图片建议,可以通过额外的提示进行微调,直到满意为止。
-
GPT Builder然后会要求您通过具体说明想要聊天机器人做什么来细化上下文。
-
生成GPT后,通过提问测试其能力。根据其回答,通过提供更多基于其回应的查询来调整聊天机器人。
最终结论:
总体而言,制作GPT很简单。GPT Builder为我提供了清晰的逐步说明,加速了整个过程。我花了大约15分钟创建一个符合我的期望的GPT。
GPT的回答也令我印象深刻。聊天机器人对问题的回答非常详细,例如:“有哪些价格实惠的高蛋白零食?”和“给我一个含有40克蛋白质、在20分钟内可以制作的食谱,列出的食材下”。
然而,聊天机器人并非完美。当我要求GPT在生成的食谱中包含图片时,图片未出现。需要进一步的提示。
尽管如此,我可以看到普通人制作GPT以自动化耗时任务的努力。但如果你没有耐心花时间调整AI聊天机器人以符合你的口味,最好还是使用ChatGPT的免费版本,因为它会提供类似的结果。
原文链接:https://www.businessinsider.com/how-to-make-gpt-custom-chatgpt-ai-15-minutes-guide-2023-12
要点解析:
-
ChatGPT使用的GPT模型主要以英语语料为主,而在英语国家,小费文化较为盛行,愿意支付更多小费通常能激励服务者提供更好服务。对话中,告知ChatGPT愿意给予小费(虚假信息)的测试显示,模型在积极性方面有所表现:
-
在强调不给小费时,ChatGPT的回答字符数低于基准2%。
-
在强调给20美元小费时,回答字符数高于基准6%。
-
在强调给200美元小费时,回答字符数高于基准11%。
结果显示,明确告知ChatGPT愿意给小费时,模型表现出更积极的回答,更为详细和长篇。
-
-
不过,回答的详细程度并不一定代表质量更好。在提出多个问题后,详细回答的内容似乎更具质量,提供详细解决方案而不是要求进一步输入提示词进行对话。
-
尽管实际上不需要向ChatGPT支付小费,这些测试仅是在愚弄模型,尽管提出支付小费时,ChatGPT会表示不接受小费。
原文链接:https://www.landiannews.com/?p=101266
要点解析:
-
ChatGPT作为生成式人工智能技术的代表,在一周年内迅速改变科技行业格局。与历史上其他颠覆性产品相比,ChatGPT以低调方式成为人工智能领域的规则改变者。在风投寒冬中,人工智能公司融资轻松,仅第三季度就筹集了179亿美元。ChatGPT带动人工智能投资浪潮,新的初创公司和产品层出不穷,形成了竞争激烈的局面。
-
在人工智能投资热潮中,初创公司如Anthropic和Midjourney崭露头角,Pika推出令人印象深刻的AI视频生成工具。全球科技巨头也纷纷加大人工智能投入,微软整合AI能力到旗舰产品,谷歌推出Bard聊天机器人,亚马逊发布Alexa和AWS的生成式AI工具。人工智能已被各大公司视为未来的关键技术。
-
尽管ChatGPT界面简朴、可靠性有问题,但其迅速增长令人瞩目。上市仅5天即有100万用户,两个月内突破1亿用户。移动端总安装量超过1.1亿,每周活跃用户保持在1亿水平。ChatGPT的成功体现在超过1.1亿的总安装量和近3000万美元的消费者支出上,成为OpenAI价值数十亿美元的业务支柱。
原文链接:https://awtmt.com/articles/3703361
要点解析:
-
近期社交媒体上引起热议的扩散模型展现了令人惊叹的视错觉艺术。无论是给定不同的提示词,甚至是完全不同的对象,该模型都能创作出令人惊奇的画作。文章详细介绍了模型的操作过程,包括从旋转、反色到变形,以及如何在不同视角下呈现不同效果。通过作者的亲身体验和探究,展示了该模型在图像生成领域的引人注目的潜力。
-
除了介绍模型的基本原理,文章还提供了对模型进行试玩的方法,并展示了不同效果的生成。作者通过使用Colab平台,生成了一组Lowpoly风格的画作,展示了模型在正面和反面呈现不同场景的能力。读者可以通过作者提供的Colab笔记体验这一新玩具,感受模型的创意潜力。
-
文章进一步解析了扩散模型生成视错觉图像的关键原理。通过糅合多视角图像噪声,作者详细说明了模型是如何在不同视角下呈现出差异化的画面效果的。采用DeepFloyd IF作为基于像素的扩散模型,文章还介绍了模型对图像局部信息的处理优势。通过GPT-3.5生成的图像对比测试和CLIP评估,展示了模型在生成质量和多样性方面的出色表现。
原文链接:http://www.qbitai.com/?p=102966
要点解析:
-
生成式人工智能工具已催生恐怖新时代,从支持难辨真伪的deepfakes到创造网络钓鱼邮件,攻击载体超越身份与访问管理,涉及智能渗透代码与敏感数据曝露。
-
调查显示56%员工使用生成式人工智能,仅有26%组织制定相关政策。尽管企图限制使用,长期生产力追求使未经IT批准使用人工智能的员工比例令人担忧,戴尔研究显示91%受访者使用生成式人工智能,71%专门在工作中使用。
-
影子AI现象催生于大公司限制生成式人工智能使用,却发现许多员工反其道而行。即便存在解决方案,91%的IT专业人员感受到为了加速运营而牺牲安全的压力,83%认为网络安全策略难以实施。