本系列文章主要是用于持续跟踪最新的AI产业情况,让你减少知识焦虑。
原文共计197174 字,简读后为10862字,阅读时间为27分钟,为您提高阅读效率为1826%
- 'IBM 2024年预测显示,AI是新一代网络攻击的基因 😱'
- '有了AI之后,成熟的手机应该学会自己工作了 🤖📱'
- '联想小新 Pro 16 2024笔记本支持爱奇艺AI补帧:画面帧数翻倍 🎞️'
- 'rabbit再获千万美元融资,将在AI时代取代APP交互 🐇💰'
- 'OpenAI宣布向所有用户免费开放ChatGPT语音功能 🗣️🌐'
- '三星与Naver联手开发高效人工智能芯片,能效超越Nvidia H100八倍 🧠💻'
- '技术创新:苹果在闪存上存储大型语言模型(LLM)引领未来AI发展 🍏💽'
- '“人形机器人第一股”招股步入尾声,优必选或成2023港股打新收官之作 🤖💼'
- 'Google的Gemini落后于GPT 3.5 Turbo ⏱️🚀'
- '23年生成式AI全球投资超360亿!开发者预测2024年LLM应用进入大爆发 💸🚀'
要点解析:
-
腾讯联手德州大学达拉斯分校发布名为《AppAgent: Multimodal Agents as Smartphone Users》的论文,介绍了一款名为AppAgent的多模态模型应用项目。该模型能学习用户手机操作习惯,执行社交媒体发帖、邮件撰写、修图、导航、评论视频等任务。操作分为探索阶段和部署阶段,前者观察用户界面交互,后者高效完成各应用程序任务,如在Gmail中自动发送邮件。
-
腾讯已测试AppAgent在Temu、Gmail、X、Youtube等十款APP上,确保能完成50多种不同任务。未来通过开放测试,AppAgent将学习更多APP操作方法,为不同人群提供便利。这一技术对于解决重复繁琐任务,如拼多多的“砍一刀”或上下班打卡,具有潜在应用价值。
-
虽然AppAgent带来便利,但也引发担忧。用户既对其高效提升工作效率充满兴趣,也担心可能被滥用于操纵社交媒体,同时关切个人数据安全。这一技术发展可能在提高生活便利性的同时,需要权衡潜在的滥用和隐私风险。
原文链接:https://www.pingwest.com/a/291256
要点解析:
-
华人创立的AI公司rabbit近两个月内获得第三笔千万美元融资,总额达3000万美元。公司基于大型行为模型(LAM)开发下一代操作系统rabbit OS,实现自然语言对话交互,替代触摸交互,提升人机交互效率和体验。
-
rabbit的LAM技术通过观察人类演示应用程序交互界面的过程进行学习,能灵活执行各种应用程序的操作。相比传统RPA,LAM能真正理解应用界面的变化,自主找到任务所需的操作步骤,实现稳定而高效的操作。
-
rabbit团队已发布技术预览版Quantum Engine,并获得技术专利。公司还开发硬件设备r1,将搭载rabbit OS,以提供更好的用户交互体验。r1将于2024年1月9日发布。
原文链接:http://www.geekpark.net/news/329446
要点解析:
-
Google AI Studio是一个令人振奋的新平台,使先进的AI模型对开发者轻松可及。只需一个Google账号,即可利用强大的语言和视觉AI构建创意原型和解决方案。以下是免费使用Google AI Studio的逐步指南。
-
要开始使用Google AI Studio非常简单,只需一个Google账号。导航到ai.google.com/studio并点击“开始使用”。如果需要,使用您的Google凭据登录。
-
目前,Google免费提供两个模型的访问权限:Gemini Pro - 一款对话语言模型,能够执行各种语言任务,如分类、摘要和语义搜索;Gemini Pro Vision - 一款图像字幕模型,能够智能描述照片和视频内容。这些免费层次有每分钟60个请求的使用限制,足够进行低频测试。
-
Google AI Studio界面简洁直观。侧边栏组织了可用的AI模型,主工作区是构建提示和查看输出的地方。选择Gemini Pro等模型时,将出现提示编辑器。在这里,您输入文本和示例以引导AI。在编辑器上方的按钮可让您执行提示并查看生成的输出。输出即时出现,无需部署模型或启动云计算资源,这一切都由Google AI Studio在幕后处理。
-
在Google AI Studio中取得良好结果的关键在于正确构建提示。与人类一样,给予AI模型清晰、详细的指令和示例,通常能获得更好的性能。有效的提示结构通常如下:
-
目标 - 明确陈述您希望AI执行的任务(例如“写一首关于季节的诗”)
-
语气和长度示例 - 展示期望的输出格式
-
相关背景 - 提供任何有助于通知AI的背景
-
-
使用这些提示工程技术,可以在Gemini Pro中获得更好的结果。
-
点击“询问Gemini Pro”以执行您的提示。输出将即时在下方面板中生成。如果未获得所需结果,调整提示中的示例和背景,然后再次运行。优化提示是与AI一同进行的过程的一部分。
-
在得到喜欢的输出后,选择文本并按Ctrl/Cmd + C复制到其他地方。或选择“获取代码”选项以传送到应用程序。
-
免费的Gemini Pro和Vision层次每分钟有60个请求的使用限制。当前使用情况和限制显示在平台侧边栏的顶部。保持提示简洁和以输出为重点,以保存字符。删除不准确的结果,而不是让它们消耗您的配额。
-
提示工程基础知识覆盖后,Google AI Studio为您免费提供了极其强大的AI。您可以查询广泛的知识、合成书面内容、描述图像等。
-
要扩展功能,可以采取一些步骤:
-
获取API密钥 - 通过为Gemini API创建密钥,通过代码访问AI
-
嵌入其他地方 - 安装代码小部件以将AI添加到Web应用程序
-
学习提示工程 - 磨练获得更好结果的技术
-
为生产进行升级 - 监控使用情况,并根据需要升级配额
-
-
Google AI Studio的无代码便利性使得利用AI变得简单。花时间专注于构建创新解决方案,而不是复杂的设置。构建战略提示,通过示例复制输出格式,提供背景,并通过点击执行请求。
-
准备好利用下一代AI了吗?立即注册Google AI Studio并开始免费创作。
原文链接:https://openaimaster.com/?p=29423
要点解析:
-
近日,东京大学科学家将ChatGPT嵌入机器人,使其具备"肉体",重新定义了人机协作。这一创新让机器人动作更人类化,简化了控制,提高了交互效率。同时,名为"Coscientist"的AI实验室成功利用GPT-4复现诺贝尔奖研究,展示了AI在化学实验领域的卓越能力。这突显了大型语言模型与机器人结合对科学发现的潜在影响。
-
苹果和谷歌合作发布《Find My Device Network》草案,旨在规范蓝牙追踪器使用。该举措有望打破iOS和安卓系统之间的追踪器壁垒,增强用户对潜在追踪的意识。与此同时,英国最高法院裁定,人工智能不能被列为专利申请中的“发明人”,强调专利申请中必须有“自然人”。
-
《Nature》杂志展望2024年科技大事,预测GPT-5和AlphaFold新一代将引领科学创新。百川智能创始人王小川强调实用大模型的重要性,强调使用模型比仅仅造模型更为关键。微软前CEO比尔・盖茨预言2024年将迎来人工智能创新的转折点,解决多领域重大问题。
原文链接:https://juejin.cn/post/7315205416756428812
要点解析:
-
Julius AI是一款创新的个人数据分析平台,旨在帮助个体轻松解释、分析和可视化结构化数据,无需具备数据科学背景。该强大而用户友好的工具旨在使复杂数据分析对所有人都可达到。
-
Julius AI连接多种数据源,包括Excel表格、Google Sheets、Postgres数据库和JSON格式数据,为用户提供了从各种来源获取数据的灵活性,实现了在一个平台上理解所有数据的目标。
-
除了回答特定问题外,Julius AI还能自动识别数据集中的有趣趋势和模式,并通过交互式可视化呈现给用户。这使得Julius AI不仅是一个按需回答数据问题的助手,也是一个始终关注数据集并提供洞察的数据分析师。
原文链接:https://openaimaster.com/?p=29405
要点解析:
-
今年夏天,硅谷掀起AI创业复兴,投资热潮涌入,众多公司获得数亿美元融资,市值直线上升。然而,竞争激烈,失败公司如Jasper仅在OpenAI基础上包装,缺乏差异化。在聊天机器人潮下,筹资较多的创业团队产品定位在应用层面,缺乏技术壁垒。
-
成功者分为两类:老牌科技公司灵活应对市场变化,和独立开发者迅速推出利基人工智能产品。大公司对AI应用生死攸关,而小公司体量小、运营开销低,致力于微型SaaS产品。AI登月公司重新定义行业,如以AI为先的代码编辑器和法律实践AI支持。
-
建议:风险投资公司面临困境,市场领导者善于利用内部团队和开源技术部署人工智能。独立开发者在利基市场交付产品建立小型业务,有前途的登月公司可能获得规模回报。
要点解析:
-
近期,麻省理工学院的研究人员利用深度学习方法在化学空间中发现了新型抗生素。该方法基于可解释的图神经网络平台,能够预测和发现具有高抗生素活性和低细胞毒性的化合物。通过对大量化合物进行测试,研究团队发现了一种新的结构类别,对革兰氏阳性病原体具有活性,具备潜在的药用价值。
-
该研究不仅提供了高效的深度学习模型,还强调了模型的可解释性,通过解释模型预测的化学子结构基本原理,为药物发现领域带来新的见解。这一方法为探索化学空间、发现新型抗生素以及设计其他药物类别提供了有力工具,具备广泛的应用前景。
-
在持续的抗生素耐药性危机下,这项研究为解决该问题提供了新的思路和方法,为药物研发领域注入了新的活力。通过深度学习模型的创新性应用,我们有望更加高效地应对未来可能出现的抗生素挑战,为人类健康保驾护航。
原文链接:https://www.jiqizhixin.com/articles/2023-12-22
要点解析:
-
11位非虚构类书籍作者在曼哈顿联邦法院起诉OpenAI和微软,指控其滥用他们的作品用于训练ChatGPT等AI软件大模型。作家包括普利策奖获得者凯・伯德、泰勒・布兰奇、史黛西・希夫,曾共同创作奥本海默传记。律师表示,被告在未经授权的情况下使用非虚构类图书,牟利数十亿美元,要求公平赔偿。
-
提起的集体诉讼指控OpenAI未经许可从互联网上“搜刮”作者作品及其他版权材料,用于教授GPT模型回应文本提示。微软深度参与模型培训和开发,应当承担版权侵权责任。尽管微软和OpenAI否认指控,作家要求公正的赔偿和对待。
-
此案引发了对AI训练中版权问题的关注,涉及作家们的创作权和公司对大模型训练数据的使用。法庭将裁定是否存在侵权行为,这也可能影响未来AI领域对版权的法律规范。
原文链接:https://www.ithome.com/0/740/951.htm
要点解析:
-
支付宝宣布与银行业生态合作,将在2024年深化创新合作,升级四大银行营销能力。其中,精准化营销能力将从基础版到专业版再到进阶版,助力实现银行精准营销。用户触达能力升级包括支付宝公域流量开放、收银台配额开放、API接口升级等,协助银行构建用户营销闭环。场景开放能力将实现更多场景可选可配,升级匹配人群提升转化率。生态联动能力升级通过开放品牌场景、营销能力、数智化能力,协同生态伙伴助推银行营销数智化。
-
支付宝副总裁唐方表示,过去三年与上千家银行深入合作,服务数亿消费者,取得多方共赢。面向2024年,支付宝将更加开放合作,与银行机构、服务商加深合作,通过新技术开放更多场景、能力和服务,进一步壮大合作生态。
-
2024年,支付宝将与银行业生态合作伙伴继续深化创新合作,升级四大银行营销能力,包括精准化营销、用户触达、场景开放和生态联动。支付宝将以更加开放合作的心态,通过新技术开放更多场景、能力和服务,以竞争力的合作策略壮大合作生态。
原文链接:https://www.ithome.com/0/740/986.htm
要点解析:
-
ChatGPT自诞生至2023年5月,访问量飙升,峰值每月达18亿次,但在6月略有下降,9月回升。2023年是人工智能盛夏,风险投资向生成式人工智能投资超过360亿美元。生成式AI领域迎来诸多新技术和工具,包括LLM框架、Jurassic-2、GPT-4等。同时,生成式AI也面临着虚假信息和应用问题,如Bard发布虚假信息,聊天机器人被用于论文写作等。2023年为生成式人工智能的尝试和发展之年。
-
2024展望包括OpenAI发布新产品,提供自建聊天机器人套件,驱动ChatGPT构建更广泛的应用。生成式人工智能将在医学、心理治疗、招聘等领域发挥更大作用,科技公司将植入人工智能于下一代硬件。未来,LLM驱动的功能将日益融入生活,框架和范式不断演进,2024年将迎来更多成熟的生成式人工智能应用,提升生产效率和用户体验。
-
生成式人工智能的商业发展前景广阔,但伴随而来的问题也不容忽视,如评估和监控LLM驱动应用性能,减少数据泄漏和保护敏感数据。2024年将成为生成式人工智能迎来实质性应用和变革的一年。
要点解析:
-
Character AI作为一款先进的AI聊天机器人,因其人类般的回应和引人入胜的对话而备受欢迎,成为许多用户的首选平台。然而,随着Character AI面临不断增长的需求,一些用户遇到了“rate exceeded(速率超限)”错误消息,导致无法访问。
-
“rate exceeded”错误实质上意味着用户在一定时间窗口内向Character AI发送了过多的请求。Character AI的服务器设置了速率限制来处理容量并防止过载。当达到这些速率限制时,平台会阻止进一步的请求,并显示“rate exceeded”消息。
-
造成超限的一些常见原因包括:发送大量消息/请求、过于频繁地进行API调用以及多用户共享同一Character AI账户。总体上,如果平台检测到使用水平对其能力构成压力,就会触发“rate exceeded”错误以维持稳定性和可用性。
原文链接:https://openaimaster.com/?p=29398
要点解析:
-
小红书和抖音在AIGC浪潮中展现出不同的智慧,小红书通过AI创作工具“此刻”和涂鸦功能成功降低创作门槛,走在降维创作的前沿。抖音则以AI扩图等功能引领新一轮创作潮流。这两大平台在AI创作上的策略巧妙而精准。
-
随着AI技术的成熟,绘画行业在2023年受到全面的冲击。活跃在AI绘画领域的创作者,如秋叶aaaki,面临来自技术对抗和舆论对抗的白热化阶段。AI技术带来的影响不仅提升了创作效果,也给行业带来了巨大的生存压力。
-
Agent领域成为AI创投最火热的赛道,被认为将颠覆软件行业。从创投行业的角度,初创公司可分为提供实用Agent框架的中间层infra和深入垂直领域的Vertical Agent。然而,Agent的落地依然面临诸多挑战,主要缺陷在于大模型缺乏应用领域的世界模型。
原文链接:https://juejin.cn/post/7315126195334578202
要点解析:
-
随着MEET 2024智能未来大会的进行,终端侧AI成为热门话题。在大会中,高通技术公司产品管理高级副总裁颜辰巍提出了三点原因:模型参数增大导致云计算成本上升,数据隐私需在本地处理,终端需支持生成式AI用例。终端AI的发展不仅在PC和手机领域有落地方案,而且多模态生成式AI被认为是未来的发展方向。
-
在演讲中,颜辰巍指出,只有当终端能运行基于AI大模型的用例时,端侧与云侧能良好结合,生成式AI才能大规模普及。此外,终端侧AI的趋势表现在模型参数增加、基础模型创新、用户增加等方面,对云计算提出挑战。颜辰巍详细介绍了高通公司推出的面向PC的骁龙X Elite平台和第三代骁龙8移动平台,强调其支持终端侧高性能生成式AI模型运行。
-
总体而言,颜辰巍强调了终端侧AI的重要性,以满足生成式AI规模化发展的需求。他介绍了高通的硬件和软件解决方案,着重强调终端侧AI的发展不仅依赖于文本输入,还需要支持多模态生成式AI,即视觉、文本和语音的结合,是未来的发展方向。
原文链接:http://www.qbitai.com/?p=108501
要点解析:
-
人工智能在软件开发领域展现出卓越能力,从自动生成代码到程序调试,再到与人类技能的融合。AI服务已经成为软件创造的关键力量,改变开发流程和效率。
-
目前,AI服务应用广泛,能够生成代码、优化程序性能、简化调试、支持持续集成和部署、自动化测试等。未来,随着AI成熟,由AI引导的软件开发将成为主流,人类将在需要时提供协助。
-
无代码平台与AI服务相结合,正在改变软件开发的核心。无代码开发模式下,AI在多个环节发挥关键作用,提高开发效率,降低技术人才需求,推动更多人参与市场,创造更高效的开发过程。
原文链接:https://juejin.cn/post/7315265525771714623
要点解析:
-
Midjourney V6发布,图像质量和语义理解大幅提升。提示词系统重做,用户需注意避免模糊描述,详细提示可获得更准确结果。V6在细节、光影、色彩等方面超越前代,被认为是里程碑级的升级。
-
对比V6和V5.2,V6在雨坑倒影、女性面部、复古科幻、食物等场景中呈现更自然、真实的效果。语义理解提升,例如,根据提示生成酒吧标志、珍珠项链、街头照片等,V6表现更符合用户期待。
-
V6在多次尝试中呈现出高质量的图像,用户可以通过合理运用提示词和参数来提高生成准确率。与DALL·E 3和Adobe Firefly相比,Midjourney V6在艺术性和创意触感上取得胜利,被认为是当前AI生图领域的佼佼者。
要点解析:
-
IBM预测,2024年攻击者将利用生成式AI强化攻击手段,将攻击技术提升至新的致命水平。攻击者将通过伪造和窃取特权访问凭证来威胁网络安全,引发欺骗和身份滥用的新时代。
-
安全失败的75%起因于特权访问凭证及其关联身份的不安全管理,与三年前的50%相比有显著增长。云威胁报告显示,分析了来自200多个组织的18,000个云账户的99%身份存在至少一个配置错误,揭示了身份访问管理保护的漏洞。
-
IBM对2024年的十大网络安全预测包括:欺骗成为主导、生成式AI促使网络犯罪“客户获取”、身份攻击升级、AI版本的莫里斯蠕虫引领新一轮网络攻击、勒索软件面临改观、生成式AI加强对关键数据的焦点、改变安全分析师角色、网络安全从威胁防御转向预测、安全身份危机迎来新的解决方法、随着量子技术进步,“先收割,后解密”攻击将更为普遍。
原文链接:https://venturebeat.com/security/ibms-2024-predictions-show-gen-ai-is-the-new-dna-of-cyberattacks/
要点解析:
-
苹果计划在iPhone、iPad和Mac等设备上引入闪存存储大型语言模型(LLM),提高人工智能在有限资源环境中的运行效率。这项突破性技术将赋予未来iPhone强大的Siri、实时语言翻译和融入摄影与增强现实的独特AI功能。
-
为解决传统大型语言模型对CPU和内存资源的需求,苹果采用了窗口化和行列捆绑等创新技术,通过闪存存储数据,大幅提高了AI模型的运行速度。这两项技术将使AI模型在iPhone可用RAM大小的两倍范围内运行,速度在标准处理器上最高可达5倍,在图形处理器上更是可达25倍。
-
苹果对AI的不断投入体现在多个方面,从Apple GPT聊天机器人到升级麦克风的iPhone 16系列,再到传言中iOS 18将引入生成式AI。这一系列举措预示着未来iPhone将具备更强大的AI功能,包括智能Siri、实时语言翻译和复杂AI驱动的摄影与增强现实功能。
原文链接:https://www.ofweek.com/ai/2023-12/ART-201700-8440-30620878.html
要点解析:
-
联想小新Pro 16 2024笔记本发布,搭载酷睿Ultra 5 125H处理器,首发5799元起。新款笔记本支持NPU AI补帧技术,可将爱奇艺60帧视频翻倍至120帧。AI补帧功能将通过爱奇艺软件升级更新支持。
-
今年6月,英特尔、联想和爱奇艺启动合作,旨在打造沉浸式流媒体新体验。联想基于英特尔Meteor Lake新平台的设备在超分和弹幕性能优化方面取得良好效果。10月,三方签署合作备忘录,将深度合作在利用AI技术实现MEMC、NPU上运行的手势控制以及功耗优化方面。
-
联想小新Pro 16 2024笔记本以创新的AI技术和合作成果为亮点,为用户提供卓越的流媒体体验,展现了科技与合作的巅峰成果。
原文链接:https://www.ithome.com/0/741/051.htm
要点解析:
-
Coats Digital推出基于Microsoft Azure AI的新AI助手,以提升客户服务和创新时尚供应链。开发仅用时六周,利用先进的自然语言查询功能,改善了对产品文档、培训材料等的访问。
-
AI助手的推出大大增强了客户体验,为全球客户提供了更流畅、用户友好和高效的体验。Coats Digital利用与Microsoft的合作,通过AI工具和Azure基础设施,将AI的好处直接带给全球各地的工人。
-
Coats Digital计划在业务各个领域扩展AI能力,以提高内部生产系统和销售渠道的体验。这标志着AI助手的积极响应激发了Coats Digital在数字转型方面的未来规划。
要点解析:
-
GPU在高性能计算和深度学习加速中扮演关键角色,其强大的并行计算能力显著提升了运算性能。随着数据量的增加,GPU通信性能成为关键指标。
-
在分布式机器学习中,通信是必要环节,决定加速比的上限。设计有效的通信机制降低通信与计算时间比例,提高模型训练效率至关重要。
-
通信硬件方面,PCIe、NVLink等技术为通信提供了不同解决方案,而RDMA则通过无需CPU介入的方式显著提高数据传输效率,InfiniBand作为高带宽低延迟技术在HPC和集群应用中广泛应用。
原文链接:https://juejin.cn/post/7314941294873362495
要点解析:
-
九年后,Sam Altman再度以箴言体博客《那些我希望有人告诉我的(事)》总结AI领域探索。他强调乐观、团队凝聚、大胆创新、沟通清晰等关键要素。
-
Altman分享OpenAI走过的困境,强调了强大团队的重要性,将焦点放在完成真正重要、具挑战性的任务上。他激励团队追求安全有益的AGI,同时注重沟通清晰、避免官僚主义。
-
复利效应、规模涌现、人才招聘等概念贯穿全文,Altman强调超级明星的价值,建议迭代快速、长期规划,还提到灵感易逝、时间有限等人生观。他以与优秀人共事为最美好经历。
原文链接:https://www.jiqizhixin.com/articles/2023-12-22-3
要点解析:
-
2023年回顾,AI领域迎来巨大变革,ChatGPT横空出世,大模型层出不穷,颠覆生活。Sam Altman分享17建议,强调乐观、团队凝聚、大胆想法,为2024展望。
-
Altman建议团队专注重要任务,激励机制需慎重,清晰沟通,反对废话。成果是最终衡量标准,招聘需冒险选择有实际成果的人才。快速迭代和与优秀人共事是成功关键。
-
避免挑战商业基本法则,行动胜过灵感。规模增长带来新特性,利用复合增长力量创造企业增长优势。跌倒时爬起,与优秀人共事是美好经历。2023年是AI受重视之年。
要点解析:
-
三星电子和Naver合作在大规模人工智能领域取得重大突破。他们联手开发的专门用于大规模AI模型的芯片解决方案将在能效上超越英伟达AI GPU八倍,为Naver的HyperCLOVA X提供强大动力。
-
最近,两家公司展示了首个基于FPGA的AI解决方案,该FPGA专为Naver HyperCLOVA X大型语言模型的推理量身定制。据Naver表示,由于采用LPDDR内存,这种AI解决方案的能效将是Nvidia的AI GPU的八倍,虽然对该设备的其他细节并未详细披露。
-
合作始于2022年底,结合了三星的先进制程技术、内存处理器、近内存处理、计算快速链路等高科技内存解决方案,以解决大规模人工智能系统中的内存瓶颈问题,满足市场对计算存储、PIM等领域不断增长需求的迫切需求。
原文链接:https://www.ofweek.com/ai/2023-12/ART-201700-8440-30620881.html
要点解析:
-
近750篇[基础模型推理]论文综述,聚焦各种推理任务,强调在现实场景中的核心作用,如谈判、医疗诊断、刑事调查等,以及在人工通用智能(AGI)领域的基本方法论。
-
十二家机构联合发表论文,介绍推理任务的基础模型设计,深入讨论多模态学习、自主代理等未来方向,促进研究者在这一领域的兴趣,为AGI的发展做出贡献。
-
论文全面概述推理任务的多样性,包括常识推理、数学推理、逻辑推理、因果推理、视觉推理等,揭示了基础模型在处理广泛认知能力上的挑战,反映了人类智力和推理的多面性。
要点解析:
-
本文介绍了谷歌最新推出的Gemini AI模型,将其集成到旗舰生成式AI聊天机器人Bard中,以期引导更多用户远离其最大竞争对手OpenAI的ChatGPT。
-
ChatGPT Plus和Gemini Pro都是基于大型语言模型的先进聊天机器人。它们是各自公司的最新产品,承诺在准确性、速度和整体帮助方面比其前身更出色。Gemini Pro与ChatGPT Plus中的GPT-4最为相似。然而,两者并不完全相等,Bard是免费的,而由Gemini Pro提供支持的ChatGPT Plus每月需支付20美元。此外,Bard由Gemini Pro提供支持,不具备ChatGPT Plus的多模态功能。
-
在测试中,发现Bard相对于ChatGPT的响应速度较慢,但测试结果也表明它们在回答查询方面存在差异。Gemini Pro模型尚未支持多模态提示,因此在绘制图像等任务上存在限制。
原文链接:https://www.theverge.com/24011112/google-bard-gemini-chatgpt-openai-compared
要点解析:
-
OpenAI宣布免费开放ChatGPT语音功能,用户可进行自然对话。功能在今年9月首次推出,此前仅对ChatGPT Plus和Enterprise用户开放。全面免费开放后,可能提高用户互动,为人工智能交互提供更自然、直观的方式。
-
ChatGPT是2022年11月30日推出的AI聊天机器人,能根据用户需求生成文章、故事、歌词、散文、笑话甚至代码,并回答各类问题。今年8月,ChatGPT默认升级到GPT-4版本,实现了语音和图像功能,使其具备更全面的“看、听、说”能力。
-
近期重大升级还包括浏览互联网功能,允许ChatGPT使用最新数据生成结果,不再局限于2021年9月之前的数据。这一功能尚处于ChatGPT Plus和企业版用户阶段,但计划很快向所有用户开放。
原文链接:http://www.fromgeek.com/ai/619571.html
要点解析:
-
谷歌最近推出了Gemini,这是其新的聊天机器人,挑战了ChatGPT。然而,初步的第三方基准测试显示,Gemini目前的能力在竞争对手AI系统面前表现不佳,尤其是OpenAI的GPT-3和GPT-4模型。
-
卡内基梅隆大学和BerriAI的研究人员测试了谷歌的Gemini Pro与OpenAI的GPT-3.5 Turbo和GPT-4 Turbo以及新的开源聊天机器人Mixtral的能力。在测试知识、推理、数学和其他学科的问题时,Gemini解决的问题总体较少,特别是与GPT-3.5相比。
-
尽管Gemini在单词重新排列和符号排序任务方面表现优秀,但在数学、编程和网页导航测试中,Gemini在广泛领域落后于GPT-3.5和GPT-4。Gemini在非英文文本生成方面表现优异,但在10种语言对之间经常阻止回应。谷歌对研究结果提出异议,称Gemini Pro在内部研究中超过了GPT-3.5,强调Gemini Ultra将于2024年发布,谷歌声称在早期内部基准测试中超过了GPT-4。
原文链接:https://openaimaster.com/?p=29391
要点解析:
-
优必选(09880.HK)作为国内称为“人形机器人”第一股的科技公司,即将结束港股IPO认购。本次低调的招股或与A股和港股的低迷市场以及投资者对新股“概念炒作”的谨慎态度有关。文章分析了优必选的核心业务和财务状况。
-
优必选主要从事智能服务机器人及相关解决方案的研发、设计、生产和销售。以人形机器人为特色,公司在中国智能服务机器人领域排名第三。收入主要来自企业级智能服务机器人,尤其是教育相关业务,而物流机器人业务在增速上表现显著。文章还解析了公司消费级智能机器人业务的发展趋势。
-
在业绩方面,优必选在2020年至2022年的年均复合增速约为16.71%,但最新一期营收出现下滑。公司面临盈利压力,主要受到费用支出的拖累,尤其是研发支出。尽管公司保持负现金流,但通过融资覆盖亏损,截至2023年6月,公司在手现金充裕。文章探讨了公司的盈利状况和财务战略。
原文链接:https://www.ofweek.com/ai/2023-12/ART-201700-8460-30620880.html
要点解析:
-
Mid Journey Version 6的最新版本在九个月的专注开发中展现了令人惊叹的魔力。从旧版本5.2到新版本6的演变,我们将比较两者处理提示的方式,并深入了解这一过渡带来的细微差别。新版的样式值增加了对生成图像更多控制的功能,我们将探讨不同样式设置对生成图像的影响,突显在不同样式值下保持一致性的潜力。
-
通过使用像“Instagram模特的肖像,老好莱坞风格”这样的提示,我们将更近距离地了解版本6在将各种概念转化为视觉作品方面的多才多艺。版本6在处理复杂细节方面表现出色,我们将跟随一个逐渐添加细节的实验,展示该模型编织复杂叙事的能力。这一部分揭示了细节及其对富化创作的艺术家的影响。
-
Version 6引入了提升分辨率的功能,为用户提供了在微妙和创意变化之间进行选择的机会。我们将探讨每个选择的影响,强调艺术表达和精炼的潜力。深入了解从原始图像到创造性提升的变化。
原文链接:https://openaimaster.com/?p=29399
要点解析:
-
Gemini模型经过半年训练,于12月6日发布,是一款多模态AI语言模型,支持文字、图片、音频、视频等多种输入。Gemini在数学、推理、代码及综合能力方面超越了GPT-4,其中Gemini Ultra在MMLU任务上得分首次突破90分大关,展现出强大的语言理解和推理能力。
-
Gemini Pro、Gemini Nano是Gemini的不同版本,适用于各种任务和终端设备。Gemini Pro已整合到Bard中,Gemini Ultra预计将在2024年初整合到Bard Advanced上,成为Google的ChatGPT premium。
-
Gemini还推出了AlphaCode 2,基于Gemini Pro微调,具有强大的编程能力,达到了在竞技编程中达到expert水平的地步。然而,AlphaCode 2目前仍不稳定,成本较高,需要进一步优化。
原文链接:https://juejin.cn/post/7314981860496113675
要点解析:
-
人工智能系统Coscientist成功学习诺贝尔奖获奖化学反应,并在几分钟内设计了成功的实验程序。该系统展示了利用AI增加科学发现速度和提高实验结果可复制性的潜力。
-
Coscientist的构建涉及大型语言模型,通过任务测试包括GPT-4在内的多个语言模型。它通过软件模块执行科学任务,包括搜索化合物信息、阅读技术手册、编写实验代码和分析数据。
-
最终,Coscientist通过AI编写的代码控制实验室机器人,成功执行了Suzuki和Sonogashira反应,展示了AI在加速科学发现方面的潜力。
原文链接:https://www.sciencedaily.com/releases/2023/12/231221012729.htm
要点解析:
-
企业级知识助手的开发涉及诸多考虑因素,本文介绍了基于大语言模型的可扩展架构。架构原则包括可扩展性、安全性、透明度、模块化和可重用性。早期决策着重于质量、基于服务的大语言模型以及模型无关性,为企业级知识助手设计奠定了坚实基础。
-
架构的核心是检索增强生成(RAG)架构,分为数据层、大语言模型层、报告层和应用层。数据层包括独特的向量存储用于处理企业特定的智能,而大语言模型层包含LLM API Gateway、LLM模型和嵌入模型。报告层提供对知识助手运营动态的全面视图,而应用层是用户与系统直接交互的地方。
-
数据层利用向量存储、数据湖和知识API,通过分块技术和元数据丰富提高检索性能。大语言模型层通过LLM API Gateway集成多个大语言模型服务,追踪与LLM使用相关的成本,并记录所有交互。报告层提供对成本、使用和数据分析的透明度。应用层包括前端、操作存储和后端,通过模块化设计支持用户界面、业务逻辑和数据持久化。
原文链接:https://mlops.community/?p=8244
要点解析:
-
人工智能(AI)与艺术的融合通过扩散模型在创意数字艺术方面揭示了新的可能性,与传统神经网络有着明显的区别。本文深入探讨了扩散模型的深层原理,阐明了其在通过先进AI技术重新定义艺术表达方面的独特机制。理解扩散模型的细微差别,洞察它们在数字艺术中的作用。
-
扩散模型彻底改变了生成式AI,呈现了一种独特的图像创作方法,与传统技术(如生成对抗网络)迥然不同。从随机噪声开始,这些模型逐渐优化它,类似于艺术家调整绘画,最终呈现出复杂而连贯的图像。这种渐进的细化过程反映了扩散的有条不紊性,每次迭代都微妙地改变噪声,使之更接近最终的艺术愿景。输出不仅仅是随机性的产物,而是艺术品的演化,其过程和完成品都独具特色。
-
编写扩散模型的代码需要对神经网络和诸如TensorFlow或PyTorch等机器学习框架有深刻的理解。生成的代码复杂而精细,需要在庞大的数据集上进行广泛训练,以实现在AI生成艺术中观察到的细微效果。
要点解析:
-
Mid Journey Version 6的最新版本在九个月的专注开发中展现了令人惊叹的魔力。从旧版本5.2到新版本6的演变,我们将比较两者处理提示的方式,并深入了解这一过渡带来的细微差别。新版的样式值增加了对生成图像更多控制的功能,我们将探讨不同样式设置对生成图像的影响,突显在不同样式值下保持一致性的潜力。
-
通过使用像“Instagram模特的肖像,老好莱坞风格”这样的提示,我们将更近距离地了解版本6在将各种概念转化为视觉作品方面的多才多艺。版本6在处理复杂细节方面表现出色,我们将跟随一个逐渐添加细节的实验,展示该模型编织复杂叙事的能力。这一部分揭示了细节及其对富化创作的艺术家的影响。
-
Version 6引入了提升分辨率的功能,为用户提供了在微妙和创意变化之间进行选择的机会。我们将探讨每个选择的影响,强调艺术表达和精炼的潜力。深入了解从原始图像到创造性提升的变化。
原文链接:https://openaimaster.com/?p=29399
要点解析:
-
ChatGPT自诞生至2023年5月,访问量飙升,峰值每月达18亿次,但在6月略有下降,9月回升。2023年是人工智能盛夏,风险投资向生成式人工智能投资超过360亿美元。生成式AI领域迎来诸多新技术和工具,包括LLM框架、Jurassic-2、GPT-4等。同时,生成式AI也面临着虚假信息和应用问题,如Bard发布虚假信息,聊天机器人被用于论文写作等。2023年为生成式人工智能的尝试和发展之年。
-
2024展望包括OpenAI发布新产品,提供自建聊天机器人套件,驱动ChatGPT构建更广泛的应用。生成式人工智能将在医学、心理治疗、招聘等领域发挥更大作用,科技公司将植入人工智能于下一代硬件。未来,LLM驱动的功能将日益融入生活,框架和范式不断演进,2024年将迎来更多成熟的生成式人工智能应用,提升生产效率和用户体验。
-
生成式人工智能的商业发展前景广阔,但伴随而来的问题也不容忽视,如评估和监控LLM驱动应用性能,减少数据泄漏和保护敏感数据。2024年将成为生成式人工智能迎来实质性应用和变革的一年。
要点解析:
-
Mid Journey Version 6的最新版本在九个月的专注开发中展现了令人惊叹的魔力。从旧版本5.2到新版本6的演变,我们将比较两者处理提示的方式,并深入了解这一过渡带来的细微差别。新版的样式值增加了对生成图像更多控制的功能,我们将探讨不同样式设置对生成图像的影响,突显在不同样式值下保持一致性的潜力。
-
通过使用像“Instagram模特的肖像,老好莱坞风格”这样的提示,我们将更近距离地了解版本6在将各种概念转化为视觉作品方面的多才多艺。版本6在处理复杂细节方面表现出色,我们将跟随一个逐渐添加细节的实验,展示该模型编织复杂叙事的能力。这一部分揭示了细节及其对富化创作的艺术家的影响。
-
Version 6引入了提升分辨率的功能,为用户提供了在微妙和创意变化之间进行选择的机会。我们将探讨每个选择的影响,强调艺术表达和精炼的潜力。深入了解从原始图像到创造性提升的变化。
原文链接:https://openaimaster.com/?p=29399
要点解析:
-
Midjourney v6是一次AI艺术的飞跃,具有3D模型生成、视频创作和超高分辨率图像等突破性功能。此次升级将推动创造力进入新的高度,让用户能够实现最狂野的想象。V6以外星智慧处理提示,让你释放无限创造力。准备好启航!
-
Midjourney v6的关键特性包括提升的图像分辨率、改进的自然语言处理、先进的图像放大、混合和夜间转换、3D模型生成、更准确的提示追随和更长的提示等。用户将能够生成更高分辨率、更具细节的图像,有更多控制变化的选项,并体验到更智能的语言处理。
-
除了图像和3D模型,Midjourney v6还支持从文本提示生成短视频。这为AI生成的动画、叙事等提供了新的可能性,开创了全新的艺术创作媒介。